Miks ma ei taha tarkvara dokumenteerida

Ekilex on kasvanud juba päris keerukaks. Samas dokumentatsioon puudub peaaegu täiesti. Miks?

Kõigepealt mõned näited küsimustest, millele vastuste otsimiseks on viimasel ajal dokumentatsioonist puudust tuntud.

 • Kas meil seosetüüp vt on olemas ja kui siis milliste olemite vahel?
 • Mida sisaldavad viite väljad name ja value?
 • Milliste võtmetega parameetreid esineb keelendi seostel?
 • Miks on mitteavalikud sõnakogud Ekilexis avalikult näha?
 • Mis vahet on märkusel ja kasutusnäitel või milleks nad mõeldud on?
 • Kas leidub kohta, kuhu kirjutada termini usaldusväärsus?

Nagu näha, on need enamasti üsna detailsed küsimused, ja pigem arendaja või halduri kui lõppkasutaja tasemel. Ekilexi arenduse senine poliitika on olnud, et parim arendajadokumentatsioon on hästikirjutatud kood, millest pädev lugeja saab kohe aru, mida üks või teine funktsioon teeb. Ka andmebaasi tabelite ja väljade nimed on valitud inimloetavust silmas pidades.

Ainsad selle taseme asjad, mille kohta praegu on juhendeid kirjutatud, on API ehk rakendusliides väliste programmide jaoks, kus väline programm peab teadma, mida küsida, ja sellised protsessid nagu sõnakogude import, mille käivitaja peab teadma vajalikke samme ja nende parameetreid.  Lisaks on avalikult kättesaadav arenduse saba ehk backlog Pivotal Trackeris.

Lõppkasutaja dokumentatsiooniga on algust tehtud, aga see on mu jaoks üldse omaette teema. Minu meelest ei tohiks tarkvara kasutamiseks juhendeid vaja minna. Esiteks tuleks kasutajaliidesed teha nii intuitiivseks, et kasutamisel küsimusi ei tekigi. Aga isegi kui tekib, on kasutajate harjumused viimasel ajal põhjalikult muutunud ja vastuseid otsitakse guugeldades, mitte juhendeid lugedes. Pealegi on konkreetselt sõnastikusüsteemi puhul kasutajatel puudu pigem leksikograafia või terminoloogia sisuteadmisi, et kuidas on üldse mõtet mingit nähtust esitada, mitte et millise nupuga seda selles konkreetses tootes teha saab.

Niisiis, arendajate ja haldurite küsimuste juurde tagasi tulles: miks ma ei soovi rohkem dokumentatsiooni kirjutada?

Küsimusi on võimatu ette näha

Vähemalt mina küll ei oleks enne ülalloetletud küsimuste laekumist osanud oletada, et just nendest tuleks dokumentatsioonis kirjutada. Isegi kui oleksin üritanud kirjutada absoluutselt kõigest, ei oleks nii spetsiifilised asjad pähe tulnud.

Eriti võimatu on ette näha küsimuste sõnastust

Tean küll, et näiteks ilmik ja selle kaal on selgitamist vajavad nähtused, kuna kumbagi ei ole varasemates sõnastikes ega terminibaasides niimoodi kasutatud. Ok, kirjutan juhendisse, et ilmik on seos sõna ja tähenduse vahel ja ilmiku kaal näitab selle seose tugevust. Inimene aga otsib termini usaldusväärsust, mitte ilmiku kaalu. See on sisuliselt täpselt sama asi, aga mul ei ole kuskilt võtta infot, et teda kunagi tulevikus just selles sõnastuses otsida võidaks. Ja loomulikult ei otsi keegi ilmikut, kuna keegi ei tea sellise asja olemasolustki.

Dokumentatsioon ei erine kuigivõrd oma algandmetest

Näiteks küsimus seoseliikide olemasolu ja kuuluvuse kohta. Nende liikide täielikud ja ajakohased loetelud on klassifikaatorifailides olemas. Nende kopeerimine dokumentatsioonifaili ei teeks neid kuidagi paremini leitavaks, küll aga tekiks uus praktiline probleem:

Dokumentatsioon vananeb vältimatult ja kiiresti

Eluline näide dokumentatsioonist, mis on küll olemas, aga pikalt ajakohastamata, on andmemudeli kirjeldus. Praegu seda selgitust kirjutades vaatasin ta üle ja tegin mõned parandused suuremate aegumiste järeleaitamiseks, aga enne seda oli ta üle kahe aasta muutmata. Nii andmemudel kui ka selle aluseks olevad sisulised seisukohad aga on samal ajal märkimisväärselt arenenud.

Miks teda siis uuendatud poldud? Sest pidevalt on kiire uue funktsionaalsuse saamise, järgmise versiooni avaldamise, vigade parandamise vms sisulise tööga. Arendusel on ees pikk järjekord selliseid soove ja ka endal kihk neid juba kiiremini täita. Asjad, millega ei ole päevapealt kiire, selle järjekorra etteotsa ei jõua. Dokumentatsiooni ajakohastamisega ei ole päevapealt kiire.

Olemasolevad vs puuduvad funktsioonid

Levinud viis küsimuste tekkimiseks on see, kui kasutaja otsib mingit funktsiooni või võimalust, ja ei leia. Väga sageli on siis vastus lihtsalt, et seda polegi (veel) tehtud. Nt ülalmainitud küsimus vt-viite olemasolust. Ei ole sellist. Miks, on eraldi küsimus, ja siin on rohkem variante: seda võib olla otsustatud mitte teha, see võib olla parajasti tegemisel või tulevikus tegemise järjekorras. 

Probleem puuduvate funktsioonidega on, et nende loetelu on lõputu. Mõned neist on teada, need on kirjas arenduse sabas, aga ülejäänusid ei olegi kuskilt võtta. Selle kasutaja küsimus ise võibki olla päris esimene info niisuguse funktsiooni vajalikkuse kohta.

Dokumenteerimise töömaht

Tänapäeva programmikeelte ekspressiivsuse juures on ammendav dokumentatsioon vähemalt sama mahukas kui programm ise. Kõike tuleks siis kirjutada kaks korda: masinale, et mida teha, ja inimlugejale, et mida teeb.

Arenduse aeg on nii kallis ja selleks vajalikud oskused nii spetsiifilised, et minu meelest pole arendajaid mõtet sellise topeltkirjutamise peale raisata. Parem kaks töötavat funktsiooni kui üks põhjalikult dokumenteeritud töötav funktsioon. 

Bugid, vead, ettenägematused, möödarääkimised

Seega võiks dokumenteerida keegi teine. Loogiline kandidaat on tooteomanik(ud), kes arendusele tellimusi vahendavad. Neil on sageli kõige parem ülevaade, mis on tehtud, mis tegemata, ja mis faasis igaüks viimastest on. Vähemalt nii me ise arvame.

Tegelikult pole üldse haruldased juhtumid, kus arendus saab tellimusest hoopis teistmoodi aru, kui tooteomanik mõtles. Näiteks järgmine päriselt juhtunud lugu.

Ekilexis saab andmete avalikkust määrata kolmel tasemel.

 • Mõned andmetüübid pole kunagi avalikud, nt logid või sisemärkused.
 • Koostaja saab ilmiku tasemel avalikkuse määrata kirjele või artiklile.
 • Sõnakogu omanik saab määrata ka sõnakogu kui teviku avalikkuse.

Kõik kolm on tellitud, neist kolmas umbes sarnases sõnastuses nagu siin loendis, ja ka Ekilexis realiseeritud juba mõnda ega tagasi. Ühel hetkel aga selgus ootamatult, et võõrastel on võimalik näha ka mitteavalikke sõnakogusid. Uurimisel selgus, et tõepoolest, tellitud ja realiseeritud on just see, et sõnakogule saab avalikkuse määrata. Mitte et see määrang mõjutaks sõnakogu kuva Ekilexis.

Kasutaja küsis seepeale, kust ta pidi teadma, et see tegemata on, kui dokumentatsiooni pole? Just, seda minagi, kust oleks dokumenteerija pidanud seda teadma? Põhjus oli ju möödarääkimine sellesama potentsiaalse dokumenteerija ja arenduse vahel. Tooteomaniku jaoks avalikkuse mõte selles ongi, et mitteavalikke ei näidata avalikult, aga arenduse jaoks, nagu tagantjärele selgus, on need kaks selgelt erinevat funktsiooni: avalikkuse määramine ja selle määrangu mõju sõnakogude kuvamisele. Peaaegu nagu kvantmehaanika: möödarääkimisest teadasaamine teeb selle möödarääkimise olematuks.

Ei oleks ju mõtet sellele kasutajaküsimusele vastata, et Ekilexis sõnakogu avalikkuse linnuke sõnakogu avalikkust ei mõjuta. Ammugi poleks mõistlik (ega minu meelest ka võimalik) niisugust asja kirja panna juhendisse. Mõistlik vastus on, et oi tõepoolest, aitäh märkamast, parandame ära.

Kokkuvõtteks

Kõigile võimalikele küsimustele vastava dokumentatsiooni koostamine ei ole töömahu mõttes realistlik, paljudel juhtudel isegi mitte võimalik, ja kui ikkagi üritada koostada, siis mina kahtleksin ka tulemuse kasutuskõlbulikkuses. Juhendeid ei loe keegi. Paremini saab vastuseid koodist, andmebaasist, kontrollpäringutest, arenduse järjekorrast, või siis inimestega rääkides.

Mis on Ekilex

Ekilex on Eesti Keele Instituudi uus sõnastiku- ja terminibaasisüsteem. Ta on mõeldud leksikograafidele ja terminoloogidele sõnastike ja terminibaaside koostamiseks (st mitte lõppkasutajatele näitamiseks, milleks on muud vahendid, vt allpool).

Sõnakogu koostamine

EKI majutatud Ekilexi saab iga soovija tasuta kasutada. Selleks tuleb luua konto, mille keegi halduritest käsitsi heaks kiidab, pärast mida on võimalik oma sõnakogu luua või mõne olemasolevaga liituda. Olemasoleva sõnakogu juurdepääsu andmise otsutab iga sõnakogu omanik eraldi, st Ekilexis koostamine ei muuda sõnakogusid kuidagi avalikumaks või avatumaks kui nad seni on olnud.

Samuti võib Ekilexi kui avatud lähtekoodiga tarkvara enda juurde installida, mis võib osutuda vajalikuks näiteks konfidentsiaalsusvajaduse tõttu.

Avaliku sõnakogu avalikke andmeid näevad kõik Ekilexi kasutajad, st ka teiste sõnastike koostajad. Nii on see tehtud dubleerimise ja vastuolude vähendamiseks – et koostaja näeks, kui sama sisu on teises sõnakogus juba olemas. Ekilexiga sobib kutsuda liituma ka mõnda konkreetset inimest (juhendaja, retsensent vms), kellele on sõnakogu vaja näidata.

Sõnakogu avalikustamine

Päris avalikkusele näitamiseks Ekilex kui koostamiskeskkond mõeldud ei ole. Praegu (2020 alguses) saab nii sõnastikke kui ka terminibaase avalikustada Sõnaveebis, kus andmed on organiseeritud sõnapõhiselt. Neile, kes saavad sõna- ja mõistepõhisuse erinevusest aru ja eelistavad viimast, tuleb kunagi 2020 jooksul ka mõistepõhine versioon samast.

Lisainfo allikad

Siin, oma blogis väljendan isiklikke subjektiivseid arvamusi, rõhuga põhjendustel, miks üks või teine lahendus on valitud. Üheski mõttes dokumentatsiooni staatusele need kirjutised ei pretendeeri.

Ametlikumaid infoallikaid:

 • Ekilex on avatud lähtekoodiga projekt ja kogu kood on Githubis nii uurimiseks kui soovi korral ka muudatusettepanekute tegemiseks.
 • Arendajatel ja halduritel on otsejuurdepääs andmebaasi, kust saab järele vaadata selle struktuuri ja teha kontrollpäringuid andmete kohta. Kui teistel tekib selliste päringute järele vajadus, siis keegi juurdepääsuga inimestest on alati rõõmsasti nõus neid päringuid tegema. (Kuidagi on niimoodi kujunenud, et päringute koostamine asjade teadasaamiseks on nagu väike magustoit muu töö vahepeal.)
 • Osa päringuid saab tehtud ka API kaudu, mis ise on suhteliselt kõlbulikult dokumenteeritud.
 • Andmemudeli kirjeldus väga üldisel tasemel on nii siinsamas kui ka Githubi wikis.
 • Olemas on paigaldusjuhend on olemas ja seda ajakohastatakse koos iga uue versiooni tarnega.
 • Eraldi juhendid on ka sõnakogu impordi ja veel paari tehnilisema toimingu kohta.

Nagu näha, on olemasolev dokumentatsioon mõeldud pigem arendajale või haldurile kui lõppkasutajale. Lõppkasutaja dokumentatsioon on üldse eraldi teema. Selle kohta arvan, et süsteem peaks olema nii intuitiivselt kasutatav, et selle kohta küsimusi ei tekigi. 

Pigem näitavad senikogunenud küsimused, et koostajad vajavad juhendamist sisuliste protsesside teemal – kuidas üldse on mõtet sõnastikku või terminibaasi koostada, sõltumata kasutatavast tööriistast. Kui mul on mõne korduma kippuva küsimuse teemal olemas nii läbimõeldud arvamus, et see tahab mu seest välja tulla, siis siin on see koht, kuhu ta tuleb.

Võtame oma keele tagasi

Arvi Tavast teaduskeele sümpoosionil 23.11.2018

Kas teadus- ja muu erialasuhtlus peaks käima eesti või inglise keeles? Käisin teaduskeele sümpoosionil rääkimas, et minu arvates sõltub see suhtlejate võimetest ja suhtluse eesmärgist. Kumbagi ei saa muuta manitsemise abil.

Küll aga saab eesti teaduskeelt arendada, et ta suudaks täita rohkem eesmärke, ja sellesse saab panustada igaüks. Näitasin põgusalt Ekilexi ja kutsusin kuulajaid sinna terminibaase koostama, et oma keel muretsejate ja manitsejate käest tagasi võtta. Eesti keel on kuul, muretsemine ei ole.

Video on EMÜ lehel, minu osa 14:52-19:20. Salvestuse tehnilise probleemi tõttu on keskelt jupp puudu, aga tundub et midagi väga olulist seal polnud. Kuna videos slaide ei paista, siis need on siin.

Kuidas sõnastikusüsteem saab keelekorraldusele kaasa aidata

ÕS 2018 tutvustusega koos toimunud konverentsil rääkisin, kuidas sõnastikusüsteem saab keelekorraldust toetada.

Seni on iga sõnakogu koostatud eraldi, saades tulemuseks omavahel sidumata ja kohati vasturääkivat infot pakkuvad teosed. EKI uue sõnastikusüsteemi Ekilex arendusega tahame seda muuta. Eraldi sõnakogude asemel on andmebaasis info liigid, näiteks seletava sõnastiku asemel sõnade seletused või eesti-vene sõnastiku asemel eesti sõnade vene vasted. Ka ÕSi tulevik on pakkuda sõnade kohta keelekorralduslikku infot, ilma sealjuures teisi sõnastikke dubleerimata.

Salvestuse tootjal oli heliga probleeme ja heli on ka minu osas vahepeal päris pikalt puudu. Selles osas räägingi, kuidas eraldiseisvatest sõnakogudest (igaühel oma andmemudel, märksõnastik, tähendusjaotused jne) saavad infoliigid keskses ja ühtlustatud struktuuriga andmebaasis. Lugeja jaoks peaks see väljenduma selgemas ja kooskõlalisemas infos sõnade kohta.

Ettekande algusosa organisatsioonitüüpide kohta olen kirjutanud eraldi.

Ekilexi andmemudel

EKI soov Ekilexi arendamisel on teha senistest põhimõtteliselt parem sõnastiku- ja terminibaasisüsteem, mitte jäljendada olemasolevaid ega lisada neile inkrementaalseid täiendusi. See on andnud võimaluse mõelda väljaspool kasti juba alates andmemudelist. Kirjeldan selle mõtlemise praegust seisu, mis jõuab arenduse käigus kindlasti veel muutuda.

Üldised põhimõtted

Ekilex on minu teada maailmas esimene katse teha ühine andmemudel sõnastikele ja terminibaasidele. Baasis pole ei terminoloogide jaoks harjumuspärane onomasioloogia (1:n mõiste ja termini vahel) ega leksikograafide semasioloogia (m:1), vaid mõlemat kattev n:m. Ühel mõistel võib olla mitu terminit JA ühel keelendil võib olla mitu tähendust.

Keelendid (sõnad, terminid) ja tähendused (mõisted) on kõigile sõnakogudele ühised. Nende vahel n:m seose tekitamiseks vajalik vahetabel on sõnakogu-spetsiifiline. Kirje selles vahetabelis on nimetatud ilmikuks ehk lekseemiks ja defineeritud kui “see sõna selles tähenduses selles sõnakogus”. Seega saab konkreetse sõnakogu koostaja panna oma ilmikusse kirja, mida just tema soovib öelda selle sõna ja selle tähenduse seose kohta.

Võimalikud ja algusjärgus lausa sagedased on duplikaatkirjed sõnakogude vahel, nt otsing “termin” annab praegu identsed või lähedased mõisted Estermist, akadeemilise väljendusoskuse terminibaasist ja filosoofia terminibaasist. Kas need tegelikult on identsed või lähedased, on vastavate terminibaaside omanike öelda. Neil on võimalik neid kirjeid ühendada ja neid julgustatakse seda tegema, mh esitades neile duplikaadikandidaatide loendeid. Aga see ei ole kohustuslik, nt legitiimsete sisuerinevuste või koolkondlike eriarvamuste puhul.

Ekilexi lõppeesmärk on “üks sõnastik”, kust kasutaja saab otsida infot sõnade (st mitte sõnastike ega terminibaaside) kohta. Kasutaja ei pea otsingut sisestades teadma, millis(t)es sõnakogu(de)s teda huvitav kirje leidub, aga koos vastusega saab ta need kogud teada küll.

Eraldiseisvad sõnakogud jäävad vähemalt esialgu alles, igaühel oma koostaja. Kas ja kui siis kuidas nad kunagi ühinema hakkavad, on veel lahendamata.

Ekilexi lihtsustatud andmemudel

Olemid

Vorm

Sisaldab keelendi kõiki vorme, ka algvormi (algvorme). Vormile saab märkida, et ta on algvorm. Kui vormil on hääldus ja/või mõni hääldusmärkidega esituskuju, siis ka need on siin. Vormid on ühised kõigile sõnakogudele. Miks: sest sõna morfoloogia ei sõltu sõnakogust. Võimalikud ideoloogilised või ajaloolised erinevused lahendatakse läbirääkimistega koostajate vahel. Kui sõnakogudel on legitiimseid erivajadusi (nt vormide esitus õppesõnastikus vs terminibaasis), siis esitatavate vormide valiku ja esitusviisi saab kirjeldada vaates.

Paradigma

Ühendab vorme, mis kuuluvad samasse paradigmasse. Kasulik juhul, kui keelendil on mitu võimalikku paradigmat. Paradigmad on ühised kõigile sõnakogudele.

Keelend

See, mida traditsiooniliselt peetakse keelendiks, sõnaks, terminiks, märksõnaks, väljendiks vms, ehk asi, mis teoreetiliselt võiks sattuda sõnastiku märksõnaks või terminibaasi terminiks.

Keelendil endal mingit keelelist esitust ei ole, vaid ta saab nad vormidest: keelendit esitab selline vorm (või sellised vormid), mis on vormitabelis märgitud algvormiks.

Keelendil võib olla üks kuni mitu paradigmat, igaühel üks kuni mitu vormi. Muutumatutel sõnadel, fraasidel, võõrkeelsetel väljenditel jms on lihtsalt üks paradigma ühe vormiga.

Homonüümid on eraldi keelendid, ehk palk:palgi ja palk:palga on kaks eri keelendit, kummalgi oma paradigma(d). Ka sõitmise tee ja joomise tee on kaks eri keelendit, neil aga on kokkulangevad paradigmad ja vormid. Miks: sest paradigmade kordumist baasis on lihtsam taluda kui morfoloogiliste ja muude homonüümide erinevat esitust. Samuti leidub paradigmade vahel ka morfoloogilise homonüümi eristusest väiksemaid erinevusi, nt vesi ainena ei loendu, veekoguna loendub, mida saab soovi korral esitada kahe eri paradigmana.

Keelendid on ühised kõigile sõnakogudele. Miks: sest sõnad on keeles samad ja nende olemus ei sõltu sellest, millistesse sõnakogudesse neid on otsustatud lisada.

Probleem: kuni tähendusi pole vähemalt homonüümitasemel eri sõnastike vahel ühendatud, pole pääsu keelendite sisulisest kordumisest. Kui näiteks ühes sõnastikus on sõnal kaks ja teises kolm homonüümi, siis kokku on baasis viis homonüümi, millest tõenäoliselt kaks on liigsed. Kas ka tegelikult on liigsed ja võiks ära ühendada, vajab koostajate teadlikku otsust.

Ilmik

Seos keelendi ja tähenduse vahel ehk “see sõna selles tähenduses selles sõnakogus”. Mudeli keskne olem, mille küljes on enamus sõnakogu infost.

Ühel keelendil võib olla üks kuni mitu ilmikut, ja sõnastiku puhul vastab ilmiku ja tähenduse kombinatsioon märksõna ühele tähendusele. Ka ühel tähendusel võib olla üks kuni mitu ilmikut, ja terminibaasi puhul vastab ilmiku ja keelendi kombinatsioon mõiste ühele terminile.

Ilmik on esimene sõnakoguspetsiifiline olem. Keelendid on sõnakogudele ühised, ja keelendi lisamiseks sõnakogusse seotakse tema sobiva(te) tähendus(t)e ilmik(ud) vastava sõnakoguga.

Ilmikul saab olla kaal, mis näitab seose tugevust selle sõna ja selle tähenduse vahel. Saab kasutada osasünonüümia, osalise vaste või termini usaldusväärsuse esitamiseks.

Ilmikud saavad olla esmased (“mustad”, tavalised) või teisesed (“rohelised”, analüüsi ajal kasutatud tahvlivildika värvi järgi). Roheline ilmik võiks olla defineeritud kui “see sõna esineb KA selles tähenduses” ja tema erinevus tavalisest on, et teda näidatakse ainult tähenduse poolt vaadatuna, st ta ei tekita sõna poolt vaadatuna uut tähendust juurde.

Tähendus

Seob omavahel samatähenduslikke asju: ilmikuid (koos keelenditega) ja seletusi, ja võib kuuluda nulli kuni mitmesse valdkonda. Tähendus ise mingit sisulist infot ei sisalda.

Täissünonüümid ja täpsed vasted (ehk ühe mõiste terminid samas või eri keeltes) on oma ilmikute kaudu seotud sama tähendusega. Ehk täpne samatähenduslikkus on väljendatud kuuluvusena sama tähenduse juurde.

Kuni tähendused on sõnastike vahel ühendamata, esineb baasis eri sõnakogudesse kuuluvaid tähendusi, mis võivad olla sisuliselt ekvivalentsed või peaaegu ekvivalentsed. Pärast ühendamist on ühendatud tähendus seotud mitme sõnakoguga.

Seletus

Tähendusel võib olla null kuni mitu seletust eri keeltes. Seletuse keel ei ole vältimatult seotud keelendi keelega, võimaldades eesti-vene sõnastikku eesti seletustega, eesti-vene sõnastikku vene seletustega vms.

Vabavorm

Struktuur igasuguse seni nimetamata tekstilise info esitamiseks keelendi, ilmiku, tähenduse või seletuse kohta: näited (vajadusel koos tõlgete ja seletustega), märkused, grammatiline kasutusinfo jms. Vabavormi rea kohta on teada, mis sorti vabavorm ta on, ja mis keeles. Vabavormid saavad olla omavahel hierarhilistes seostes, nt kasutusnäitel on tõlge ja seletus.

Seos

Esitab muid seoseid kahe ilmiku vahel peale samatähenduslikkuse (samatähenduslikud ilmikud on niikuinii seotud tähenduse kaudu).

Seosel on suund. Ühesuunaline seos (nt A on B hüponüüm) on esitatud ühe seosega. Sümmeetriline seos (nt A on B antonüüm) on esitatud kahe vastassuunalise, aga muidu ühetüübilise seosega, mille terviklus on tagatud programmaatiliselt. Komplementaarsed seosed (nt A on B hüponüüm ja B on A hüperonüüm) on esitatud kahe vastassuunalise ja eritüübilise seosega. Kaks vastassuunalist seost võivad esineda ka mõne arvväärtuse poolest (nt A esilduvus B suhtes on 0,7 ja B esilduvus A suhtes on 0,6).

Seos on sõnakoguspetsiifiline, st koostajal on võimalik valida, kas seda seost oma sõnakogus esitada või mitte. Ka sisuliselt sümmeetrilisest seosest võib esitada ainult poolt, nt näidata kollokatsiooni oma sõnastikus ainult ühes suunas.

Kuigi täpne samatähenduslikkus käib tähenduse kaudu, saab seoseid (lisaks) kasutada osalise samatähenduslikkuse esitamiseks. Nt distributiivset sarnasust või rööpkorpuse joondamise tulemust saab esitada sünonüümia- või vasteseose kaaluna. Sama tähenduse piires saab vaste-eelistuse seosega näidata tõenäolisemaid tõlkevasteid, nt kuigi okulist, oftalmoloog, oculist ja ophtalmolog on kõik samatähenduslikud, tunduvad paarid okulist-oculist ja oftalmoloog-opthalmolog lugejale ootuspärasemad.

Sõnakogu

Sõnastik või terminibaas. Esitab muuhulgas, milliseid keeli, haldusolekuid ja valdkonnaklassifikaatori väärtusi saab selles sõnakogus kasutada.

Valdkond

Ekilexi valdkonnaklassifikaator saab sisaldada mitut klassifikaatorikomplekti (nt Lenoch, Eurovoc või mõni isetehtud komplekt). Sõnakogu jaoks saab valida klassifikaatoriread või terve valmis klassifikaatorikomplekti, mis on selles sõnakogus kasutusel. Klassifikaatoriread saavad olla omavahel hierarhilises seoses. Klassifikaatorireal saab olla mitu silti, nt lühendid, täiskujud, eri keeled vms. Ühe tähendusega võib olla seotud mitu klassifikaatoririda ühest või mitmest klassifikaatorikomplektist.

Edasise töö suunad

Ekilexi arendus on üsna algusjärgus. Esimesed päris kasutajad kolivad oma koostamisega siia tõenäoliselt alles 2019. aastal. Seetõttu on väga tõenäoline, et kirjeldatud mudel jõuab veel muutuda, isegi olulistes küsimustes.

Arvi Tavast