Eesti Wordnet
Eesti Wordneti päring
Eesti Wordneti päringut saab esitada TEKSauruse või WordTies vahendusel.
Mis on wordnet?
Wordneti tüüpi tesauruse põhiühik on sünonüümihulk (ka sünohulk). See koosneb kõigist ühte ja sama mõistet väljendavatest sõnadest (või sõnaühenditest). Kõik sünohulga liikmed on ühest sõnaliigist. Kõige lihtsamal juhtumil sisaldab sünohulk ainult ühe sõna, siis ei ole sõnal ühtegi sünonüümi (antud mõistet saab väljendada ainult ühe sõnaga).
Sünohulgad on on ühendatud viidetega, mis vastavad mõistetevahelistele semantilistele või leksikaalsetele suhetele. Kõige olulisemad suhted on hüponüümia ja hüperonüümia, kuid sageli on märgitud ka meronüümia, holonüümia, antonüüma, põhjus- ja rollishuted, tuletussuhted.
Mis on Eesti Wordnet?
Eesti Wordnet (EstWN) on üles ehitatud tuginedes wordneti teooriale, kus me oleme kasutanud Princetoni WordNeti ja EuroWordNeti põhimõtteid.
EstWN-i versioon nr 70 sisaldab u 67 600 mõistet (üle 92 000 sõna) ja üle 210 000 semantilise suhte. Töö Eesti Wordneti kallal veel käib, seega on see pidevalt täienev ressurss.
Eesti Wordnetis leidub nimisõnu, verbe, adjektiive ja adverbe, ka mitmesõnalisi ühendeid. Kõik mõisted on ühendatud keeltevahelise indeksi (ILI) abil Princetoni (ingliskeelse) wordnetiga.
Sõnatähenduste ühestamise katsed on näidanud, et eesti keele põhisõnavara on Eesti Wordnetis kaetud.
Allalaadimine
Semantilised suhted
Suhte märgend EstWN-s | Eestikeelne vaste | Näide |
---|---|---|
antonym |
vastand on | 'lubama' vastand on 'keelama' |
be_in_state |
on seisundis | 'värv, värvus' on seisundis 'värviline' |
belongs_to_class |
kuulub klassi (kasutatakse pärisnime ühendamiseks mõistega) | 'Aleksander' kuulub klassi 'mees' |
causes |
põhjustab | lubama põhjustab loa |
fuzzynym |
on hägusalt seotud | kord, puhk on hägusalt seotud momendiga |
has_holo_location |
on osa kohast | ülikool on osa ülikoolilinnast |
has_holo_madeof |
on osa materjalist | puit on osa puust |
has_holo_member |
on liige | liige on kollektiivi liige |
has_holo_part |
on osa | koht on osa ruumist |
has_holo_portion |
on annus | mõte on annus mõttetegevusest |
has_holonym |
on osa | ühik on osa hulgast |
has_hyperonym |
on teatud viisil [v]; on teatud liiki [n] | lubama on teatud viisil soostuma; volitus on teatud liiki luba |
has_hyponym |
üks viis on [v]; üks liik on [n] | soostuma üks viis on lubama; loa üks liik on volitus |
has_instance |
esindaja on | mehe esindaja on Aleksander |
has_mero_location |
üks osa (kohast) on | ülikoolilinna üks osa on ülikool |
has_mero_madeof |
üks osa (materjalist) on | puu üks osa on puit |
has_mero_member |
liige on | kollektiivi liige on liige |
has_mero_part |
osa on | ruumi osa on koht |
has_mero_portion |
üks annus on | mõttetegevuse üks annus on mõte |
has_meronym |
osa on | hulga osa on ühik |
has_subevent |
osasündmus on | otsustama osasündmus on arvama |
has_xpos_hyperonym |
on teatud viisil [v]; on teatud liiki [n] (kasutatakse erinevate sõnaliikide puhul) | taotlema on teatud viisil suhtlus |
has_xpos_hyponym |
üks viis on [v]; üks liik on [n] (kasutatakse erinevate sõnaliikide puhul) | suhtluse üks viis on mõjutama |
involved |
kaasneb | püsima kaasneb seisund; teavet andma kaasneb informatsioon |
involved_agent |
kaasneb tegija | kõnelema kaasneb tegija kõneleja |
involved_instrument |
kaasneb vahend | käskima kaasneb vahend mõjujõud |
involved_location |
kaasneb koht | asuma kaasneb koht koht, paik |
involved_patient |
kaasneb tegevusobjekt | rääkima kaasneb tegevusobjekt kuulaja |
involved_target_direction |
kaasneb tegevuse sihtkoht | minema kaasneb tegevuse sihtkoht koht |
is_caused_by |
on põhjustatud | luba on põhjustatud lubama |
is_subevent_of |
on osasündmus | arvama on osasüdnmus otsustama |
near_antonym |
peaaegu vastand on | saabuma peaaegu vastand on minema |
near_synonym |
peaaegu samatähenduslik on | katma peaaegu samatähenduslik on varjama |
role |
mängib rolli | teadmine mängib rolli teadma |
role_agent |
mängib tegijana rolli | kõneleja mängib tegijana rolli kõnelema |
role_instrument |
mängib vahendina rolli | meelitus mängib vahendina rolli ahvatlema |
role_location |
mängib kohana rolli | koht, paik mängib rolli asuma |
role_patient |
mängib tegevusobjektina rolli | arv mängib tegevusobjektina rolli korrutama |
role_target_direction |
mängib tegevuse sihtkohana rolli | koht mängib tegevuse sihtkohana rolli minema |
state_of |
on seisundiks | värviline on seisundiks värv, värvus |
xpos_fuzzynym |
on hägusalt seotud (erinevad sõnaliigid) | õis on hägusalt seotud õitsema |
xpos_near_antonym |
peaaegu vastand on (erinevad sõnaliigid) | küsimus peaaegu vastand on vastama |
xpos_near_synonym |
peaaegu samatähenduslik on (erinevad sõnaliigid) | liikuma peaaegu samatähenduslik on kulgemine |
Leksikaalsed allikad
- Eesti Kirjakeele Seletussõnaraamat
- Asta Õim. Sünonüümisõnastik Oma kulu ja kirjadega. Tallinn, 1991
- Asta Õim. Antonüümisõnastik Keele ja Kirjanduse Instituut. Tallinn, 1995
- Dictionaries via Keeleveeb: www.keeleveeb.ee
- On-line dictionary at www.vallaste.ee
- Lembit Abo Elektroonika ja infotehnika leksikon
- Valimik sõjandustermineid. Koostanud Heino Ernits; toimetajad Arvo Sirel ja Enn Veskimägi ; etümoloogia toimetaja Marje Jõeste. Tallinn : Eesti Entsüklopeediakirjastus, Tartu : Greif. 1998
- Tehnikaleksikon : A - Y. Vene keelest tõlkinud Lembit Abo jt., Tallinn: Valgus, 1981
- Louis P. Pojman. Eetika : õiget ja väära avastamas. Tõlkinud Tiiu Hallap. Tartu Ülikooli eetikakeskus, Tallinn : Pakett, 2005
- Simon Blackburn. Oxfordi filosoofialeksikon. Tõlkinud Märt Väljataga ja Bruno Mölder. Tallinn : Vagabund, Tallinn : Pakett. 2002
- Heldur Tamm. Mootori algõpe. Tallinn : Ilo, c2002, Tallinn : Ilo Print. 2008
- Tõnu Lehtla. Elektriajamid. Tallinna Tehnikaülikool, elektriajamite ja jõuelektroonika instituut, Tallinn : Tallinna Tehnikaülikooli Kirjastus, Tallinn : Infotrükk. 2007
- Inglise-eesti tehnikasõnaraamat. Peatoimetaja: Rein Kull. Tallinn: Euroülikool, Tallinn: Pakett. 2000
- Elektroenergeetikasõnastik : eesti-inglise-soome-saksa-vene. Tallinna Tehnikaülikooli elektroenergeetika instituut. Koostanud Mati Meldorf jt. Tallinn: Tallinna Tehnikaülikooli Kirjastus, Tallinn: Pakett. 2005
- Jaak Riis. Mesinduse oskussõnastik. Toim. Heljo Kaal. Tallinn: Eesti Mesinike Liit. 2007
- Virve Kulbin, Varje Vahenõmm, Nikolai Raudsepp. Mesinduse õpik. Tallinn: Valgus. 1989
- Gea Troska, Ants Viires, Ellen Karu, Lauri Vahtre, Igor Tõnurist. Eesti rahvakultuuri leksikon. 2. Koost. ja toim. Ants Viires. Tallinn: Eesti Entsüklopeediakirjastus. 2000
- Viivi Maanso; Inge Unt. Valik ülddidaktika termineid inglis-, saksa-, soome- ja venekeelsete vastetega. TPÜ kirjastus, Tallinn. 2003
- Inglise-eesti-inglise kokandussõnastik, Marju Taukar. Menu. 2011
- Suur kokaraamat. Koostanud Jill Norman, tõlkinud Marju Taukar. Varrak. 2011
Seis
Sünohulgad ja leksikaalsed üksused
sõnaliik | Sünohulkade arv |
---|---|
adjektiive (a) | 3076 |
adverbe (b) | 2244 |
nimisõnu (n) | 54449 |
tegusõnu (v) | 5748 |
kokku | 65517 |
sõnaliik | Literalide arv |
---|---|
ajektiive (a) | 8173 |
adverbe (b) | 4790 |
nimisõnu (n) | 83487 |
tegusõnu (v) | 11093 |
kokku | 107543 |
Semantilised suhted
Suhe | Arv |
---|---|
antonym | 2340 |
be_in_state | 1305 |
causes | 1702 |
derivation | 14 |
fuzzynym | 18306 |
has_derived | 961 |
has_holo_location | 490 |
has_holo_madeof | 1194 |
has_holo_member | 499 |
has_holonym | 2144 |
has_holo_part | 2723 |
has_holo_portion | 44 |
has_hyperonym | 56424 |
has_hyponym | 56424 |
has_mero_location | 490 |
has_mero_madeof | 1194 |
has_mero_member | 499 |
has_meronym | 2144 |
has_mero_part | 2723 |
has_mero_portion | 44 |
has_subevent | 85 |
has_xpos_hyperonym | 4908 |
has_xpos_hyponym | 4908 |
involved | 2589 |
involved_agent | 4262 |
involved_direction | 3 |
involved_instrument | 511 |
involved_location | 574 |
involved_manner | 40 |
involved_patient | 193 |
involved_source_direction | 12 |
involved_target_direction | 34 |
is_caused_by | 1702 |
is_derived_from | 961 |
is_subevent_of | 85 |
near_antonym | 4538 |
near_synonym | 13030 |
role | 2589 |
role_agent | 4262 |
role_direction | 3 |
role_instrument | 511 |
role_location | 574 |
role_manner | 40 |
role_patient | 193 |
role_source_direction | 12 |
role_target_direction | 34 |
state_of | 1305 |
xpos_fuzzynym | 2016 |
xpos_near_antonym | 42 |
xpos_near_synonym | 1388 |
kokku | 203068 |
ILI suhe | arv |
---|---|
eq_be_in_state | 870 |
eq_causes | 311 |
eq_generalization | 13 |
eq_has_holonym | 1903 |
eq_has_hyperonym | 30099 |
eq_has_hyponym | 706 |
eq_has_meronym | 1278 |
eq_has_subevent | 3 |
eq_involved | 1160 |
eq_is_caused_by | 346 |
eq_is_state_of | 569 |
eq_is_subevent_of | 18 |
eq_metonym | 3 |
eq_near_synonym | 9112 |
eq_role | 3487 |
eq_synonym | 20237 |
kokku | 70115 |
Publikatsioonid
- Muischnek, Kadri; Fišel, Mark; Kaalep, Heiki-Jaan; Koit, Mare; Müürisep, Kaili; Orav, Heili; Vare, Kadri; Õim, Haldur (2012). Arvutilingvistika ja keeletehnoloogia Tartu Ülikoolis. Erelt, Mati; Mäearu, Sirje (Toim.). Emakeele Seltsi Aastaraamat (66 - 102). Tallinn: TA Kirjastus
- Kahusk, Neeme; Orav, Heili; Vare, Kadri (2012). Cross-linking Experience of Estonian WordNet. In: Human Language Technologies – The Baltic Perspective: The Fifth International Conference on Human Language Technologies – The Baltic perspective. Tartu, Estonia, October 4-5, 2012. (Toim.) Arvi, Tavast; Kadri Muischnek; Mare, Koit. IOS Press, 2012, 96 - 102.
- Pedersen, Bolette Sandford; Borin, Lars; Forsberg, Markus; Linden, Krister; Orav, Heili; Rögnvaldsson, Eirikur (2012). Linking and Validating Nordic and Baltic Wordnets - A Multilingual Action in META-NORD. In: Proceedings of 6th International Global Wordnet Conference: 6th International Global Wordnet Conference, Matsue, Japan. (Toim.) Christiane Fellbaum, Piek Vossen., 2012, 254 - 259.
- Orav, H.; Kerner, K.; Parm, S. (2011). Eesti Wordneti hetkeseisust. Keel ja Kirjandus, 2, 96 - 106.
- Neeme Kahusk, Kadri Vider TEKsaurus - The Estonian WordNet Online. The Second Baltic Conference on Human Language Technologies, April 4-5, 2005. Proceedings, lk. 273-278.
- Vider, K., Kerner, K. Word Sense Disambiguation Corpus of Estonian. The Second Baltic Conference on Human Language Technologies, April 4-5, 2005. Proceedings, lk. 143-148
- Vider, K., Orav, H. Estonian wordnet and Lexicography. Symposium on Lexicography XI. Proceedings of the Eleventh International Symposium on Lexicography. May 2-4, 2002 at the University of Copenhagen. Ed. by H. Gottlieb, J. E. Mogensen and A. Zettersten. Sarjas: Lexicographica, Series Maior 115. Max Niemeyer Verlag, Tübingen 2005, lk. 549-555
- Kadri Muischnek, Heili Orav, Heiki-Jaan Kaalep, Haldur Õim. Eesti keele tehnoloogilised ressursid ja vahendid. Arvutikorpused, arvutisõnastikud, keeletehnoloogiline tarkvara. Eesti Keele Sihtasutus, Tallinn 2003
- Vider, K., Orav, H. Idee ja rakenduse vahe tesauruse näitel Eesti Keele Instituudi toimetised 14. Toimiv keel I. Töid rakenduslingvistika alalt. Eesti Keele Sihtasutus Tallinn 2003 lk. 313 - 322
- Vider, K., Orav, H. Concerning the difference between a conception and its application in the case of the Estonian wordnet Proceedings of the second international wordnet conference. Eds. P.Sojka, K. Pala, P. Smrz, Ch. Fellbaum, P. Vossen. Masaryk University, Brno, 2003, lk. 285-290
- Kahusk, Neeme A Lexicographer's Tool for Word Sense Tagging According to WordNet Proceedings of Workshop on Wordnet Structures and Standardisation, and how these Affect Wordnet Applications and Evaluation; Third International Conference on Language Resources and Evaluation (LREC 2002). Toim. D. N. Christodoulakis, C. Kunze, L. Lemnitzer. ELRA, Las Palmas de Gran Canaria 2002 lk. 1-7
- Orav, H Adjectives in wordnet-type thesaurus: Estonian experience Kogumikus Proceedings of the 1st International Global WordNet Conference , Central Institute of Indian Languages , Mysore, India, 2002, lk. 22-25
- Vider, Kadri Notes about labelling semantic relations in Estonian WordNet Proceedings of Workshop on Wordnet Structures and Standardisation, and how these Affect Wordnet Applications and Evaluation; Third International Conference on Language Resources; Third International Conference on Language Resources and Evaluation (LREC 2002). Toim. D. N. Christodoulakis, C. Kunze, L. Lemnitzer. ELRA, Las Palmas de Gran Canaria 2002 lk. 56-59
- Orav, H, Vider, K. Kas tesaurus ja tekstid lähevad kasutuses kokku? Kogumikus Tähendusepüüdja Catcher of the Meaning”, TÜ üldkeeleteaduse õppetooli toimetised 3, Tartu 2002, lk. 297-303
- Vider, Kadri Eesti keele tesaurus - teooria ja tegelikkus Leksikograafiaseminar "Sõna tänapäeva maailmas" Leksikografinen seminaari "Sanat nykymaailmassa". Ettekannete kogumik. Toim. M. Langemets. Eesti Keele Instituudi toimetised 9. Tallinn 2001 lk 134-156
- Orav, H Adjektiivid kui semantiline probleem: wordnet-tüüpi tesauruste koostamise kogemused Kogumikus Arvutuslingvistikalt inimesele Tartu 2000 lk 153-166
- Kadri Vider, Neeme Kahusk, Heili Orav, Haldur Õim, Leho Paldre Eesti keele tesaurus Kogumikus Arvutuslingvistikalt inimesele Tartu 2000 lk 127-152
- Orav, H., Vider, K. Estonian WordNet. Kogumikus Congressus Nonus Internationalis Fenno-Ugristarum. 7.-13.8.2000 Tartu. Pars V. Dissertationes sectionum: Linguistica II. lk. 490-497
- Vider, K., Orav, H. Sõna tasandilt mõiste ruumi Keel ja Kirjandus 1 1998 lk. 57-64
Veebiviited
Tegijad
- Heili Orav - projektijuht
- Kadri Vare
- Sirli Parm
- Lauri Eesmaa
- Piia Taremaa
- Maria Reile
- Katrin Alekand
- Ingmar Jaska
- Helen Türk
- Eleri Aedma
- Ahti Lohk
Endised töötajad: Liisi Pool, Riin Kirt, Andrus Karjus, Marju Taukar, Kaisa Hunt, Nele Salveste, Olga-Anniki Villem, Maarja-Liisa Pilvik
Rahaline toetus
Projekti on toetatud rahliselt:
- 1997 - 2003 Eesti keel ja rahvuslik mälu
- 2006-2014 Riiklikud programmid "Eesti keele keeletehnoloogiline tugi" ja "Eesti keeletehnoloogia"
Kontakt
- Arvutilingvistika uurimisrühm Liivi 2- 308, Tartu , Eesti
- Sisulised küsimused ja kommentaarid: See e-posti aadress on spämmirobotite eest kaitstud. Selle nägemiseks peab su veebilehitsejas olema JavaSkript sisse lülitatud.
- Tehnilised küsimused ja kommentaarid: See e-posti aadress on spämmirobotite eest kaitstud. Selle nägemiseks peab su veebilehitsejas olema JavaSkript sisse lülitatud.