Eesti Wordnet

 

Eesti Wordneti päring

Eesti Wordneti päringut saab esitada TEKSauruse või WordTies vahendusel.

Mis on wordnet?

Wordneti tüüpi tesauruse põhiühik on sünonüümihulk (ka sünohulk). See koosneb kõigist ühte ja sama mõistet väljendavatest sõnadest (või sõnaühenditest). Kõik sünohulga liikmed on ühest sõnaliigist. Kõige lihtsamal juhtumil sisaldab sünohulk ainult ühe sõna, siis ei ole sõnal ühtegi sünonüümi (antud mõistet saab väljendada ainult ühe sõnaga).

Sünohulgad on on ühendatud viidetega, mis vastavad mõistetevahelistele semantilistele või leksikaalsetele suhetele. Kõige olulisemad suhted on hüponüümia ja hüperonüümia, kuid sageli on märgitud ka meronüümia, holonüümia, antonüüma, põhjus- ja rollishuted, tuletussuhted.

Mis on Eesti Wordnet?

Eesti Wordnet (EstWN) on üles ehitatud tuginedes wordneti teooriale, kus me oleme kasutanud Princetoni WordNeti ja EuroWordNeti põhimõtteid.

EstWN-i versioon nr 70 sisaldab u 67 600 mõistet (üle 92 000 sõna) ja üle 210 000 semantilise suhte. Töö Eesti Wordneti kallal veel käib, seega on see pidevalt täienev ressurss.

Eesti Wordnetis leidub nimisõnu, verbe, adjektiive ja adverbe, ka mitmesõnalisi ühendeid. Kõik mõisted on ühendatud keeltevahelise indeksi (ILI) abil Princetoni (ingliskeelse) wordnetiga.

Sõnatähenduste ühestamise katsed on näidanud, et eesti keele põhisõnavara on Eesti Wordnetis kaetud.

Allalaadimine

Semantilised suhted

Suhte märgend EstWN-sEestikeelne vasteNäide
antonym vastand on 'lubama' vastand on 'keelama'
be_in_state on seisundis 'värv, värvus' on seisundis 'värviline'
belongs_to_class kuulub klassi (kasutatakse pärisnime ühendamiseks mõistega) 'Aleksander' kuulub klassi 'mees'
causes põhjustab lubama põhjustab loa
fuzzynym on hägusalt seotud kord, puhk on hägusalt seotud momendiga
has_holo_location on osa kohast ülikool on osa ülikoolilinnast
has_holo_madeof on osa materjalist puit on osa puust
has_holo_member on liige liige on kollektiivi liige
has_holo_part on osa koht on osa ruumist
has_holo_portion on annus mõte on annus mõttetegevusest
has_holonym on osa ühik on osa hulgast
has_hyperonym on teatud viisil [v]; on teatud liiki [n] lubama on teatud viisil soostuma; volitus on teatud liiki luba
has_hyponym üks viis on [v]; üks liik on [n] soostuma üks viis on lubama; loa üks liik on volitus
has_instance esindaja on mehe esindaja on Aleksander
has_mero_location üks osa (kohast) on ülikoolilinna üks osa on ülikool
has_mero_madeof üks osa (materjalist) on puu üks osa on puit
has_mero_member liige on kollektiivi liige on liige
has_mero_part osa on ruumi osa on koht
has_mero_portion üks annus on mõttetegevuse üks annus on mõte
has_meronym osa on hulga osa on ühik
has_subevent osasündmus on otsustama osasündmus on arvama
has_xpos_hyperonym on teatud viisil [v]; on teatud liiki [n] (kasutatakse erinevate sõnaliikide puhul) taotlema on teatud viisil suhtlus
has_xpos_hyponym üks viis on [v]; üks liik on [n] (kasutatakse erinevate sõnaliikide puhul) suhtluse üks viis on mõjutama
involved kaasneb püsima kaasneb seisund; teavet andma kaasneb informatsioon
involved_agent kaasneb tegija kõnelema kaasneb tegija kõneleja
involved_instrument kaasneb vahend käskima kaasneb vahend mõjujõud
involved_location kaasneb koht asuma kaasneb koht koht, paik
involved_patient kaasneb tegevusobjekt rääkima kaasneb tegevusobjekt kuulaja
involved_target_direction kaasneb tegevuse sihtkoht minema kaasneb tegevuse sihtkoht koht
is_caused_by on põhjustatud luba on põhjustatud lubama
is_subevent_of on osasündmus arvama on osasüdnmus otsustama
near_antonym peaaegu vastand on saabuma peaaegu vastand on minema
near_synonym peaaegu samatähenduslik on katma peaaegu samatähenduslik on varjama
role mängib rolli teadmine mängib rolli teadma
role_agent mängib tegijana rolli kõneleja mängib tegijana rolli kõnelema
role_instrument mängib vahendina rolli meelitus mängib vahendina rolli ahvatlema
role_location mängib kohana rolli koht, paik mängib rolli asuma
role_patient mängib tegevusobjektina rolli arv mängib tegevusobjektina rolli korrutama
role_target_direction mängib tegevuse sihtkohana rolli koht mängib tegevuse sihtkohana rolli minema
state_of on seisundiks värviline on seisundiks värv, värvus
xpos_fuzzynym on hägusalt seotud (erinevad sõnaliigid) õis on hägusalt seotud õitsema
xpos_near_antonym peaaegu vastand on (erinevad sõnaliigid) küsimus peaaegu vastand on vastama
xpos_near_synonym peaaegu samatähenduslik on (erinevad sõnaliigid) liikuma peaaegu samatähenduslik on kulgemine

Leksikaalsed allikad

  • Eesti Kirjakeele Seletussõnaraamat

http://www.eki.ee/dict/ekss/

  • Asta Õim. Sünonüümisõnastik Oma kulu ja kirjadega. Tallinn, 1991
  • Asta Õim. Antonüümisõnastik Keele ja Kirjanduse Instituut. Tallinn, 1995
  • Dictionaries via Keeleveeb: www.keeleveeb.ee
  • On-line dictionary at www.vallaste.ee
  • Lembit Abo Elektroonika ja infotehnika leksikon
  • Valimik sõjandustermineid. Koostanud Heino Ernits; toimetajad Arvo Sirel ja Enn Veskimägi ; etümoloogia toimetaja Marje Jõeste. Tallinn : Eesti Entsüklopeediakirjastus, Tartu : Greif. 1998
  • Tehnikaleksikon : A - Y. Vene keelest tõlkinud Lembit Abo jt., Tallinn: Valgus, 1981
  • Louis P. Pojman. Eetika : õiget ja väära avastamas. Tõlkinud Tiiu Hallap. Tartu Ülikooli eetikakeskus, Tallinn : Pakett, 2005
  • Simon Blackburn. Oxfordi filosoofialeksikon. Tõlkinud Märt Väljataga ja Bruno Mölder. Tallinn : Vagabund, Tallinn : Pakett. 2002
  • Heldur Tamm. Mootori algõpe. Tallinn : Ilo, c2002, Tallinn : Ilo Print. 2008
  • Tõnu Lehtla. Elektriajamid. Tallinna Tehnikaülikool, elektriajamite ja jõuelektroonika instituut, Tallinn : Tallinna Tehnikaülikooli Kirjastus, Tallinn : Infotrükk. 2007
  • Inglise-eesti tehnikasõnaraamat. Peatoimetaja: Rein Kull. Tallinn: Euroülikool, Tallinn: Pakett. 2000
  • Elektroenergeetikasõnastik : eesti-inglise-soome-saksa-vene. Tallinna Tehnikaülikooli elektroenergeetika instituut. Koostanud Mati Meldorf jt. Tallinn: Tallinna Tehnikaülikooli Kirjastus, Tallinn: Pakett. 2005
  • Jaak Riis. Mesinduse oskussõnastik. Toim. Heljo Kaal. Tallinn: Eesti Mesinike Liit. 2007
  • Virve Kulbin, Varje Vahenõmm, Nikolai Raudsepp. Mesinduse õpik. Tallinn: Valgus. 1989
  • Gea Troska, Ants Viires, Ellen Karu, Lauri Vahtre, Igor Tõnurist. Eesti rahvakultuuri leksikon. 2. Koost. ja toim. Ants Viires. Tallinn: Eesti Entsüklopeediakirjastus. 2000
  • Viivi Maanso; Inge Unt. Valik ülddidaktika termineid inglis-, saksa-, soome- ja venekeelsete vastetega. TPÜ kirjastus, Tallinn. 2003
  • Inglise-eesti-inglise kokandussõnastik, Marju Taukar. Menu. 2011
  • Suur kokaraamat. Koostanud Jill Norman, tõlkinud Marju Taukar. Varrak. 2011

Seis

 

Sünohulgad ja leksikaalsed üksused

Sünohulkade arv sõnaliigi kohta (versioon kb69a)
sõnaliikSünohulkade arv
adjektiive (a) 3076
adverbe (b) 2244
nimisõnu (n) 54449
tegusõnu (v) 5748
kokku 65517
Leksikaalsete üksuste arv sõnaliigi kohta (versioon kb69a)
sõnaliikLiteralide arv
ajektiive (a) 8173
adverbe (b) 4790
nimisõnu (n) 83487
tegusõnu (v) 11093
kokku 107543

Semantilised suhted

Semantiliste suhete arv (versioon kb69a)
SuheArv
antonym 2340
be_in_state 1305
causes 1702
derivation 14
fuzzynym 18306
has_derived 961
has_holo_location 490
has_holo_madeof 1194
has_holo_member 499
has_holonym 2144
has_holo_part 2723
has_holo_portion 44
has_hyperonym 56424
has_hyponym 56424
has_mero_location 490
has_mero_madeof 1194
has_mero_member 499
has_meronym 2144
has_mero_part 2723
has_mero_portion 44
has_subevent 85
has_xpos_hyperonym 4908
has_xpos_hyponym 4908
involved 2589
involved_agent 4262
involved_direction 3
involved_instrument 511
involved_location 574
involved_manner 40
involved_patient 193
involved_source_direction 12
involved_target_direction 34
is_caused_by 1702
is_derived_from 961
is_subevent_of 85
near_antonym 4538
near_synonym 13030
role 2589
role_agent 4262
role_direction 3
role_instrument 511
role_location 574
role_manner 40
role_patient 193
role_source_direction 12
role_target_direction 34
state_of 1305
xpos_fuzzynym 2016
xpos_near_antonym 42
xpos_near_synonym 1388
kokku 203068
Keeltevaheliste suhete (ILI) arv (versioon kb69a)
ILI suhearv
eq_be_in_state 870
eq_causes 311
eq_generalization 13
eq_has_holonym 1903
eq_has_hyperonym 30099
eq_has_hyponym 706
eq_has_meronym 1278
eq_has_subevent 3
eq_involved 1160
eq_is_caused_by 346
eq_is_state_of 569
eq_is_subevent_of 18
eq_metonym 3
eq_near_synonym 9112
eq_role 3487
eq_synonym 20237
kokku 70115

Publikatsioonid

  • Muischnek, Kadri; Fišel, Mark; Kaalep, Heiki-Jaan; Koit, Mare; Müürisep, Kaili; Orav, Heili; Vare, Kadri; Õim, Haldur (2012). Arvutilingvistika ja keeletehnoloogia Tartu Ülikoolis. Erelt, Mati; Mäearu, Sirje (Toim.). Emakeele Seltsi Aastaraamat (66 - 102). Tallinn: TA Kirjastus
  • Kahusk, Neeme; Orav, Heili; Vare, Kadri (2012). Cross-linking Experience of Estonian WordNet. In: Human Language Technologies – The Baltic Perspective: The Fifth International Conference on Human Language Technologies – The Baltic perspective. Tartu, Estonia, October 4-5, 2012. (Toim.) Arvi, Tavast; Kadri Muischnek; Mare, Koit. IOS Press, 2012, 96 - 102.
  • Pedersen, Bolette Sandford; Borin, Lars; Forsberg, Markus; Linden, Krister; Orav, Heili; Rögnvaldsson, Eirikur (2012). Linking and Validating Nordic and Baltic Wordnets - A Multilingual Action in META-NORD. In: Proceedings of 6th International Global Wordnet Conference: 6th International Global Wordnet Conference, Matsue, Japan. (Toim.) Christiane Fellbaum, Piek Vossen., 2012, 254 - 259.
  • Orav, H.; Kerner, K.; Parm, S. (2011). Eesti Wordneti hetkeseisust. Keel ja Kirjandus, 2, 96 - 106.
  • Neeme Kahusk, Kadri Vider TEKsaurus - The Estonian WordNet Online. The Second Baltic Conference on Human Language Technologies, April 4-5, 2005. Proceedings, lk. 273-278.
  • Vider, K., Kerner, K. Word Sense Disambiguation Corpus of Estonian. The Second Baltic Conference on Human Language Technologies, April 4-5, 2005. Proceedings, lk. 143-148
  • Vider, K., Orav, H. Estonian wordnet and Lexicography. Symposium on Lexicography XI. Proceedings of the Eleventh International Symposium on Lexicography. May 2-4, 2002 at the University of Copenhagen. Ed. by H. Gottlieb, J. E. Mogensen and A. Zettersten. Sarjas: Lexicographica, Series Maior 115. Max Niemeyer Verlag, Tübingen 2005, lk. 549-555
  • Kadri Muischnek, Heili Orav, Heiki-Jaan Kaalep, Haldur Õim. Eesti keele tehnoloogilised ressursid ja vahendid. Arvutikorpused, arvutisõnastikud, keeletehnoloogiline tarkvara. Eesti Keele Sihtasutus, Tallinn 2003
  • Vider, K., Orav, H. Idee ja rakenduse vahe tesauruse näitel Eesti Keele Instituudi toimetised 14. Toimiv keel I. Töid rakenduslingvistika alalt. Eesti Keele Sihtasutus Tallinn 2003 lk. 313 - 322
  • Vider, K., Orav, H. Concerning the difference between a conception and its application in the case of the Estonian wordnet Proceedings of the second international wordnet conference. Eds. P.Sojka, K. Pala, P. Smrz, Ch. Fellbaum, P. Vossen. Masaryk University, Brno, 2003, lk. 285-290
  • Kahusk, Neeme A Lexicographer's Tool for Word Sense Tagging According to WordNet Proceedings of Workshop on Wordnet Structures and Standardisation, and how these Affect Wordnet Applications and Evaluation; Third International Conference on Language Resources and Evaluation (LREC 2002). Toim. D. N. Christodoulakis, C. Kunze, L. Lemnitzer. ELRA, Las Palmas de Gran Canaria 2002 lk. 1-7
  • Orav, H Adjectives in wordnet-type thesaurus: Estonian experience Kogumikus Proceedings of the 1st International Global WordNet Conference , Central Institute of Indian Languages , Mysore, India, 2002, lk. 22-25
  • Vider, Kadri Notes about labelling semantic relations in Estonian WordNet Proceedings of Workshop on Wordnet Structures and Standardisation, and how these Affect Wordnet Applications and Evaluation; Third International Conference on Language Resources; Third International Conference on Language Resources and Evaluation (LREC 2002). Toim. D. N. Christodoulakis, C. Kunze, L. Lemnitzer. ELRA, Las Palmas de Gran Canaria 2002 lk. 56-59
  • Orav, H, Vider, K. Kas tesaurus ja tekstid lähevad kasutuses kokku? Kogumikus Tähendusepüüdja Catcher of the Meaning”, TÜ üldkeeleteaduse õppetooli toimetised 3, Tartu 2002, lk. 297-303
  • Vider, Kadri Eesti keele tesaurus - teooria ja tegelikkus Leksikograafiaseminar "Sõna tänapäeva maailmas" Leksikografinen seminaari "Sanat nykymaailmassa". Ettekannete kogumik. Toim. M. Langemets. Eesti Keele Instituudi toimetised 9. Tallinn 2001 lk 134-156
  • Orav, H Adjektiivid kui semantiline probleem: wordnet-tüüpi tesauruste koostamise kogemused Kogumikus Arvutuslingvistikalt inimesele Tartu 2000 lk 153-166
  • Kadri Vider, Neeme Kahusk, Heili Orav, Haldur Õim, Leho Paldre Eesti keele tesaurus Kogumikus Arvutuslingvistikalt inimesele Tartu 2000 lk 127-152
  • Orav, H., Vider, K. Estonian WordNet. Kogumikus Congressus Nonus Internationalis Fenno-Ugristarum. 7.-13.8.2000 Tartu. Pars V. Dissertationes sectionum: Linguistica II. lk. 490-497
  • Vider, K., Orav, H. Sõna tasandilt mõiste ruumi Keel ja Kirjandus 1 1998 lk. 57-64

Tegijad

  • Heili Orav - projektijuht
  • Kadri Vare
  • Sirli Parm
  • Lauri Eesmaa
  • Piia Taremaa
  • Maria Reile
  • Katrin Alekand
  • Ingmar Jaska
  • Helen Türk
  • Eleri Aedma
  • Ahti Lohk

Endised töötajad: Liisi Pool, Riin Kirt, Andrus Karjus, Marju Taukar, Kaisa Hunt, Nele Salveste, Olga-Anniki Villem, Maarja-Liisa Pilvik

Rahaline toetus

Projekti on toetatud rahliselt:

  • 1997 - 2003 Eesti keel ja rahvuslik mälu
  • 2006-2014 Riiklikud programmid "Eesti keele keeletehnoloogiline tugi" ja "Eesti keeletehnoloogia"

Kontakt

  • Arvutilingvistika uurimisrühm Liivi 2- 308, Tartu , Eesti
  • Sisulised küsimused ja kommentaarid: See e-posti aadress on spämmirobotite eest kaitstud. Selle nägemiseks peab su veebilehitsejas olema JavaSkript sisse lülitatud.
  • Tehnilised küsimused ja kommentaarid: See e-posti aadress on spämmirobotite eest kaitstud. Selle nägemiseks peab su veebilehitsejas olema JavaSkript sisse lülitatud.