TÜ arvutilingvistika keeleressursid
Korpused
Miks ma saan korpusepäringule vastuseks mitu korda sama lause?
- Eesti kirjakeele korpus 1890-1990
- Morfoloogiliselt ühestatud korpus
- Ühestatud sõnatähendustega korpus
- Süntaktiliselt ühestatud korpus
- Sõltuvussüntaktiliselt ühestatud korpus
- Meditsiinikeele korpus
- Tasakaalus korpus (ajakirjandus+ilukirjandus+teadus)
- Eesti keele koondkorpus:
- Eesti ilukirjandus 1990-
- "Postimees"
- "Eesti Ekspress"
- "Eesti Päevaleht"
- "Maaleht"
- "SL Õhtuleht"
- "Valgamaalane"
- "Lääne Elu"
- "Horisont"
- "Luup"
- "Kroonika"
- "Eesti Arst"
- "Arvutitehnika ja Andmetöötlus"
- "Agraarteadus"
- Mitmesugused teadusartiklid
- Eesti ja Euroopa seadused
- Uus meedia
- Riigikogu stenogrammid
- Doktoritööd
- Reeglipõhise CG ühestajaga morfoloogiliselt ühestatud Koondkorpus
- Ajasemantiliste märgendustega tekstikorpus
- Inglise-eesti ja eesti-inglise paralleelkorpus
- Vana kirjakeele korpus koostatakse Tartu ülikooli vana kirjakeele uurimisrühmas
- Eesti murrete korpust koostatakse Tartu ülikooli eesti murrete ja sugulaskeelte arhiivis
- Multext-Easti kodulehel olevad ressursid (G. Orwelli "1984" morfosüntaktiliselt märgendatud paralleelkorpus, leksikonid, paralleelne kõnekorpus jne.)
- Eesti kõnekeele korpust haldab TÜ suulise ja arvutisuhtluse labor