Tartu Ülikooli suulise ja arvutisuhtluse labor

 Tartu ülikooli suulise eesti keele korpust on kogutud alates 1997. aastast. Korpust kogub ja haldab suulise ja arvutisuhtluse labor Tiit Hennoste juhtimisel.

Suulise keele korpuse administraator on Andriela Rääbis. Tartu ülikooli suulise eesti keele korpust on kogutud alates 1997. aastast. Korpust kogub ja haldab suulise ja arvutisuhtluse labor Tiit Hennoste juhtimisel. Suulise keele korpuse administraator on Andriela Rääbis. Suuliste tekstide kirjapanekul on kasutatud vestlusanalüüsi (CA) transkriptsiooni. Iga salvestise juurde kuulub taustakirjeldus, mis sisaldab tähtsamaid andmeid salvestussituatsiooni ja kõnelejate kohta.

Korpus on mõeldud teaduslikel eesmärkidel kasutamiseks. Selleks tuleb võtta ühendust administraator Andriela Rääbisega (See e-posti aadress on spämmirobotite eest kaitstud. Selle nägemiseks peab su veebilehitsejas olema JavaSkript sisse lülitatud.). Korpuse kasutamiseks tuleb allkirjastada konfidentsiaalsuskohustus (saab administraatorilt tööplaani esitamisel), milles on toodud salvestiste ja litereeringute kasutamise tingimused.

Korpus on kavandatud avatud korpusena, piirsuurust ei ole määratud. Salvestised on maksimaalselt autentsed.

Korpuse suurus ja koosseis (jaanuar 2019):

3761 audio- ja 166 videosalvestist (kokku 3927 vestlust, 703 tundi)

Salvestised jagunevad:

  • 1345 silmast silma vestlust
  • 1924 telefonivestlust
  • 456 raadio- ja telesaadet
  • 7 Skype’i vestlust
  • 195 määratlemata

Argise-institutsionaalse suhtluse skaalal jagunevad salvestised:

  • 824 argivestlust
  • 2798 institutsionaalset vestlust
  • 84 argise-institutsionaalse segu või vaheldumine
  • 221 määratlemata

Salvestistest on transkribeeritud 2337 teksti. (2 206 810 sõna MS Wordi statistika järgi)

Uurijatele kasutatav alamkorpus sisaldab 1700 teksti (640 000 sõna).

Korpus on MS Wordi ja txt-formaadis (ISO-8859-1).

 

Väike osa korpusest (100 000 sõna) on morfoloogiliselt märgendatuna ja ühestatuna kasutatav korpuste otsingusüsteemi KORP kaudu.

 

Tekstinäited

Artikleid suulise keele korpuse kohta

Üliõpilastöid suulise keele kohta

Projektid

Korpus Metashare'is