Morfoloogiliselt ühestatud suulise kõne korpus

 

Morfoloogiliselt analüüsitud suulise kõne korpus on osa suulise kõne korpusest

Kasutajaliides annab päringule vastuseks ühe vooru real. Vooru alguse märgend on <s> ja lõpu märgend </s>. Iga sõne järel on neli tühikut, siis selle sõna tüvi ja plussmärgiga eraldatud tunnused ning lõpud. Seejärel on // ja // vahel morfoloogiliste kategooriate märgendid. Näiteks:

ema ema+0 //_S_ com sg nom // teen tege+n //_V_ main indic pres ps1 sg ps af //

Kasutatud on samu morfoloogilisi märgendeid, mis kirjaliku keele analüüsil. Lisaks kasutatakse partiklite ja üneemide märgendamiseks sõnaliigi märgendit _B_ Näiteks:

noh noh+0 //_B_ //

Transkriptsioonimärkide ja -märgenditega (transkriptsiooni kohta vt siin) on ümber käidud järgmiselt:

  • liigendusüksuste märgid (.,?) on säilitatud
  • pausidele osutavad (.) (..) (...) on kustutatud
  • kõne prosoodiliste ja paralingvistilistele omaduste, pealerääkimiste, ebaselguste märgendid on kustutatud -
  • kommentaarid on kustutatud