Morfoloogiliselt ühestatud suulise kõne korpus
Morfoloogiliselt analüüsitud suulise kõne korpus on osa suulise kõne korpusest
Kasutajaliides annab päringule vastuseks ühe vooru real. Vooru alguse märgend on <s> ja lõpu märgend </s>. Iga sõne järel on neli tühikut, siis selle sõna tüvi ja plussmärgiga eraldatud tunnused ning lõpud. Seejärel on // ja // vahel morfoloogiliste kategooriate märgendid. Näiteks:
ema ema+0 //_S_ com sg nom //
teen tege+n //_V_ main indic pres ps1 sg ps af //
Kasutatud on samu morfoloogilisi märgendeid, mis kirjaliku keele analüüsil. Lisaks kasutatakse partiklite ja üneemide märgendamiseks sõnaliigi märgendit _B_ Näiteks:
noh noh+0 //_B_ //
Transkriptsioonimärkide ja -märgenditega (transkriptsiooni kohta vt siin) on ümber käidud järgmiselt:
- liigendusüksuste märgid (.,?) on säilitatud
- pausidele osutavad (.) (..) (...) on kustutatud
- kõne prosoodiliste ja paralingvistilistele omaduste, pealerääkimiste, ebaselguste märgendid on kustutatud -
- kommentaarid on kustutatud