Reeglipõhise CG ühestajaga morfoloogiliselt ühestatud Koondkorpus

2013. aastal on reeglipõhise (CG) morfoloogilise ühestajaga märgendatud Koondkorpusest tehtud vaheversioon (v.a. uue meedia allosa ja seadusetekstid). Lõplik morfoloogiliselt märgendatud versioon valmib 2014. aasta lõpuks. Vaheversiooni märgendisüsteem vt siit. Morfoloogilise kirjelduse saagis 27 tuhande sõnalisel testkorpusel on 97.1%, täpsus 90.4%, vigu on 2.9%, mitmesus 6.2%. Võrdluseks morfoloogiliselt analüüsitud, kuid ühestamata testkorpuse morfoloogilise kirjelduse saagis on 99.5%, täpsus 35.5%, vigu on 0.5%, mitmesus 57.7%.

Vaheversiooni kasutamiseks palun kirjutage See e-posti aadress on spämmirobotite eest kaitstud. Selle nägemiseks peab su veebilehitsejas olema JavaSkript sisse lülitatud..