Süntaksikorpus: ülevaade morfoloogilistest märgenditest
Eesti keele morfoloogilisel analüüsil eristatakse järgmisi morfoloogilisi kategooriaid (sulgudes on morfoloogiline märgend):
- Sõnaliik
- Käändsõnad: nimisõnad ehk substantiivid (_S_), omadussõnad ehk adjektiivid (_A_), arvsõnad ehk numeraalid (_N_), asesõnad ehk pronoomenid (_P_) ja lühendid ning akronüümid (_Y_).
- Pöördsõnad: tegusõnad ehk verbid (_V_).
- Muutumatud sõnad: määrsõnad ehk adverbid (_D_), kaassõnad ehk adpositsioonid (_K_), sidesõnad (_J_), hüüdsõnad (_I_), ainult verbidega koos esinevad sõnad (_X_).
- Kääne: nimetav ehk nominatiiv (nom), omastav ehk genitiiv (gen), osastav ehk partitiiv (part), lühike sisseütlev ehk aditiiv (adit), sisseütlev ehk illatiiv (ill), seesütlev ehk inessiiv (in), seestütlev ehk elatiiv (el), alaleütlev ehk allatiiv (all), alalütlev ehk adessiiv (ad), alaltütlev ehk ablatiiv (abl), saav ehk translatiiv (tr), rajav ehk terminatiiv (ter), olev ehk essiiv (es), ilmaütlev ehk abessiiv (ab), kaasaütlev ehk komitatiiv (kom).
- Arv: ainsus ehk singular (sg), mitmus ehk pluural (pl).
- Komparatsioon: algvõrre (pos), keskvõrre (comp), ülivõrre (super).
- Isik: esimene (ps1), teine (ps2), kolmas (ps3), neid kombineeritakse arvuga.
- Aeg: olevik (pres), lihtminevik (impf). Täis- ja enneminevik moodustatakse olema verbi ja mineviku partitsiibi abil (partic past).
- Tegumood: isikuline (ps), umbisikuline (imps).
- Kõneviis: kindel (indic), tingiv (cond), käskiv (imper), kaudne (quot).
- Kõneliik: jaatav (af) ja eitav (neg).
Lisaks neile eristatakse põhi- ja järgarvsõnu (card ja ord), ees- ja tagasõnu (prep ja post), põhi-, modaal ja abiverbe (main, mod, aux) ning eraldi märgendatakse verbi käändelisi vorme: da-infinitiiv (inf) ja supiin (sup), mis omakorda jaguneb: a) ma-supiin (ill), b) mas-supiin (in), c) mast-supiin (el), d) maks-supiin (tr), e) mata-supiin (abes); des-vorm ehk gerundiiv (ger) ja kesksõnad ehk partitsiibid, mis jagunevad: a) v-kesksõna (partic pres ps), tav-kesksõna (partic pres imps), nud-kesksõna (partic past ps), tud-kesksõna (partic past imps). Asesõnadest eristatakse personaal-, demonstratiiv-, indefiniit-, possessiiv-, interrogatiiv-, relatiiv-, refleksiiv-, retsiprook- ja determinatiivpronoomeneid (vastavalt pers, dem, indef, pos, inter, rel, rec, det). Nende eestikeelsed vasted on isikuline, näitav, umbmäärane, omastav, küsiv, siduv, vastastikune ja määratlev asesõna.
Morfoloogilisel ühestamisel ei osutunud niipaljude asesõnade eristamine vajalikuks ega võimalikuks, seepärast ei loeta neid eraldi morfoloogilisteks tõlgendusteks ega üritata neid ka ühestada.
Morfoloogilisel märgendamisel tekitavad suurimat segadust partitsiibid. Eesti keele oleviku partitsiibid (v- ja tav-kesksõnad) erinevad omadussõnadest ainult selle poolest, et neid võib laiendada sihitis. Muus osas on tegu pigem omadussõnade kui verbidega (kui jätta kõrvale semantika). Mineviku partitsiibid võivad esineda nii täiendi, öeldistäite, määruse kui ka öeldise osa rollis. Osa partitsiipidest, mis on eriti adjektiviseerunud, on esitatud morfoloogiaanalüsaatori leksikonis kui puhas adjektiiv, teised aga, mis nii levinud ei ole, saavad verbi märgenduse. Et olukorda ühtlustada, märgendatakse morfoloogilisel analüüsil kõiki täiendi ja öeldistäite funktsioonis olevaid partitsiipe kui omadussõnu, näidates lisaks veel ära, millist liiki partitsiibiga on tegu.