Eesti Kirjakeele Korpus: 1920ndad: Asutawa Kogu protokollid
See korpus on koostatud Jaapanis Tokio ülikoolis prof Kazuto Matsumura juhendamisel.
Erinevalt teistest 1890-1990 allkorpustest, mis sisaldavad ajalehe- ja ilukirjandustekste, sisaldab 1920ndate aastate allkorpus Asutawa Kogu protokolle aastatest 1919-1920. Korpuse maht on u kaks miljonit sõna.
Kuidas seda kasutada saab?
- esitada korpusele päringuid meie kasutajaliidese kaudu
- laadida endale alla pakitud tekstid
Korpus on vaba kasutamiseks ainult mitteärilistel eesmärkidel.
Märgendus
Erinevalt kõigist teistest meie kodulehelt praegu saadaolevatest korpustest on Asutawa Kogu korpus utf-8 kodeeringus, st täpitähed ja „susisevad“ ei ole esitatud html-olemite vaid utf-8 koodidena ning märgendus on esitatud xml-s .
Tekst on jagatud lõikudeks <p>
ja lauseteks <s>
. Laused on nummerdatud.