Eesti Kirjakeele Korpus: 1920ndad: Asutawa Kogu protokollid

See korpus on koostatud Jaapanis Tokio ülikoolis prof Kazuto Matsumura juhendamisel.

Erinevalt teistest 1890-1990 allkorpustest, mis sisaldavad ajalehe- ja ilukirjandustekste, sisaldab 1920ndate aastate allkorpus Asutawa Kogu protokolle aastatest 1919-1920. Korpuse maht on u kaks miljonit sõna.

Kuidas seda kasutada saab?

Korpus on vaba kasutamiseks ainult mitteärilistel eesmärkidel.

Märgendus

Erinevalt kõigist teistest meie kodulehelt praegu saadaolevatest korpustest on Asutawa Kogu korpus utf-8 kodeeringus, st täpitähed ja „susisevad“ ei ole esitatud html-olemite vaid utf-8 koodidena ning  märgendus on esitatud xml-s .

Tekst on jagatud lõikudeks <p> ja lauseteks <s>. Laused on nummerdatud.