Korpuse koostisosad: 1910ndad

 

1910ndate korpus - kokku 418 500 sõnet - koosneb järgmistest tekstivaldkondadest.

Valdkond Failinime algus Sõnade arv Protsent korpusest
Ajakirjandus aja 182 500 44 %
Ilukirjandus ilu 247 000 66 %

Ajakirjandustekstid on pärit järgmistest väljaannetest:

Ajaleht Failinime algus Sõnade arv Protsent ajakirjandustekstidest Protsent korpusest
Olewik ow 22 300 12 % 5 %
Päewaleht pl 59 300 32 % 14 %
Postimees pm 53 500 29 % 13 %
Tallinna Teataja tt 27 600 15 % 7 %
Wirulane wi 19 800 11 % 5 %