Korpuse koostisosad: 1910ndad
1910ndate korpus - kokku 418 500 sõnet - koosneb järgmistest tekstivaldkondadest.
| Valdkond | Failinime algus | Sõnade arv | Protsent korpusest |
|---|---|---|---|
| Ajakirjandus | aja | 182 500 | 44 % |
| Ilukirjandus | ilu | 247 000 | 66 % |
Ajakirjandustekstid on pärit järgmistest väljaannetest:
| Ajaleht | Failinime algus | Sõnade arv | Protsent ajakirjandustekstidest | Protsent korpusest |
|---|---|---|---|---|
| Olewik | ow | 22 300 | 12 % | 5 % |
| Päewaleht | pl | 59 300 | 32 % | 14 % |
| Postimees | pm | 53 500 | 29 % | 13 % |
| Tallinna Teataja | tt | 27 600 | 15 % | 7 % |
| Wirulane | wi | 19 800 | 11 % | 5 % |