Korpuse koostisosad: 1910ndad
1910ndate korpus - kokku 418 500 sõnet - koosneb järgmistest tekstivaldkondadest.
Valdkond | Failinime algus | Sõnade arv | Protsent korpusest |
---|---|---|---|
Ajakirjandus | aja | 182 500 | 44 % |
Ilukirjandus | ilu | 247 000 | 66 % |
Ajakirjandustekstid on pärit järgmistest väljaannetest:
Ajaleht | Failinime algus | Sõnade arv | Protsent ajakirjandustekstidest | Protsent korpusest |
---|---|---|---|---|
Olewik | ow | 22 300 | 12 % | 5 % |
Päewaleht | pl | 59 300 | 32 % | 14 % |
Postimees | pm | 53 500 | 29 % | 13 % |
Tallinna Teataja | tt | 27 600 | 15 % | 7 % |
Wirulane | wi | 19 800 | 11 % | 5 % |