Kordused korpuses

Keelekorpuste kasutajad on pannud tähele, et korpustes päringuid tehes võib vastuseks saada korduvaid lauseid, lõike või isegi suuremaid juppe artiklitest. Tegemist ei ole aga korpuste koostamisel tekkinud võimalike vigadega, vaid korduvad üksused on esinenud juba allikmaterjalide (peamiselt ajalehtede) erinevates, tavaliselt küll sisult sarnastes artiklites. Järgnevalt mõned näited korduvatest lausetest ja lõikudest.

 

Lühikesed sagedased laused

on korduvuste kõige loomulikum variant, näiteks esineb lause

<s> See on tõsi . </s>

meie ajalehtede korpuses 202 korda.

 

Stamplaused

esinevad paljudes (vahel ka kõigis) mingi perioodilise väljaande numbrites ja alati samas kontekstis, nt lause

<s> Avaldatud foto honorar 750 krooni puhtalt ! </s>

esineb Eesti Ekspressi korpuses 34-l korral. Või lause

<s> Minu kolmapäevased autoritekstid ilmuvad ainult Päevalehe paberversioonis . </s>

esineb Eesti Päevalehe korpuses 53 korda, lõpetades Aavo Koka igakolmapäevase arvamusloo internetiversiooni.

 

Korpuses korduv üksik lause

Näiteks antakse Eesti Päevalehes regulaarselt ülevaade Eesti riigieelarve täitumisest ja nendes artiklites kordub lause

<s> Antud kulude number ei sisalda finantseerimist välisabi arvelt . </s>

mis esines 7-l korral Eesti Päevalehe artiklites. Lausele eelnesid ja järgnesid sisult erinevad laused (konteksti vaadati ühe lõigu piires). 2 näidet:

<p> <s> Eelarve kulusid on kahe kuuga finantseeritud 5,367 miljardi krooni ehk 11,25 protsendi ulatuses . </s> <s> Seal hulgas veebruaris 2,799 miljardi krooni ehk 5,9 protsendi ulatuses . </s> <s> Antud kulude number ei sisalda finantseerimist välisabi arvelt . </s> </p>

<p> <s> Eelmisel aastal laekus riigieelarvesse esimese kuuga 7,35 protsenti aasta laekumisest . </s> <s> Eelarve kulusid on ühe kuuga finantseeritud 2,568 miljardi krooni ehk 5,38 protsendi ulatuses . </s> <s> Antud kulude number ei sisalda finantseerimist välisabi arvelt . </s> </p>

 

Korpustes võib esineda ka terveid korduvaid lõike.

Sellised korduvad lõigud esinevad tüüpiliselt ajalehetekstides sama teemat käsitlevates artiklites ja sisaldavad artikli mõistmiseks vajalikku taustainfot. Näiteks kordub Eesti Päevalehe korpuses järgmine lõik 7 korda.

<p> <s> Sharon sai ränga insuldi kolmapäeva õhtul ning ööl vastu neljapäeva tehti talle operatsioon . </s> <s> Ka reedel viidi ta operatsioonituppa tagasi , kuna tal tekkis uus ajuverejooks ja koljusisene rõhk suurenes . </s> </p>

See lõik esines alati artikli lõpus ning talle eelnes igas artiklis erinev lõik. 2 näidet:

<p> <s> Arstid püüavad stimuleerida Sharoni meeli ka sellega , et panid tema juurde taldriku shwarmaga , mis on kohalik liharoog ning peaministri lemmiktoit . </s> <s> See pandi talle piisavalt lähedale , et ta saaks selle lõhna tunda . </s> </p>
<p> <s> Sharon sai ränga insuldi kolmapäeva õhtul ning ööl vastu neljapäeva tehti talle operatsioon . </s> <s> Ka reedel viidi ta operatsioonituppa tagasi , kuna tal tekkis uus ajuverejooks ja koljusisene rõhk suurenes . </s> </p>

<p> <s> Sharoni pojad Omri ja Gilad rääkisid isaga ja Ariel Sharon reageeris kõnetamisele kõrgema vererõhuga . </s> </p>
<p> <s> Sharon sai ränga insuldi kolmapäeva õhtul ning ööl vastu neljapäeva tehti talle operatsioon . </s> <s> Ka reedel viidi ta operatsioonituppa tagasi , kuna tal tekkis uus ajuverejooks ja koljusisene rõhk suurenes . </s> </p>

 

Korduda võivad isegi mitmest lõigust koosnevad tekstikatked. 

Näiteks esineb ajalehtedes ja seega ka ajalehearhiivist moodustatud tekstikorpuses artikleid, mille pealkiri ja esimene lause on erinevad, kuid kogu ülejäänud sisu kordub. See ei ole küll väga sage nähtus, aga selliseid korduvaid artiklite osi esinevb siiski rohkem kui pelgalt paaril korral. Nii esineb Eesti Päevalehe korpuses 5 korda alljärgnevates näidetes punaseks värvitud tekstiosa.

<div3 type="artikkel"><head> Kohus otsustab homme Ruth Martini tööle ennistamise õigsuse </head> <p rend="vahepealkiri"&gt <s> Tallinna ringkonnakohus teeb homme otsuse teede ja -sideministeeriumi kantsleri Ruth Martini ( pildil ) tööle ennistamise seaduslikkuses . </s> </p>
<p> <s> Tallinna halduskohus rahuldas mais Ruth Martini taotluse valitsuse 11. jaanuari korralduse tühistamiseks , millega vabastati Ruth Martin ametist ja nimetati uueks kantsleriks Margus Leivo . </s> </p>
<p> <s> Martin taotles halduskohtult teede- je sideministeeriumi poolt talle määratud distsiplinaarkaristuse ja valitsuse määruse tühistamist , millega ta ametist vabastati , ning nõudis enda tööle ennistamist . </s> </p>
<p> <s> Halduskohus leidis , et valitsuse korraldus on õigusvastane ja ennistas Martini tööle . </s> </p>
<p> <s> " See oli juba minu ametist vabastamise esimesest päevast selge , et mul on vaja süüdistused , mis olid distsiplinaarkaristuse ja vallandamise aluseks , ümber lükata läbi kohtu , " ütles Martin ETAle vahetult pärast vallandamist . </s> </p>
<p> <s> " Kui ma oleksin tundnud end mingilgi määral süüdi , oleksin võtnud vastu peaministri pakkumise ise lahkumisavaldus kirjutada , " lisas Martin . </s> </p>
<p> <s> Valitsus vabastas Ruth Martini teede- ja sideministri Toivo Jürgensoni ettepanekul . </s> </p>
<p> <s> Jürgensoni hinnangul ei olnud Ruth Martin oma ülesannete kõrgusel , töö ministeeriumis ja allasutustes oli halvasti korraldatud ning ministeeriumi juhtimist takistas kantsleri suutmatus meeskonnatööks . </s> </p>
<p> <s> Lisaks oli Martin ministri hinnangul seotud mitmete ebaeetiliste ja riigi huve kahjustavate tegudega . </s> <s> Ekskantslerile pannakse süüks ka tema ametiauto BMW 523 kapitalirendilepingu katkestamisega riigile 134.500 krooni suuruse kahju tekitamist . </s>
</div3>

<div3 type="artikkel"><head> Ruth Martini tööle ennistamise vaidlus jätkub ringkonnakohtus </head> <p rend="vahepealkiri"&gt <s> Tallinna ringkonnakohus arutab neljapäeval valitsuse kaebust Tallinna halduskohtu 10. mai otsuse tühistamiseks , millega ennistati tööle teede ja -sideministeeriumi kantsler Ruth Martin . </s> </p>
<p> <s> Tallinna halduskohus rahuldas mais Ruth Martini taotluse valitsuse 11. jaanuari korralduse tühistamiseks , millega vabastati Ruth Martin ametist ja nimetati uueks kantsleriks Margus Leivo . </s> </p>
<p> <s> Martin taotles halduskohtult teede- je sideministeeriumi poolt talle määratud distsiplinaarkaristuse ja valitsuse määruse tühistamist , millega ta ametist vabastati , ning nõudis enda tööle ennistamist . </s> </p>
<p> <s> Halduskohus leidis , et valitsuse korraldus on õigusvastane ja ennistas Martini tööle . </s> </p>
<p> <s> " See oli juba minu ametist vabastamise esimesest päevast selge , et mul on vaja süüdistused , mis olid distsiplinaarkaristuse ja vallandamise aluseks , ümber lükata läbi kohtu , " ütles Martin ETAle vahetult pärast vallandamist . </s> </p> <p> <s> " Kui ma oleksin tundnud end mingilgi määral süüdi , oleksin võtnud vastu peaministri pakkumise ise lahkumisavaldus kirjutada , " lisas Martin . </s> </p>
<p> <s> Valitsus vabastas Ruth Martini teede- ja sideministri Toivo Jürgensoni ettepanekul . </s> </p>
<p> <s> Jürgensoni hinnangul ei olnud Ruth Martin oma ülesannete kõrgusel , töö ministeeriumis ja allasutustes oli halvasti korraldatud ning ministeeriumi juhtimist takistas kantsleri suutmatus meeskonnatööks . </s> </p>
<p> <s> Lisaks oli Martin ministri hinnangul seotud mitmete ebaeetiliste ja riigi huve kahjustavate tegudega . </s> <s> Ekskantslerile pannakse süüks ka tema ametiauto BMW 523 kapitalirendilepingu katkestamisega riigile 134.500 krooni suuruse kahju tekitamist . </s>
</div3>

<div3 type="artikkel"><head> Kohus otsustab Ruth Martini tööle ennistamise õigsuse 13. oktoobril </head> <p rend="vahepealkiri"&gt <s> Tallinna ringkonnakohus teeb otsuse teede ja -sideministeeriumi kantsleri Ruth Martini ( pildil ) tööle ennistamise seaduslikkuses 13. oktoobril . </s> </p>
<p> <s> Tallinna halduskohus rahuldas mais Ruth Martini taotluse valitsuse 11. jaanuari korralduse tühistamiseks , millega vabastati Ruth Martin ametist ja nimetati uueks kantsleriks Margus Leivo . </s> </p>
<p> <s> Martin taotles halduskohtult teede- je sideministeeriumi poolt talle määratud distsiplinaarkaristuse ja valitsuse määruse tühistamist , millega ta ametist vabastati , ning nõudis enda tööle ennistamist . </s> </p>
<p> <s> Halduskohus leidis , et valitsuse korraldus on õigusvastane ja ennistas Martini tööle . </s> </p>
<p> <s> " See oli juba minu ametist vabastamise esimesest päevast selge , et mul on vaja süüdistused , mis olid distsiplinaarkaristuse ja vallandamise aluseks , ümber lükata läbi kohtu , " ütles Martin ETAle vahetult pärast vallandamist . </s> </p>
<p> <s> " Kui ma oleksin tundnud end mingilgi määral süüdi , oleksin võtnud vastu peaministri pakkumise ise lahkumisavaldus kirjutada , " lisas Martin . </s> </p>
<p> <s> Valitsus vabastas Ruth Martini teede- ja sideministri Toivo Jürgensoni ettepanekul . </s> </p>
<p> <s> Jürgensoni hinnangul ei olnud Ruth Martin oma ülesannete kõrgusel , töö ministeeriumis ja allasutustes oli halvasti korraldatud ning ministeeriumi juhtimist takistas kantsleri suutmatus meeskonnatööks . </s> </p>
<p> <s> Lisaks oli Martin ministri hinnangul seotud mitmete ebaeetiliste ja riigi huve kahjustavate tegudega . </s> <s> Ekskantslerile pannakse süüks ka tema ametiauto BMW 523 kapitalirendilepingu katkestamisega riigile 134.500 krooni suuruse kahju tekitamist . </s>
</div3>

 

Mida kordustega ette võtta?

Need kordused on korpuse algtekstide osad, seetõttu ei pea me õigeks neid korpusest kustutada. Samas peaksid kasutajad olema teadlikud sellest, et selliseid kordusi korpuses esineb ja tõlgendama korduvaid näitelauseid vastavalt oma uurimisülesande metoodikale.