Korpuse üldiseloomustus

 

See korpus on planeeritud avatud korpusena, st ta piirsuurust ei ole määratud. Siia on mõeldud koguda erinevat tüüpi suulist kõnet, nii argisuhtluse kui avaliku suhtluse keelekasutust, nii spontaanset kui ettevalmistatud kõnet, nii monolooge kui dialooge.

Käesolev korpus on koostatud selliselt, et tegu oleks maksimaalselt autentsete situatsioonidega, mida magnetofon ja lindistaja võimalikult vähe mõjutavad. Seetõttu on eelistatud salajasi lindistusi ning selliseid situatsioone, mis on kõnelejatele loomulikud.

See korpus on liigendatav mitme parameetri järgi. Suuline kõne ei ole ühtne, vaid selle sees on mitmeid erinevaid allkeeli. Allkeeled jagatakse sotsiolingvistikas tavaliselt kahte suurde rühma: kasutajakeskselt defineeritud murded ning situatsioonikeskselt defineeritud registrid.

Murded jagatakse kohamurreteks/dialektideks ja sotsiaalmurreteks/sotsiolektideks. Sotsiolingvistika on leidnud mitmesuguseid seoseid inimese sotsiaalsete parameetrite ja tema keelekasutuse vahel. Sealjuures on erinevad uurijad toonud välja põhiosas samad mõjurid, millest eesti kultuuris on olulised inimese sotsiaalne päritolu ja staatus (klass, kiht), sotsiaalne võrk (naabrus jms), sugu, vanus ja eriti haridus. Neid parameetreid pole siiani korpuse korjamisel arvesse võetud. Võib vaid öelda, et praegu on korpuses enam naisi, haritud inimesi ja noori või keskealisi inimesi.

Eri murdealadelt pärit inimesed ei kõnele tänapäeval enam enamasti murret, kuid nende keelekasutuses on säilinud mitmesuguseid murdejooni. Samal ajal on murdelisus linnades väiksem kui maakohtades. See korpus on linnakeele korpus, st tema kõnelejad on pärit linnadest. Et võtta arvesse võimalikku erinevat murdetausta, on korpusesse võetud kõnelejaid valdavalt kolmest suurest linnast: Tallinnast, Tartust ja Pärnust. Igal linnal on erinev murdetaust: Tartul Tartu ja Võru murre, Pärnul läänemurre, Tallinnal nii läänemurre kui ka keskmurre. Praegu on korpuses Pärnu ja Tallinna inimesi siiski vähem kui Tartu inimesi.

Teine suur rühm allkeeli on registrid. Siin on eri uurijad välja toonud erinevaid joonteloendeid ning nimetanud saadud komplekte erinevalt. Kõige enam keelt mõjutavad situatiivsed parameetrid on:
-suhtlusviis ehk meediumi omadused: kõne/kiri, dialoog/monoloog, spontaansus/redigeeritus;
-füüsilised tingimused, suhtlusolukord (vahetu/vahendatud, argine/ametlik).

Üks meediumipiir on suulisus ja kirjalikkus ise, millest meil siin juttu ei tule teha. Teine oluline meediumijaotus on spontaansus ja redigeeritus, mis eristab situatsioone, mis võimaldavad teksti täpsemat redigeerimist situatsioonidest, kus selline redigeerimine pole võimalik. Just seda piiri on Douglas Biber näinud kõige tugevamana inglise tekstide registriliigenduses. Samal ajal kattub see piir väga suures osas suulise/kirjaliku piiriga, sest suulise teksti tegemine on alati vähemalt 10-15 korda kiirem kui kirjaliku tegemine (120-180 sõna minutis contra 10-15 sõna minutis). See aga tähendab praktiliselt, et suuline kõne on alati oluliselt spontaansem. Seetõttu me selle parameetri järgi suulisi tekste korpuses ei liigenda. Teine spontaansusega seotud parameeter on tavaliselt olnud piir peast esitatavate ja paberilt mahaloetavate või päheõpitud tekstide vahel. Viimasesse rühma kuuluvad nt raadio- ja teleuuudised, näidendiesitused jms. Meie korpus sisaldab praegu ainult peast esitatavaid tekste. Ka korpuse massimeedia tekstid on sellised, kus saatejuht ja külalised vestlevad omavahel küll varem kokkulepitud ja osalt ka läbiarutatud teemal, kuid ei esita varem päheõpitud juttu.

Kolmas meediumipiiripaar on dialoog/monoloog. Klassikaliseks monoloogiks peetakse juhtu, kus üks partneritest arendab juttu ja teisel puudub õigus või võimalus pakkuda vestluse edasiviimiseks omapoolset teksti (loengud, ettekanded, lugude jutustamine). Kuulaja annab siin kõnelejale vaid tagasisidet (noogutused, mhmh, naer, tukkumine jms).

Kuid eelkõige konversatsioonianalüüs on näidanud, et tagasisidevõtted annavad alati ka juhiseid selle kohta, kuidas kõneleja peaks jätkama ning kõneleja modifitseerib oma edasist juttu pidevalt vastavalt sellele. Seega on ka sellise teksti puhul rangelt võttes tegu dialoogiga. Siiski, keeleliselt erineb selline tekst selgelt lühikesest repliikidevahetusest klassikalises dialoogis. Keerukaks teeb asja aga see, et eriti argisituatsioonides vaheldub repliikidevahetus pidevalt pikemate lugudega. Kas need pikemad lood kuuluvad ühte rühma klassikaliselt monoloogideks peetavate tekstidega või mitte, on lahtine küsimus.

Käesolev korpus on ülivaldavalt dialoogikorpus kitsas mõttes. Nende hulka kuuluvad kõik argivestlused ja telefonivestlused ning valdav osa silmast-silma ametlikest vestlustest. Puhtad monoloogid on mõned loengud ja jutlused. Pikkadest monoloogilõikudest koosnevad tekstid on eelkõige intervjuud, koosolekud ja koolitunnid.

Neljas oluline piir on vahetu suhtluse ja vahendatud suhtluse vahel. Vahendatuse all mõeldakse kahte eri asja. Üks lähenemine nimetab vahendatuks kõiki suhtlusi, kus kasutakse mingit tehnilist vahendajat, nt telefoni vms. Teine lähenemine tõmbab piiri selle põhjal, kas on või ei ole võimalik vahetu tagasiside. Sel juhul on telefonivestlused vahetud vestlused, sest seal on võimalik anda kohe tagasisidet. Vahendatud oleks sellised suulised tekstid, mis seostuvad massikommunikatsiooniga ning erinevad esimestest ka selle poolest, et vastuvõtja on saatjale anonüümne hulk inimesi. Mõlemat parameetrit arvesse võttes saame tekstid jagada kolme rühma: massimeediatekstid, telefonivestlused ja silmast-silma vestlused.

Viimane oluline piir on argine/avalik suhtlus. See piir ei toetu ühele parameetrile nagu eelnevad piirid, vaid on ise kompleksne süsteem, mille all on inimestevahelised suhted (tuttavad, sõbrad, lähedased versus võõrad), inimeste rollid vastavas situatsioonis (eraisik vs institutsiooni esindaja), konkreetne füüsiline olukord (kodus, kohvikus jms versus tööl, ametiasutuses jms), suhtluse põhieesmärk (osalemine, enese sidumine suhtlusega versus informatiivne olemine). Lisaks sellele on argises situatsioonis tavaliselt vooruvahetus vaba, inimeste rollid võivad muutuda sama vestluse jooksul. Avalik situatsioon on rangete rollidega ja palju rangema ülesehitusega. Seal on määratud, kes kõneleb ja mida, kes juhib ja kes allub, kes küsib ja kes vastab, mis järjekorras kõneldakse jms (näiteks arsti-patsiendi vestlus või poedialoog).

Neid tunnuseid kombineerides saame kahe selge tuuma ja hajuvate piiridega kontiinuumi, mille üheks keskmeks on puhas argivestlus ja teiseks puhas institutsionaalne suhtus.

Korpuses kuulub argivestluste tuuma silmast-silma argivestlused ja eratelefonikõned, kus on tegu tuttavate või lähedaste inimestega, kes vestlevad kui eraisikud kodus või muus mitteinstitutsionaalses kohas ja kus suhtlemise oluline eesmärk on vestlemine ise, st vesteldakse igasugustest asjadest, mis pähe tuleb.

Perifeersema, kuid selgepiirilise argivestluste rühma moodustavad need telefonikõned, kus helistatakse tuttavale töö juurde või helistab inimene töö juurest tuttavale koju, kuid aetakse argiasja.

Avalikku poolde kuulub kõige suuremana tuumrühm, kus toimub silmast-silma vestlus, suhtlejad on võõrad, neist vähemalt üks on selles suhtluses mingi institutsiooni esindaja (müüja, arst jms), suhtlus toimub avalikus või institutsionaalses kohas ja tema eesmärk on selgelt informatsiooniline. Siia kuuluvad massimeediasaated, suhtlused mitmesugustes teenindus- ja ametiasutustes (kauplused, postkontor, jaama kassa, raamatukogu, muuseum, reisibüroo, juuksur, polikliinik, maksuamet, haigekassa jms). Teiseks kuuluvad siia loengud, jutlused ja mõned intervjuud. Sealjuures võib neis situatsioonides olla ka lõike, kus on tegu mingi muud tüüpi suhtlusega (nt abikaasadest ostjad räägivad poes mitte ainult müüjaga vaid ka omavahel).
Telefonivestluste analoogilise tuumrühma moodustavad kõned, kus eraisik on helistanud ametiasutusse ametiasjus, vaid mõned kõned on sellised, kus vestlevad omavahel ametiisikud. Neile lisanduvad hulk telefonimüügivestlusi, mis kuuluvad samasse rühma ning moodustavad korpuses omaette sarja.

Avaliku suhtluse teise rühma moodustavad suhtlused, milles suhtlejad on omavahel tuttavad, kuid ajavad ametiasja, st vähemalt üks neist on mingi institutsiooni esindaja ja suhtlus toimub enamasti institutsionaalses kohas (harva ka mujal: ühe poole kodus, mingil neutraalsel pinnal, näiteks õues või tänaval). Siia kuuluvad koolitunnid, korteriühistu koosolek, üliõpilase ja õppejõu suhtlus, õpetaja ja lapsevanema suhtlus, ka mõned arsti ja patsiendi vestlused ja intervjuud).

Kolmanda avaliku suhtluse rühma moodustavad suhtlused, kus inimesed on võõrad, kuid nad tegutsevad eraisikutena neutraalsel pinnal ja hangivad infot. Sellised on näiteks teeküsimised tänaval. Ülejäänud situatsioonid esindavad mitmesuguseid üleminekurühmi.
 
Korpuse kohta vt ka:
 

  • Hennoste, Tiit, Liina Lindström, Andriela Rääbis, Piret Toomet, Riina Vellerind 2000. Eesti suulise kõne korpus ja mõnede allkeelte võrdluse katse. - rmt T. Hennoste (toim.) Arvutuslingvistikalt inimesele, Tartu Ülikooli üldkeelteaduse õppetooli toimetised 1. Tartu, lk 245-283.