A-venäjän ylioppilaskokeiden sanasto haastaa pitkää venäjää aidosti vieraana kielenä opiskelevan

Monet venäjän opettajat ovat ilmaisseet huolensa siitä, että venäjän pitkän oppimäärän eli A-venäjän ylioppilaskokeet ovat liian vaativia venäjää vieraana kielenä opiskeleville. Keväällä 2016 lähetin A-venäjän opettajille kyselyn, jonka päämääränä oli koota opettajien näkemyksiä ja kokemuksia A-venäjän ylioppilaskokeen vaativuustasosta ja muista kokeeseen liittyvistä seikoista. Kyselyn vastauksissa suurimmaksi ongelmia tuottavaksi osa-alueeksi nousi kokeiden sanasto. Tässä artikkelissa tutkin vuosien 2010–2015 A-venäjän ylioppilaskokeiden sanastoa.

Julkaistu: 12. syyskuuta 2018 | Kirjoittanut: Johanna Lähteinen

A-venäjän ylioppilaskoe vaikea venäjää vieraana kielenä puhuville

Venäjän pitkän oppimäärän eli A-venäjän ylioppilaskokeen kirjoittaa vuosittain verrattain pieni joukko kokelaista. Tällä vuosikymmenellä kirjoittajia on ollut vuodessa keskimäärin 240 ja heistä valtaosa, noin 200, puhuu venäjää äidinkielenään, kotikielenään tai toisena äidinkielenään. Vuonna 2015 lukion oppimäärän suorittaneista A-venäjää opiskeli 213 opiskelijaa. Opiskelijamäärä on pysynyt suurin piirtein samana vuosina 2010–2015: 0,6–0,8 % lukion oppimäärän suorittaneista opiskeli A-venäjää. A-venäjän ylioppilaskokeeseen osallistuvien määrä on vuosittain ollut suurempi kuin A-venäjän opiskelijoiden määrä, koska osa kokelaista suorittaa A-venäjän ylioppilaskokeen rehtorin luvalla opiskelematta A-venäjän kursseja, kun kokelaan kielitaito on todettu riittäväksi. Osa A-venäjän opiskelijoista sen sijaan jättää ylioppilaskokeen suorittamatta tai osallistuu lyhyen venäjän ylioppilaskokeeseen.

Lukioiden rehtorien pyynnöstä Helsingin yliopiston venäjän kielen ja kirjallisuuden oppiaine teetti keväällä 2016 kyselyn A-venäjän opettajille. Kutsu osallistua sähköiseen kyselyyn lähetettiin kaikille Suomen venäjän opettajat ry:n sähköpostilistalla oleville sekä kaikille venäjän opettajille, joiden kouluissa oli ollut vähintään yksi A-venäjän opiskelija vuonna 2013 tai 2015 ja joiden sähköpostiosoitteet olivat löydettävissä koulujen sivuilta. Kyselyyn vastasi 22 opettajaa, jotka ovat opettaneet A-venäjää eri kouluissa eri puolilla Suomea.

Kyselystä selvisi, että A-venäjän ylioppilaskokeita korjanneet opettajat pitävät koetta vaikeana venäjää puhtaasti vieraana kielenä opiskeleville. Monen mielestä ei-äidinkielisten opiskelijoiden on vaikea tai mahdoton saavuttaa A-venäjän oppimäärän pohjalta A-venäjän kokeen edellyttämä taso. Valtakunnallisen lukion opetussuunnitelman mukaan A-venäjän opiskelijoiden tavoitetaso Eurooppalaisen viitekehyksen (CERF) mukaisessa kielitaitotasojen luokittelussa lukion lopussa on B1.1–B1.2 (LOPS 2003).

Kyselytulosten valossa A-venäjän opetuksen nykytilanne on kaiken kaikkiaan erittäin haastava. Opiskelijoita on vähän, mistä monessa koulussa seuraa se, että A-venäjän ryhmää ei synny ollenkaan tai syntyy yksi, usein pieni ryhmä. Opetuksen eriyttäminen opiskelijoiden kielitaustan ja tarpeiden perusteella on yhdessä ryhmässä vaikeaa tai mahdotonta. Opettajien tilannetta ei helpota se, että äidinkielisten ja pelkästään kouluopetuksen pohjalta venäjää vieraana kielenä opiskelevien ei-äidinkielisten väliin sijoittuu laaja kirjo kaksikielisyyden eri tyyppejä ja asteita edustavia oppilaita. Opiskelijoiden moninaiset lähtökohdat eivät rajoitu venäjän kielen taitoon vaan koskevat myös monia maan ja kulttuurin tuntemukseen liittyviä tietoja ja kokemusmaailmaa. Eritaustaisilla opiskelijoilla on siten hyvin erilaiset lähtökohdat A-venäjän ylioppilaskokeen suorittamiseen. Lisäksi kyselyn vastauksissa tulee ilmi, että  opetuksen järjestämiseen liittyvät muutokset, kuten kurssitarjonnan supistuminen, ovat hankaloittaneet A-venäjän opiskelua.

Kyselytulosten perusteella näyttää siltä, että erityisesti A-venäjän ylioppilaskokeissa esiintyvä sanasto saattaa ylittää oppimäärälle asetetut tavoitteet ja on mahdollisesti suurin yksittäinen syy siihen, että venäjää vieraana kielenä puhuvien on ollut vaikeaa saada hyviä arvosanoja kokeesta (ks. tarkemmin Nikunlassi & Lähteinen 2017). Tämän vuoksi paneudun tässä artikkelissa tarkemmin vuosien 20102015 A-venäjän ylioppilaskokeiden sanastoon mm. vertaamalla sitä korpuspohjaiseen frekvenssisanalistaan ja hyödyntämällä sanastoanalyysissä käytettäviä menetelmiä. Korpuspohjainen frekvenssisanalista on sanalista, jossa tulee ilmi sanan yleisyys. Sanan frekvenssi eli yleisyys perustuu korpuksen eli niin sanotun kielipankin laajaan materiaaliin.

Kuinka arvioida sanaston vaikeutta

Sanaston vaikeutta voidaan arvioida eri tavoin, esimerkiksi tutkimalla sanojen yleisyyttä tai selvittämällä eri sanojen määrän arvioitavassa tekstissä.

Tidballin ja Treffers-Dallerin (2008) mukaan opettajan arvio on luotettavampi tapa arvioida sanaston vaikeutta kuin jos arvio sanaston vaikeudesta perustuisi pelkästään siihen, kuinka tiheästi yksittäiset sanat esiintyvät kielessä. Vaikka sanan yleisyydellä ei ole suoraa yhteyttä sen vaikeusasteeseen, tutkijat myöntävät, että sanaston laadun mittaamiseen tarvitaan vertailukohdaksi myös lista kielen perussanastosta tai sen yleisimmin käytetyistä sanoista.

Vermeerin (2000) mukaan tekstin sanaston rikkaudesta kertoo enemmän sanojen vaikeusaste kuin niiden määrä tekstissä. Vaikeusasteeseen taas vaikuttaa se, kuinka usein sana esiintyy käytössä. Vermeer kritisoi sanastoanalyysissä yleisesti käytettyä TTR-menetelmää. TTR (type/token ratio) -menetelmän avulla selvitetään, mikä on tekstissä esiintyvien eri sanojen määrän ja kaikkien tekstissä esiintyviin sanojen määrän välinen suhde. Siten saadaan tietoa tekstin sanaston monimuotoisuudesta. TTR-menetelmän sijaan Vermeer suosittelee vertaamaan tutkittavan tekstin sanoja tekstikorpusten tarjoamaan määrälliseen dataan.

Vermeerin (2000) mukaan lapsen kotikielellä on huomattava vaikutus lapsen sanavaraston kehittymiseen. Voidaan siis olettaa, että venäjää äidin- tai kotikielenä puhuvilla on selkeä etulyöntiasema A-venäjän ylioppilaskokeessa, koska heillä on venäjää vieraana kielenä opiskeleviin verrattuna selkeästi laajempi sanavarasto.

Myös Lauferin ja Nationin (1999) mielestä tekstien sanastoa kannattaa tarkastella frekvenssisanalistojen kautta, koska esimerkiksi englannin kielessä 1000 yleisintä sanaa kattaa 75 % kirjoitettujen tekstien sanastosta ja 84 % epämuodollisen puhutun kielen sanastosta. Vieraan kielen opetuksessa ei ole mahdollista opiskella kielen kaikkia sanoja, joten opettajan on hyödyllistä valita tarkkaan, mitä sanoja opiskellaan. Opiskelijat hyötyvät eniten yleisimpien sanojen opettelusta, koska niiden käytölle on eniten sekä tarvetta että mahdollisuuksia. Lauferin ja Nationin mukaan esimerkiksi englannin kielen 2000 eniten käytetyllä sanalla on hyvin korkea käyttöarvo, joten ne ansaitsevat erityisen aseman kielen opetuksessa, kun taas niitä harvinaisempien sanojen opetteluun ei kannata käyttää samalla tavalla aikaa. Sama periaate pätee muihinkin kieliin. Harvinaisempien sanojen kohtaamiseen ja käyttöön on kuitenkin paikallaan opettaa opiskelijoille erilaisia oppimis- ja selviytymisstrategioita, joiden avulla he voivat tunnistaa harvemmin käytettyjä sanoja. Venäjän kielen kohdalla opiskelija voi esimerkiksi opetella yleisimmät affiksit ja yrittää tunnistaa sanan juuren siinä vaiheessa, kun perussanasto on jo tuttua. Lisäksi kontekstin avulla voi yrittää päätellä sanan merkitystä. Vieraan kielen opiskelija hyötyy siitä, että hän kuulee ja lukee riittävästi tekstiä vieraalla kielellä.

Lauferin ja Nationin toisessa tutkimuksessa (1999) seitsemän vuotta englannin kieltä vieraana kielenä opiskelleet saivat melkein täydet pisteet 2000 yleisimmän sanan hallintaa mittaavassa testissä. Venäjän ylioppilaskirjoituksiin mennessä A-venäjää opiskelevat ovat opiskelleet kieltä 79 vuotta, joten Lauferin ja Nationin tutkimukseen verraten on perusteita olettaa, että he tuntevat vähintään 20003000 venäjän sanaa. Venäjän sanojen oppimista ja tunnistamista helpottaa lisäksi se, että venäjän sanamuodostus on verrattain hyvin läpinäkyvää ja säännönmukaista.

Tutkimusmenetelmät ja -tulokset

Tarkastelin vuosien 2010–2015 A-venäjän ylioppilaskokeiden sanaston vaativuutta sekä TTR-menetelmällä että vertaamalla luetun ymmärtämisen sanastoa frekvenssisanalistaan.

TTR-menetelmän avulla selvisi, ettei vuosien 20102015 A-venäjän ylioppilaskokeiden tekstien sanastollinen monimuotoisuus ole vaihdellut merkittävästi. Kussakin tutkimassani ylioppilaskokeessa eri sanoja on noin 1000. Sitä voi pitää kohtuullisena määränä, koska voidaan odottaa, että A-venäjän ylioppilaskirjoituksiin osallistuva tuntee vähintään 20003000 sanaa ja tunnistaa lisäksi merkittävän osan venäjän sananmuodostuksessa käytettävistä affikseista. TTR-menetelmässä selvitettiin ylioppilaskokeiden TTR-luvut, jotka kuvastavat tekstissä esiintyvien eri sanojen suhdetta kaikkiin tekstissä esiintyviin sanoihin. TTR-luvusta ei kuitenkaan voi päätellä sitä, onko kokeiden sanastollinen vaikeustaso vaihdellut suuresti tai ovatko tekstien aihepiirit vaihdelleet siten, että ne olisivat vaikeuttaneet tai helpottaneet sanaston ja tekstien ymmärtämistä. Tästä johtuen päätin selvittää A-venäjän kokeiden sanaston vaativuustasoa vertaamalla niissä esiintyviä sanoja Serge Sharoffin, Elena Umanskayan ja James Wilsonin (2013) laatimaan korpuspohjaiseen frekvenssilistaan Frequency Dictionary of Russian. Se sisältää noin 9000 venäjän kielen yleisimmin käytettyä sanaa.

Frekvenssivertailun tarkoituksena oli selvittää, kuinka paljon A-venäjän ylioppilaskokeissa esiintyy sellaista sanastoa, joka voisi olla syynä siihen, että opettajat arvioivat kokeen liian vaativaksi. Rajasin tutkimusaineiston siten, että poimin analyysiä varten jokaisesta vuosien 2010–2015 kokeesta luetun ymmärtämisen tekstien kaksi ensimmäistä sivua. Kävin sivut läpi ja poimin niistä venäjän opettajana tekemäni arvion mukaisesti sanat, jotka todennäköisesti ylittäisivät taitotason B1. Sen jälkeen tutkin näitä sanoja tarkemmin katsomalla, löytyvätkö ne Sharoffin, Umanskayan ja Wilsonin (2013) frekvenssisanalistasta ja mikä on niiden frekvenssi. Kyseinen sanalista antaa frekvenssin lisäksi myös arvion siitä, mille tasolle sana sijoittuu Eurooppalaisen viitekehyksen (CERF) mukaisessa kielitaitotasojen luokittelussa. Jatkossa viittaan termillä “vaikea sana” sanoihin, jotka ylittävät taitotason B1 Sharoffin, Umanskayan ja Wilsonin frekvenssilistan antaman arvion tai opettajan kokemuksella tekemäni arvion perusteella.

Frekvenssivertailun tuloksista kävi ilmi, että A-venäjän ylioppilaskokeessa noin 10% kunkin sivun sanoista on sanoja, jotka eivät löydy Sharoffin, Umanskayan ja Wilsonin frekvenssilistasta tai joiden he arvioivat ylittävän B1-tason. Koe ei näytä vaikeutuneen ainakaan tutkimusotoksen viimeisimpinä vuosina, koska syksystä 2014 syksyyn 2015 vaikeiden sanojen osuus tekstissä on ollut keskiarvoa alhaisempi.

Osa niistä sanoista, jotka eivät löydy Sharoffin, Umanskayan ja Wilsonin frekvenssilistasta, on sellaisia, joiden merkityksen pystyy päättelemään, vaikka ne eivät olisikaan kovin yleisiä. Tällaisia sanoja ovat esimerkiksi monet lainasanat, kuten фосфат (fosfaatti) ja велотранспорт (pyöräliikenne). Osa sanoista näyttää kuitenkin ylittävän sen tason, jota A-venäjää vieraana kielenä lukevalta voisi odottaa, kuten sanat обнюхать (nuuhkia), перешеек (kannas), карликовый (kääpiö-) ja ровесник (ikätoveri).

Osa B2-tasolle luokitelluista sanoista vaikuttaa sellaisilta, että A-venäjän opiskelija voisi ne tuntea. B2-tasolle on luokiteltu mm. sanat общество (yhteiskunta), худеть (laihtua), изготовление (valmistus) ja деревенский (kylä-). C-tason sanoja on teksteissä verrattain vähän.

Edellä sanotun perusteella näyttää siltä, että alle 10 % luetun ymmärtämisen sanoista olisi tuntemattomia A-venäjää vieraana kielenä opiskelevalle – olettaen, että hän on saavuttanut opetussuunnitelmassa määritellyn taitotason B1 ja että Sharoffin, Umanskayan ja Wilsonin frekvenssilistan taitotasoarviot pitävät paikkansa. Pääasiassa A-venäjän opiskelijoiden tulisi siis hallita ylioppilaskokeiden sanasto.

Tehtävästä suoriutumisen kannalta on tärkeää se,  missä kohtaa koetta vaikeat sanat esiintyvät ja ovatko ne tekstin avainsanoja. Mikäli vaikeita sanoja on luetun ymmärtämisen tekstiin liittyvissä monivalintakysymyksissä ja vastausvaihtoehdoissa, voi tehtävän suorittaminen onnistuneesti hankaloitua merkittävästi. Toisaalta, jos vaikeat sanat eivät ole niissä kohdissa tekstiä, joista löytyy vastaus monivalintakysymykseen, ei välttämättä haittaa, vaikka oppilas ei tuntisikaan juuri niitä sanoja.

Koska monivalintakysymysten ja vastausvaihtoehtojen ymmärtäminen on tärkeää tehtävän onnistuneen suorittamisen kannalta, tarkastelin erikseen myös niiden sanastoa muutamien satunnaisotantojen pohjalta. Monivalintatehtävissä on yhtä kysymystä kohden kolme vastausvaihtoehtoa. Otosten analyysi osoitti, että monivalintakysymyksissä ja niiden vastausvaihtoehdoissa on suhteellisesti enemmän B1-tason ylittävää sanastoa kuin itse luetun ymmärtämisen teksteissä. Esimerkiksi syksyn 2015 ylioppilaskokeen monivalintakysymyksissä ja niiden vastausvaihtoehdoissa, jotka liittyivät luetun ymmärtämisen ensimmäisen ja toisen sivun teksteihin, esiintyy yhteensä 186 sanaa, joista 38 eli 20 % on vaikeita tässä artikkelissa määritellyssä merkityksessä. Osa sanoista toistuu kysymyksissä tai vastausvaihtoehdoissa. Kyseisessä otoksessa jokaisen kysymyksen ja sen vaihtoehtojen kohdalla on 16 sanaa, jotka ylittävät B1-tason tai joita ei ole Sharoffin, Umanskayan ja Wilsonin frekvenssilistan 9000 sanan joukossa. Alla on ote syksyn 2015 monivalintakysymysten ensimmäisistä kysymyksistä. Vaikeiksi määritellyt sanat on lihavoitu.

1. Что сообщается о гостье?

A Её одолжили у эдинбургского зоопарка.

B Для неё был организован специальный перелёт.

C Её приезда ждали в зоопарке около двух лет.

 

2. Что мы узнаём о карликовых бегемотах?

A На них ведётся незаконная охота.

B Они находятся под угрозой вымирания.

C За их поведением непросто наблюдать.

 

3. Как финансировали перевозку?

A Деньги выделила организация по защите природы.

B Средства получили от отечественной компании.

C Нужную сумму собрали с помощью телефонных звонков и смс.

Mikäli opiskelija ei tietäisi lihavoituja sanoja, tehtävä olisi vaikea suorittaa onnistuneesti. Alla on lista sanoista, jotka on poimittu samasta syksyn 2015 ylioppilaskokeen monivalintatehtävästä ja joiden Sharoff, Umanskaya ja Wilson arvioivat ylittävän B1-tason. Kunkin sanan perään on merkitty, mille tasolle sanan on arvioitu sijoittuvan. Sanat on järjestetty yleisimmästä harvinaisimpaan. “Ei löydy” tarkoittaa, että sanaa ei esiinny Sharoffin, Umanskayan ja Wilsonin 9000 sanan listassa.

Lahteinen_taulukko_1_korjattu

Kuten listasta ilmenee, suurin osa B1-tason ylittävistä sanoista on luokiteltu B2-tasolle. Sama havainto koskee myös muita tekemiäni satunnaisotoksia. Osa B1-tason ylittävistä sanoista on todennäköisesti opiskelijan pääteltävissä ja osan sanoista opiskelija saattaa tunteakin, koska todennäköisesti moni B2-tason sana on tullut esiin venäjän opintojen aikana.

Miten ei-äidinkieliset voisivat pärjätä A-venäjän ylioppilaskokeessa paremmin

Sanastoanalyysin otoksen perusteella näyttää siltä, että alle 10 % A-venäjän ylioppilaskokeen luetun ymmärtämisen osion sanoista olisi tuntemattomia A-venäjää opiskelevalle. On kuitenkin syytä todeta, että luetun ymmärtämisen osion tekstiin liittyvien monivalintatehtävien satunnaisotoksissa B1-tason ylittävien sanojen prosenttiosuus kaikista sanoista ylitti jokaisessa otoksessa selvästi 10 % eli oli korkeampi kuin itse luetun ymmärtämisen tekstissä. Mikäli koetta haluttaisiin helpottaa yksinkertaisella tavalla, sen voisi tehdä valitsemalla monivalintoihin helpompaa sanastoa. Kokeen helpottaminen voisi mahdollisesti kannustaa ei-äidinkielisiä osallistumaan A-venäjän ylioppilaskokeeseen. Kuten aiemmin todettiin, tällä hetkellä suurin osa A-venäjän ylioppilaskokeen kirjoittajista puhuu venäjää äidinkielenään, kotikielenään tai toisena äidinkielenään, minkä takia ei-äidinkielisten voi olla vaikea saada ylioppilaskokeesta hyviä arvosanoja. A-venäjän opettajille suunnatun kyselyn vastauksista ilmenee, että kokeen vaativuus ja arviointi vaikuttavat ei-äidinkielisten opiskelijoiden motivaatioon suorittaa A-venäjän ylioppilaskoe. Ylioppilaskoetta helpottamalla voitaisiin osoittaa ei-äidinkielisille, että myös heillä on mahdollisuus saada hyviä arvosanoja ylioppilaskokeesta.

Hyvän arvosanan saamiseen A-venäjän ylioppilaskokeesta ei vaikuta pelkästään kokeen vaikeustaso ja se, onko opiskelija saavuttanut tavoitetason, vaan myös kokeen arviointi. Se, että valtaosalla kokeeseen osallistujista taitotaso on huomattavan korkea äidin- tai kotikielisen taustan ansiosta, nostaa pisterajoja. Tämä puolestaan vaikeuttaa korkeimpien arvosanojen saavuttamista niiden opiskelijoiden kohdalla, joilla ei ole venäjänkielistä taustaa ja jotka kenties ansaitsisivat hyvän arvosanan ylioppilaskokeesta. Ranskan ja saksan ylioppilaskokeiden vaatimustasoa selvittäneet Juurakko-Paavola ja Takala (2013) ehdottavat ratkaisuksi arvosanojen epäsuhtaan sitä, että saksan ja ranskan ylioppilaskokeissa luovuttaisiin normaalijakaumasta, jolloin opiskelija saisi tietyn arvosanan saavutettuaan tietyn kielitaidon tason. A-venäjän opettajille suunnatun kyselyn vastauksissa esiintyi toistuvasti toiveita siitä, että venäjää vieraana kielenä opiskelevilla olisi paremmat mahdollisuudet saada kokeesta hyvä arvosana. Lisäksi kyselyn vastauksissa tuli ilmi, että A-venäjän ryhmissä on opiskelijoita hyvin erilaisista kielitaustoista.

Eri kielitaustoista tulevien opiskelijoiden muodostamat ryhmät hankaloittavat opetuksen eriyttämistä. Kyselytulosten perusteella A-venäjän opetuksessa on hyödyllistä kiinnittää huomiota sanaston omaksumiseen ja hallintaan. Joidenkin tutkijoiden mukaan (esim. Vermeer 2000) sanojen yleisyydellä on yhteys sanojen vaikeusasteeseen. Yleisimmille sanoille löytyy eniten käyttöä, joten kielten opetuksessa kannattaa huomioida sanojen frekvenssi niissä tekstilajeissa, joita opiskelijoiden odotetaan aikanaan hallitsevan aktiivisesti tai passiivisesti. Asian huomioiminen kielten opetuksessa helpottuisi, jos oppikirjan tuottajat tarjoaisivat osana oppimateriaalipakettia frekvenssilistan sanoista, jotka esiintyvät paketissa ja sen osissa – mukaan lukien audio- ja videomateriaalit. A-venäjän oppimateriaalin kehittämisen tärkeys nousi esille myös A-venäjän opettajille tehdyssä kyselyssä, kun heiltä kysyttiin, miten venäjää vieraana kielenä opiskelevia voisi kannustaa suorittamaan A-venäjän ylioppilaskokeen.

 

Johanna Lähteinen toimii venäjän ja englannin kielen lehtorina Turengin yhteiskoulussa ja lukiossa Janakkalassa.

 

Lähteet

Juurakko-Paavola, Taina & Takala, Sauli 2013. Ylioppilastutkinnon kielikokeiden tulosten sijoittaminen lukion opetussuunnitelman perusteiden taitotasoille. Ylioppilastutkintolautakunta.

Laufer, Batia & Nation, Paul 1999. A Vocabulary-size test of controlled productive ability. Language Testing, 16, 33–51.

Lukion opetussuunnitelman perusteet 2003. Opetushallitus.

Nikunlassi, Ahti & Lähteinen, Johanna 2017. Sanasto on liian vaikeaa. Tempus 1/2017, 10–12.

Sharoff, Serge, Umanskaya, Elena & Wilson, James 2013. A Frequency Dictionary of Russian: core vocabulary for learners. Routledge. (verkkoversio: corpus.leeds.ac.uk/serge/kelly)

Tidball, Françoise & Treffers-Daller, Jeanine 2008. Analysing lexical richness in French learner language: what frequency lists and teacher judgements can tell us about basic and advanced words. French Language Studies, 18, 299–313.

Vermeer, Anne 2000. Coming to grisps with lexical richness in spontaneous speech data. Language Testing, 17, 65–83.