DigiTala toiminnaksi – mobiilisovellus puhumisen harjoitteluun
Julkaistu 11. helmikuuta 2026 | Kirjoittaneet: Elina Nurminen, Riikka Ullakonoja, Mikko Kuronen ja Minka Lindroos
Projektin taustaa
DigiTala-hankkeessa (2019–2023) tutkittiin suomea ja ruotsia toisena kielenä puhuvien lukiolaisten ja yliopisto-opiskelijoiden suullista kielitaitoa sekä puhumisen automaattista arviointia näissä puhujaryhmissä. Hankkeessa syntyi lukuisia tutkimuksia suullisen kielitaidon automaattisesta arvioinnista (ks. esim. Al-Ghezi ym. 2023; von Zansen ym. 2022) sekä arviointiväline, joka antaa automaattisen arvion oppijan puhetuotoksesta. Arvio koskee yleistä taitotasoa, tiettyjä analyyttisia piirteitä sekä tehtävästä suoriutumista (von Zansen & Kallio 2024; Hilden ym. 2025). Nyt käynnissä oleva DigiTala toiminnaksi – Automaattinen puhumisen arviointi kotoutumista edistämässä jatkaa DigiTalassa aloitettua työtä.
Suullisen kielitaidon automaattinen arviointi (automatic speaking assessment, ASA) perustuu automaattiseen puheentunnistukseen (automatic speech recognition, ASR), jonka avulla puhesignaali muunnetaan tekstiksi. Kun kielenoppija tekee puhetehtäviä esimerkiksi tietokoneella, akustinen puhesignaali pilkotaan puheentunnistuksen lisäksi numeerisiksi piirteiksi, jotka kuvaavat puheesta arvioitavia kriteerejä. Nämä kriteerit kuvaavat useimmiten puheen sujuvuutta (mm. puhenopeus ja taukojen kesto ja määrä), ääntämistä (vokaalien, konsonanttien ja prosodisten piirteiden hallinta), sanaston laajuutta ja kielen rakenteiden hallintaa. Kriteerien hallintaa kuvaavat piirteet yhdistetään toisiinsa ja niistä muodostetaan kokonaisarvio eli yleinen taitotaso laskennallisten mallien avulla. Mallit perustuvat ihmisasiantuntijoiden arvioihin kielenoppijoiden puheesta. Kun järjestelmä saa uuden puhenäytteen arvioitavaksi, se vertaa malliensa avulla puhenäytettä ihmisten arvioimiin näytteisiin ja antaa vertailun perusteella arvionsa uudesta näytteestä. (ks. esim. von Zansen ym. 2022.)
Kun suurista puhetietokannoista on opetettu tarkkoja puhemalleja, tarvitaan nykyään pienempiä määriä käsin annotoitua dataa, jotta automaattista puheentunnistusta ja automaattista arviointia pystytään kehittämään aiempaa paremmin myös suomen kaltaisille, puhujamäärältään pienille kielille (Al-Ghezi ym. 2023). Viime vuosien aikana myös suurten kielimallien (large language models, LLM) hyödyntäminen on helpottanut pienempien kielten automaattisen arvioinnin kehittämistä (Phan ym. 2024a, Voskoboinik ym. 2025).
DigiTala toiminnaksi = DigiTala in Action = DTA
DTA-hankkeella on Proof of Concept eli tutkimuksen hyödyntämisen rahoitus, jonka tavoitteena on edetä tutkimuksesta kohti yhteiskunnallista ja taloudellista vaikuttavuutta. DTA:ssa hyödynnetään DigiTala-hankkeessa tehtyä tutkimusta ja saatuja kokemuksia ja kehitetään suomenoppijoiden puheen automaattista arviointia. Hankkeessa yhdistyvät kielididaktiikan, kielitaidon arvioinnin, fonetiikan, kieliteknologian ja koneoppimisen asiantuntemus.
DTA:n keskeinen tavoite on kehittää mobiilisovellus suomen kielen puhumisen harjoitteluun. Pääkohderyhmänä ovat kotoutumiskoulutuksen oppijat, jotka voivat käyttää sovellusta itsenäisesti ja saada siten harjoitusta suomen kielen puhumisessa, mutta sovellus on toki kaikkien suomenoppijoiden käytettävissä. Oppijat saavat lisää harjoitusta puhumiseen voidessaan tehdä puhetehtäviä riippumatta ajasta ja paikasta ja saadessaan niistä palautetta. Kotoutumiskoulutuksen opettajat tietysti teettävät monenlaisia puheharjoituksia ja rohkaisevat puhetilanteisiin ja vuorovaikutukseen niin luokassa kuin sen ulkopuolellakin (Seppä & Ahlholm 2024), mutta kuten esim. Seppälä (2025) toteaa, monilla oppijoilla ei ole ympärillään ihmisiä, joiden kanssa suomea voisi käyttää ja harjoitella. Kanssapuhujilta saa myös harvoin palautetta puheesta, ja kynnys harjoitella puhumista sovelluksen avulla voi varsinkin kielen oppimisen alkuvaiheessa olla matalampi kuin aidossa vuorovaikutuksessa.
Puhumisen harjoitteluun on jo erilaisia (tekoäly)sovelluksia. Usein monikielisten mobiilisovellusten suomenkielisessä versiossa on vähän tehtäviä ja ääntämisen mallit ovat koneellisesti tuotettuja ja siksi epäluonnollisia (Kotilainen ym. 2022). Jotkin sovellukset voivat tarjota hyvän mahdollisuuden harjoitella, mutta niiden antamat kielitaitoarviot ja palautteet ovat vähäisiä tai olemattomia sekä epäluotettavia. Suomen ja ruotsin ääntämisen harjoitteluun on olemassa jo sovelluksia, joita DTA-hankkeessakin mukana olevat tutkijat ovat olleet kehittämässä (ks. Phan ym. 2023, Phan ym. 2024b ja Phan ym. 2025). Nämä sovellukset tosin arvioivat ja antavat palautetta vain ääntämisestä, kun taas DTA-hankkeessa kehitettävä sovellus antaa yleisen taitotasoarvion sekä palautetta. Palaute pyritään suunnittelemaan siten, että se on mahdollista ymmärtää vähäiselläkin kielitaidolla; tämä voi tarkoittaa visuaalista esitysmuotoa sekä selkokielisiä, lyhyitä palautetekstejä. Ideariihessä on pohdittu lisäksi mm. mahdollisuutta kuunnella oma vastaus, lukea se tekstinä, nähdä/kuulla mallivastaus ja saada vinkkejä oppimiseen. Hankkeen tiiviin aikataulun vuoksi keskitymme tärkeimpiin kehityskohteisiin, ja sovelluksen muut oppimista tukevat ominaisuudet ovat mahdollinen mukava lisä.
Ensimmäinen vuosi: puhenäytteistä pilottiin
Aikaisemmassa DigiTala-hankkeessa kerätyllä aineistolla olemme opettaneet arviointivälinettä tunnistamaan suomenoppijan puhetta ja arvioimaan sitä. Tuolloin osallistujat olivat suomenoppijoita eri lukioista ja yliopistoista. DTA-hankkeen kohderyhmä, kotoutumiskoulutukseen osallistuvat suomenoppijat, sijoittuu taitotasoltaan arviolta A1–A2-tasoille, ja osa saavuttaa koulutuksen loppuvaiheessa tavoitetasoksi määritellyn B1.1-tason (Opetushallitus 2022). Jotta mobiilisovelluksessa käytettävä arviointiväline harjaantuisi juuri tämän kohderyhmän puheen arvioimiseen, projektin ensivaiheessa olemme keskittyneet uuden aineiston keräämiseen. Tämä aineisto koostuu alkeistason oppijoiden puhenäytteistä, ihmisarvioijien niille antamista arvioinneista ja puhenäytteiden litteraateista. Lisäksi osallistujat sekä puhenäytteiden arvioijat ovat vastanneet kyselyihin, joiden vastauksia hyödynnetään mobiilisovelluksen suunnittelussa ja kehittämisessä.
Puhenäytteet kerättiin Moodlessa, joka toimii myös kotoutumiskoulutuksen päättötestin alustana; DTA:n Moodle suunniteltiin samaan tyyliin, jotta osallistujille tarjoutuisi lisämahdollisuus harjoitella Moodlen käyttöä. Moodlessa oli kuusi erilaista puhetehtävää: yksi ääneen lukemisen tehtävä (sama kuin DigiTala-hankkeessa), yksi kerro kuvasta -tehtävä, kaksi reagointitehtävää ja kaksi kertomistehtävää. Kaikki osallistujat tekivät kaikki tehtävät. Tehtävät suunniteltiin siten, että ne olisivat osallistujille teemoiltaan tuttuja sekä ohjeistuksensa puolesta mahdollisimman selkeitä ja ymmärrettäviä; tässä auttoi tehtävien suunnittelijan pitkä S2-opetuskokemus. Tärkeää oli huomioida sekin, että jo A1-tason oppijat pystyisivät tekemään tehtävät.
Tässä kaksi esimerkkiä puhetehtävistä (Nurminen, 2025):
- Reagointitehtävä, vastausaika 30 sekuntia: Sinä et voi tulla tänään kurssille/töihin. Sinä lähetät ääniviestin opettajalle/pomolle ja kerrot, miksi et voi tulla. Mitä sinä sanot viestissä?
- Kertomistehtävä, vastausaika 1 minuutti: Kerro, mitä kaikkea sinä teet normaalisti kotona.
Ennen puhetehtävien tekemistä osallistujat tutustuivat tutkimukseen liittyviin materiaaleihin joko itsenäisesti tai oman opettajansa kanssa. Tätä tarkoitusta varten tiedotteet ja ohjeet kirjoitettiin selkosuomeksi, ja osallistujia kannustettiin hyödyntämään kääntäjiä, jotta tutkimuksen vaiheet sekä paikoin haastava sanasto suostumuslomakkeesta tietosuojaselosteeseen olisivat helpommin ymmärrettävissä. Annettuaan suostumuksen osallistujat saivat tunnukset ja pääsyn Moodleen, jossa puhetehtävät tehtiin opettajan valvonnassa ilman mitään apuvälineitä, kuten puhelimia, muistiinpanovälineitä tai oppimismateriaaleja. Tämä vaihe oli syy siihen, miksi osallistujia etsittiin opettajien kautta: arviointivälineen opettamiseksi on tärkeää, että puhe on autenttista alkeistason tuotosta kaikkine virheineen ja epäröinteineen, ei virheetöntä ja muodollista käännössovelluksen avulla suunniteltua puhetta. Puhetehtävät tehtyään osallistujat vastasivat vielä kyselyyn, jossa kääntäjää taas sai käyttää apuna.
Osallistujien rekrytointi alkoi vuoden 2025 helmikuussa Opetushallituksen avulla, ja projektista tiedotettiin Opetushallituksen järjestämissä kotoutumiskoulutuksen päättötestin koulutustilaisuuksissa. Lisäksi osallistujien etsimisessä hyödynnettiin sosiaalista mediaa sekä suoria kontakteja mm. kotoutumiskoulutuksen suomenopettajiin. Osallistujien saaminen osoittautui yllättävän haastavaksi: luultavasti kotoutumiskoulutuksen opettajat ovat olleet erityisen työllistettyjä uuden päättötestin tiimoilta. Joidenkin kiinnostuneiden osalta kompastuskiveksi muodostui tutkimusluvan saaminen: oppilaitoksesta saatettiin kehottaa kääntymään kaupungin puoleen ja kaupungilta todettiin, etteivät he vastaa oppilaitoksen tutkimusluvista. Lopulta puhetehtävät teki kuitenkin yhteensä 83 opiskelijaa viidestä eri oppilaitoksesta, ja kaiken kaikkiaan olemme saaneet 438 puhenäytettä.
Kaikki puhenäytteet on litteroitu ja arvioitu vähintään kolmen ihmisarvioijan toimesta. Arviointeja hyödynnetään, kun kehitämme mobiilisovelluksen arvioinnissa käytettäviä laskennallisia malleja. Mukana olleet 15 ihmisarvioijaa ovat suomen opetuksen ammattilaisia eri oppilaitoksista ja koulutusasteilta sekä lisäksi kokeneita arvioijia. Osa heistä on ollut mukana jo DigiTala-hankkeessa, ja kaikki arvioijat ovat arvioineet myös saman konsortion Aasis-hankkeen (Ullakonoja ym. 2025) puhenäytteitä. Ensimmäinen arviointikierros järjestettiin syys-lokakuussa, toinen joulu-tammikuussa, ja arvioinnit tehtiin Moodle-alustalla. Ennen arvioinnin aloitusta arvioijille järjestettiin Zoomissa arviointikoulutus, jossa käytiin läpi sekä puhetehtävät että arviointikriteerit.
Käytetty arviointiasteikko (Nurminen ym. 2025) perustuu EVK:n taitotasokuvauksiin, ja se painottuu kohderyhmän mukaisesti alkeistasolle. Arviointiasteikkoa laatiessa tutustuimme myös kotoutumiskoulutuksen päättötestin arviointikriteereihin, koska ajatuksena on, että mobiilisovellusta voisi hyödyntää myös päättötestiin harjoitellessa. DTA-hankkeessa ja päättötestissä arvioidaan samoja piirteitä ja päättötestissä lisäksi viestinnällisyyttä, joka ei meidän teettämissämme monologitehtävissä ole relevantti. Taitotasojen osalta DTA-hankkeen arviointiasteikko on melko yhteneväinen päättötestin asteikon kanssa, vaikkakin hankkeessa taitotasoja on mukana hieman enemmän. Käyttämissämme taitotasokuvauksissa (Euroopan neuvosto 2020) on mukana ns. välitasoja, kuten esimerkiksi A2+, ja halusimme ottaa sen mukaan: se voisi antaa mobiilisovelluksen avulla suomea harjoittelevalle hieman lisätietoa kielitaidon tasosta. Alustavasti näyttää siltä, että A2+-taso on ollut ihmisarvioijille hieman haastava, joten nähtäväksi jää, onko se mukana valmiissa mobiilisovelluksessa.
Toinen vuosi: mobiilisovellusta kehittämään
Puhetehtävien tekemisen jälkeen osallistujat vastasivat kyselyyn, jolla haluttiin kartoittaa osallistujien ajatuksia puhumisen harjoittelusta sekä heidän juuri tekemistään puhetehtävistä. Kyselyvastaukset antavat meille tärkeitä näkökulmia mobiilisovelluksen kehittämiseen. Kysely oli saatavilla suomeksi ja englanniksi, ja tarjosimme mahdollisuuden vastata siihen millä tahansa kielellä. Ajattelimme, että tällä kertaa me voisimme käyttää kääntäjää vastauksia läpikäydessä. Avoimiin kysymyksiin vastattiin kuitenkin pääasiassa suomeksi ja jonkin verran englanniksi. Kyselyyn vastasi 79 osallistujaa, jotka ovat iältään enimmäkseen alle 40-vuotiaita (77 %) ja naisia (71 %). Vastaajista 92 % on muuttanut Suomeen vuosina 2022–2025, näistä vuonna 2025 14 prosenttia. Äidinkielikseen osallistujat mainitsivat 31 eri kieltä; suurimmat kieliryhmät olivat ukraina (23), venäjä (12), arabia (7) ja bengali (7).
Mobiilisovelluksen kehittämistä varten tärkeänä tuloksena voi pitää sitä, että 90 prosenttia vastanneista haluaisi harjoitella puhumista itsenäisesti samantyylisillä puhetehtävillä. Lisäksi osallistujista 91 % kertoo käyttävänsä kääntäjää ja 72 % tekoälyä kielen opiskelussa. Tämän voi tulkita positiivisena suhtautumisena teknologian hyödyntämiseen kielenoppimisen tukena. Vapaissa kommenteissa muutamat osallistujat ilmaisivat suoraan positiivisen suhtautumisensa tulevaa mobiilisovellusta kohtaan:
- “Se on mielenkiintoinen tehtävä, luulen, että tämä projekti voi auttaa oppimaan paremman suomea opiskelijoita.”
- “The project is very good and it helps a lot for us who starts to speak finnish.”
- “This app's module might improve my fear to talk to people.”
- “Minä pidän tämän testin. Haluan lisää harjoitella. Kiitos teille!”
Koska DTA-hanke on kaksivuotinen, vuosi 2026 on täynnä toimintaa. Kevään ajan keskitymme arviointivälineen opettamiseen kerätyn aineiston avulla ja kehitämme mobiilisovellusta. Helsingin yliopiston tietojenkäsittelytieteen opiskelijat ovat mukana kehittämässä käyttöliittymää osana ohjelmistotuotantoprojektiaan, tiiviissä yhteistyössä DTA-hankkeen tutkijoiden kanssa. Tavoitteena on, että pääsemme loppukesästä pilotoimaan mobiilisovellusta sekä keräämään arvokkaita käyttäjäkokemuksia niin suomenoppijoilta kuin heidän opettajiltaankin. Käyttäjäkokemusten perusteella mobiilisovellusta voidaan vielä kehittää ja hioa: erityisen tärkeää on saada käyttäjiltä tietoa siitä, millaisen palautteen he kokevat hyödyllisimmäksi. Kun kaikki toivon mukaan etenee suunnitellusti, on mobiilisovellus vuoden ja projektin lähestyessä loppuaan valmis ja kaikkien vapaasti käytettävissä.
Suomen Akatemia rahoittaa DTA-hanketta vuosina 2025–2026 (päätösnumerot 365232, 365233, 365234).
Konsortion hankkeiden nettisivut:
DigiTala toiminnaksi -hanke: https://www.helsinki.fi/fi/projektit/digitala-toiminnaksi
AASIS-hanke: https://www.helsinki.fi/fi/projektit/vieraskielisen-suullisen-vuorovaikutuksen-automaattinen-arviointi
Elina Nurminen on projektitutkija Jyväskylän yliopistossa.
Riikka Ullakonoja on yliopistotutkija Jyväskylän yliopistossa.
Mikko Kuronen on yliopistonlehtori Jyväskylän yliopistossa.
Minka Lindroos oli v. 2025 DTA-hankkeen projektisuunnittelija Helsingin yliopistossa ja työskentelee nyt Ylioppilastutkintolautakunnassa.
Lähteet
Al-Ghezi, R., Voskoboinik, K., Getman, Y., von Zansen, A., Kallio, H., Kurimo, M., Huhta, A., & Hildén, R. (2023). Automatic Speaking Assessment of Spontaneous L2 Finnish and Swedish. Language Assessment Quarterly 20(4–5), 421–444. https://doi.org/10.1080/15434303.2023.2292265
Euroopan neuvosto (2018). Common European framework of reference for languages: Learning, teaching, assessment. Companion volume with new descriptors. https://rm.coe.int/cefr-companionvolume-with-new-descriptors-2018/1680787989
Euroopan neuvosto (2020). Common European Framework of Reference for Languages: Learning, Teaching, Assessment – Companion Volume. https://rm.coe.int/common-european-framework-of-reference-for-languages-learning-teaching/16809ea0d4
Hilden, R., Kuronen, M., Voskoboinik, E., Getman, Y. & Kurimo, M. (2025). Developing a digital tool for L2 speaking assessment in low-resourced languages. Studies in Language Assessment, 14(2), 1–27. https://doi.org/10.58379/ROXO3257
Kotilainen, L., Sundvall, E., Komppa, J., Niinivaara, J. & Udd, T. (2022). Edistyneen suomenoppijan digitaaliset oppimateriaalit – nykytilanne ja uusia suuntia. Kieli, koulutus ja yhteiskunta, 13(3). https://www.kieliverkosto.fi/fi/journals/kieli-koulutus-ja-yhteiskunta-toukokuu-2022/edistyneen-suomenoppijan-digitaaliset-oppimateriaalit-nykytilanne-ja-uusia-suuntia
Nurminen, E. (2025). DTA speaking tasks for Finnish L2 learners (Finnish). https://zenodo.org/records/18326435
Nurminen, E., Ullakonoja, R., Hilden, R., Kuronen, M., & Kurimo, M. (2025). DTA rating criteria for monologue speech (in Finnish). https://doi.org/10.5281/zenodo.17587686
Phan, N., Grósz, T. & Kurimo, M. (2023). CaptainA – A mobile app for practising Finnish pronunciation. In Proceedings of the 24th Nordic Conference on Computational Linguistics (NoDaLiDa), 265–270. Tórshavn, Faroe Islands. University of Tartu Library.
Phan, N., von Zansen, A., Kautonen, M., Voskoboinik, E., Grosz, T., Hilden, R., Kurimo, M. (2024a). Automated content assessment and feedback for Finnish L2 learners in a picture description speaking task. Proc. Interspeech 2024, 317–321.
Phan, N., von Zansen, A., Kautonen, M., Grósz, T. & Kurimo, M. (2024b). CaptainA self-study mobile app for practising speaking: task completion assessment and feedback with generative AI. Proc. Interspeech 2024, 5212–5213.
Phan, N., Kuronen, M., Kautonen, M., Ullakonoja, R., von Zansen, A., Getman, Y., Voskoboinik, E., Grósz, T. & Kurimo, M. (2025). Mispronunciation Detection Without L2 Pronunciation Dataset in Low-Resource Setting: A Case Study in Finland Swedish. Proc. Interspeech 2025, 2435–2439.
Opetushallitus (2022). Kotoutumiskoulutuksen opetussuunnitelman perusteet. Helsinki: Opetushallitus. https://www.oph.fi/sites/default/files/documents/Kotoutumiskoulutuksen_opetussuunnitelman_perusteet_2022_1.pdf
Seppä, M. & Ahlholm, M. (2024). Puhuminen ja kirjoittaminen kotoutumiskoulutuksessa. Suomenopettajien näkemyksiä taitojen kehittymisestä ja tukemisesta. Aikuiskasvatus (44), 22–35. https://doi.org/10.33336/aik.131890
Seppälä, T. (2025). ”Kielioppiminen ei koskaan riitä." Kotoutumiskoulutus suomen kielen oppimisympäristönä ja kielitaidon kehittämisen mahdollisuudet vuosi sen jälkeen. Väitöskirja. Jyväskylän yliopisto. https://urn.fi/URN:ISBN:978-952-86-1139-4
Ullakonoja, R., Lähteenmäki, I., Raud, N., Phan, N., Grósz, T., Suuronen, H., Hilden, R., Kurimo, M., Kuronen, M., Von Zansen, A., & Kautonen, M. (2025). Building the foundations for automatic assessment of verbal and nonverbal aspects of spoken interaction in Finnish as a second language. Studies in Language Assessment, 14(2), 28–57. https://doi.org/10.58379/FFNO9141
von Zansen, A., Kallio, H., Sneck, M., Kuronen, M., Huhta, A., & Hildén, R. (2022). Ihmisarvioijien näkemyksiä suullisen kielitaidon automaattisesta arvioinnista, digitaalisesta arviointiprosessista sekä puhesuorituksista arvioitavista ulottuvuuksista. AFinLA 2022 (79), 370–394. https://doi.org/10.30661/afinlavk.114821
von Zansen, A. & Kallio, H. (2024). DigiTala – Moodle-sovellus suullisen kielitaidon automaattiseen arviointiin. AFinLA-teema (17), 91–116. https://doi.org/10.30660/afinla.131465
Voskoboinik E., von Zansen A., Phan N., Getman Y., Grósz T. & Kurimo M. (2025). Enhancing second language speaking assessment: Integrating large language models for Finnish and Finland Swedish proficiency scoring. Language Testing, 42(4), 508–538. https://doi.org/10.1177/02655322251351648
