Ajankohtaista kielipolitiikasta
Kieliteknologia teemana Pohjoismaisessa kielikokouksessa
Digitaalisia aineistoja, avointa dataa ja yhteistyötä.
Elokuun lopussa järjestettiin 65. Pohjoismainen kielikokous verkkotapaamisena. Kokous on osa kielenhuoltoelinten pohjoismaista yhteistyötä, jossa Kotimaisten kielten keskus on keskeinen tekijä.
Kokouksen teema oli kieliteknologia ja sen hyödyntäminen. Voisiko kieliteknologian avulla parantaa sekä Pohjoismaiden virallisten kielten että pienten Pohjoismaissa puhuttujen kielten asemaa? Entä kuinka kieliteknologia voisi helpottaa niiden ihmisten elämää, joilla on kielellisen prosessoinnin vaikeus, esimerkiksi heikentynyt kuulo tai näkö taikka lukemisen ja kirjoittamisen pulmia?
Esityksiä kuultiin kaikista Pohjoismaista, ja niissä oli paljon yhteisiä teemoja. Tarkastelen tässä konferenssin antia puhujamäärältään pienten kielten näkökulmasta. Käsittelen viittä kysymystä, joita sivuttiin monissa esityksissä ja joiden voi katsoa olevan erityisen merkittäviä pienten kielten elinvoimaisuuden turvaamiseksi.
Kieliaineistojen tarve
Kieliaineistoja ei voi olla koskaan liikaa. Useimmiten niitä on liian vähän. Esityksissä korostettiin laadukkaiden ja riittävän laajojen kieliaineistojen merkitystä kieliteknologialle. Aineistosaralla on toki tehty paljon (muun muassa Kielipankki), mutta runsaasti on vielä tehtävää.
Kieli luo ehtymättömästi uutta. Se on kielenpuhujan onni, mutta koneen riesa. Kielen eri varieteettien eli kielimuotojen ymmärtäminen sujuu koneelta heikosti, ainakin toistaiseksi. Kieliteknologiassa tarvitaan isoja tekstiaineistoja, joihin voi perustaa algoritmeja, analyysivälineitä ja ohjelmistoja. Raakaa dataa on oltava tarjolla riittävästi, jotta siitä voidaan jalostaa toimivia kieliteknologisia ratkaisuja erilaisiin kielenkäyttötilanteisiin.
Koneita ja laitteita ohjataan yhä enemmän puheen avulla. Puhutun nykykielen aineistot ovat tärkeitä, jotta kone voidaan opettaa tunnistamaan puhetta paremmin.
Ylen ja Helsingin yliopiston toteuttama Lahjoita puhetta -kampanja kerää aineistoa puheen tunnistuksen kehittämiseksi. Aineistoa tarvitaan, jotta muun muassa ääniohjatut laitteet voisivat oppia ymmärtämään erilaisia puhetapoja. Suomenkielistä aineistoa on tällä hetkellä noin 4 000 tuntia. Kokouksessa kuultiin, että Lahjoita puhetta -kampanja laajenee myös ruotsin ja saamen kieleen.
Digitalisaation hyödyntäminen
Digitalisaatio on päivän sana! Kieliteknologia ja digitalisaatio käyvät käsi kädessä. Hieman kärjistäen voi todeta, että pienet (uhanlaiset) kielet eivät voi pysyä hengissä ilman digitalisaatiota. Digitaaliset (avoimet) aineistot ovat kieliteknologian edellytys. Kaikkien toimijoiden pitäisi päästä hyödyntämään aineistoja.
Digitalisaatio liittyy olennaisesti myös kielen opettamiseen (tätä aihetta vain sivuttiin kokouksessa). Digitointi tekee materiaalin saavutettavaksi paikasta ja ajasta riippumatta. Harvinaisen kielen opettaminen ja oppiminen voi tapahtua nykyään sujuvasti myös verkossa. Pienten kielten opetukseen kehiteltävät verkkoratkaisut voivat levitä yleiseen käyttöön. Kokouksessa ei kuultu esitystä peliteollisuudesta, mutta on selvää, että kielenoppimisen pelillistäminen sekä lapsille ja nuorille suunnatut tietokonepelit muodostavat merkittävän käyttökohteen pienelle kielelle.
Televisio-ohjelmien tekstittäminen parantaa palveluiden saavutettavuutta. Puheenvuoroissa kuultiin, että puheentunnistus ja sitä hyödyntävä automaattinen tekstitys ovat tässä avainasemassa. Puheentunnistuksen kehittäminen on tapetilla useissa pienissä kielissä. Suorien lähetysten tekstittäminen on tuloillaan, ja tekstitysten laatua parannetaan kaiken aikaa. Muunkielisen puheen automaattinen tekstittäminen pienille kielille mediassa avaisi merkittävän lisämahdollisuuden kirjoitettuun viestintään.
Avoimuus
Toiminnan avoimuus on pienten kielten kieliteknologian kehittämisessä eduksi, jollei peräti sen elinehto. Tarvitaan avointa dataa ja myös avoimeen koodiin perustuvia ratkaisuja. Vapaasti kehiteltävissä olevat ohjelmistot tuovat asiasta innostuneita yhteen. Kun avoimia aineistoja voi hyödyntää vapaasti, syntyy parviälyä ja synergiaetuja. Maksu- ja koodimuurit sopivat huonosti yhteen pienten kielten kieliteknologian kanssa.
Data on rahaa. Iso ja kaupallisesti hyödynnettävä kielidata kiinnostaa monia, mutta sitä vastoin pienten kielten aineistojen hyödyntäminen ei innosta samalla lailla. Teknologiajätit eivät oitis kiinnostu aiheesta, koska ne eivät näe toiminnassa taloudellisen voiton mahdollisuutta. Tästä seuraa, ettei aineistoja voi ylläpitää markkinaehtoisesti, vaan yhteiskunnan ja tutkijayhteisöjen rooli niiden hallinnoijana korostuu. Yhteiskunnan näkyvää roolia tarvitaan avoimuuden takaamiseksi.
Yhteistyö
Kieliteknologian kehittämiseksi tarvitaan hyvin monenlaista yhteistyötä: maiden välistä, kielten välistä ja tutkimusalojen välistä. Yliopistojen, tutkimusorganisaatioiden ja liiketoiminnan yhteistyössä on vielä sarkaa kyntämättä. Maaperä on kuitenkin otollinen, sillä yhteistyöstä voi muodostua tilanne, josta kaikki hyötyvät.
Hyvää kannattaa jakaa, hyödyt kertautuvat! Pieniä kieliä, varsinkin uhanalaisia kieliä, yhdistävät monet tekijät. Näitä ovat ennen kaikkea niukat tutkimusresurssit, vaatimaton tutkimusinfrastruktuuri sekä ammattitaitoisten tekijöiden ja aineistojen puute. Apu ongelmiin voi löytyä myös tiedon jakamisesta, prosessien kertomisesta ja toimintatapojen levittämisestä.
Toimiva kieliteknologinen ratkaisu yhdellä pienellä kielellä voi säteillä toiseen, vaikkei se olisikaan suoraan hyödynnettävissä. Pohjoismaisen kielikokouksen kaltaiset tilaisuudet ovat hyvin tärkeitä tiedon jakamisen näyttämöjä!
Resurssien turvaaminen
Pienet
kielet tarvitsevat tukea. Useissa puheenvuoroissa kävi selväksi, että resursseja kaivataan (lisää). Tarvitaan tutkimusresursseja, panostusta
tutkimusinfrastruktuuriin (erityisesti kieliaineistoihin) ja ammattiosaajia.
Pohjoismailla on verraten yhteneväiset kielipoliittiset tavoitteet. Niissä korostuu yhteiskunnan rooli vähemmistökielten tukijana. Pelkkä yhteiskunnan tuki ei kuitenkaan riitä, sillä materiaalisella tuella voi ainoastaan luoda edellytyksiä ja tarjota mahdollisuuksia kielen käyttöön. Kieliyhteisön ja kielenkäyttäjien aktivoiminen tunnistetaan nykyisin avainkysymykseksi pienen kielen elinvoimaisuuden takaajana. Tätäkin tavoitetta voi edistää muun muassa näissä kielikokouksissa.
MATTI RÄSÄNEN
Lisätietoa kokouksesta
- Kieliteknologiaa pohjoismaisessa kielikokouksessa (Ajankohtaista kielenhuollosta, 9.8.2021)
- Nordiskt språkmöte om språkteknologi (Språknytt, 30.6.2021)
- Charlotta af Hällström-Reijonen: Språkteknologi tema för Nordiska språkmötet