Esitän alkajaisiksi muutamia kysymyksiä:
Kuinka paljon Suomessa tuotetaan tekstejä eri kielillä?
Mihin kielenkäyttötilanteisiin ja kielimuotoihin nämä tekstit liittyvät?
Mitä tekstilajeja tuotokset edustavat?
Käytetäänkö joitain kieliä etupäässä sosiaalisessa mediassa tai puhuttuna?
Näihin kysymyksiin, ja moniin muihin vastaavanlaisiin, kaivattaisiin vastauksia. Tällä hetkellä tiedämme melko vähän Suomessa puhuttavien kielten käytöstä, jos tarkastelemme kielitilannetta kokonaisuutena. Kansalliskielten eli suomen ja ruotsin käyttöä tunnemme parhaiten, minkä ymmärtää niiden yhteiskunnallisen aseman takia. Suomen ja englannin kielen käyttöä selvitetään paraikaa – hankkeina.
Meidän pitäisi tietää enemmän. Paljon enemmän. Nykyään vaaditaan tietoon perustuvaa päätöksentekoa. Tietoa maamme kielten käytöstä tarvitaan muun muassa kielensuunnittelun ja päätöksenteon pohjaksi.
Mutta onhan meillä kielitilasto!
Jo olemassa olevaa tilastotietoa kielenpuhujien määristä ja kieliyhteisöjen koosta on tarjottu vastaukseksi edellä esittämiini kysymyksiin. Suomella ja Ruotsilla onkin maineikas historia tällä alalla. Näissä maissa on kerätty ensimmäisenä maailmassa systemaattista tilastotietoa yhteiskunnasta. Tilastollinen päätoimisto (nyk. Tilastokeskus) perustettiin vuonna 1865. Suomen väestötilastoinnissa on koko sen historian ajan esitetty jossain laajuudessa maan kielisuhteita ja kielenkäyttäjien äidinkielten määriä.
Yleisluonteisella tilastotiedolla on arvonsa, mutta toisaalta tällaisen tiedon käytöllä on myös rajoituksensa. Ilkikurisen sanonnan mukaan tilasto on peräti ”valheen superlatiivimuoto” – valhe, emävalhe, tilasto. Oikein ymmärrettynä massatietoakin voi toki hyödyntää moniin tarkoituksiin.
Selvää kuitenkin on, ettei tieto kieltenpuhujien määrästä riitä, kun pureudumme seikkaperäisemmin kielten käyttöön ja yhteisölliseen esiintymiseen. Kysykäämme esimerkiksi, minkälaisissa tilanteissa kieltä käytetään ja minkäkielisiä kirjoitettuja tekstejä näissä tilanteissa syntyy. Väestötietoon nojaava kielitilasto ei kerro höykäsen pölähdystä esimerkiksi palveluissa käytettävistä kielistä.
Jatkuvasti päivitettävää tietoa
Mikä avuksi? Kotimaisten kielten keskus on hallitusohjelma-avauksissaan esittänyt, että tulisi luoda pysyvä rakenne maan kielitilanteen jatkuvaa seurantaa ja kielten käytön systemaattista tarkastelua varten. Tulisi rakentaa seurannan infrastruktuuri.
Kerrallisen hankerahoituksen sijaan tarvitaan pysyvyyttä, sillä tietoa on kerättävä vuodesta toiseen. Kielitilanne muuttuu jatkuvasti, minkä tähden työtä on tehtävä pitkittäisseurantana. Jotta muutos voidaan havaita, tutkimuskohteita on seurattava kaiken aikaa. Seurannan on oltava pysyvää sekä menetelmällisesti tunnettua ja samanlaista vuodesta toiseen.
Millainen tämä infrastruktuuri voisi olla? Se voisi sisältää esimerkiksi jatkuvasti päivitettävän tietokannan tai rekisterin, josta olisi mahdollista seurata kielen käyttöä eri tilanteissa eri aikoina. Erityisesti tarvitsemme tietoa kirjoitettujen tekstien määrän muutoksista eri tekstilajeissa. Esimerkiksi tällaiset kysymykset ovat olennaisia: Kuinka paljon tekstejä on olemassa jollakin tietyllä kielellä, ja mitä tekstilajeja ne edustavat? Millaisissa tilanteissa kieltä käytetään? Onko kielestä käytössä eri kielimuotoja, joista jokin on viestinnässä hallitsevampi?
Sosiaalinen media on keskeinen osa viestintäkulttuuria, ja se on tullut osittain puhutun kielen tontille. Eri kielimuotoja tutkimalla voidaan saada tarkempi kuva varsinkin vähemmistökielten käytöstä. Vähemmistökielen kirjallinen traditio voi olla vasta aluillaan; siitäkin tarvitaan lisävalaistusta.
Infrastruktuurin rakentamiseen ja kielten käytön seurantaan tarvitaan eri alojen ja toimijoiden yhteistyötä. Erityisesti kaivataan sosiologista ymmärrystä kielistä ja yhteisöistä sekä kieliteknologiaa. Erilaisten seurantamenetelmien kehittäminen ja toiminnan automatisointi kuuluvat luonnollisesti nykyaikaan.