Siirry sisältöön
Haku

rss 10 kysymystä kielestä 2024

27.2.2024 12.30

”Kieliteknologian tutkimus on pitkään painottunut englannin kieleen”

Jenna Kanerva toimii suomenkielisten koneoppimismenetelmien parissa.

Jenna Kanerva.

1. Milloin ja miten sinusta tuli kieli-ihminen?

Vahingossa. Opiskelin pääaineenani tietojenkäsittelytieteitä, mutta alan perinteiset kanditutkielman aiheet eivät oikein napanneet. Kandiopintojeni aikaan tekoälystä ja koneoppimisesta ei juuri puhuttu. Mietiskelin pitkään, mikä aihe oikeasti kiinnostaisi, kunnes keksin, että haluaisin tietää, miten Googlen käännösohjelma toimii. Lähestyin tämän aiheen kanssa seminaarin vetäjiä, joilta sain kuulla, että Turun yliopistolla on kieliteknologiaan suuntautunut tutkimusryhmä. Sillä tiellä olen edelleen, kandi toki on jo valmistunut.

2. Mikä sinua erityisesti kiinnostaa äidinkielessäsi tai muissa kielissä?

Kielessä on mielestäni kiehtovaa se, miten pieni muutos, joissakin tapauksissa jopa yksittäinen kirjain, voi muuttaa merkityksen täysin. Toisaalta taas saman informaation voi ilmaista hyvinkin monin eri tavoin täysin eri sanoja, kielioppirakenteita ja tekstityylejä käyttäen. Tämä tekee kielestä koneoppimisdatana kiehtovaa ja luo kiinnostavia haasteita kieliteknologian tutkimukseen.

3. Miten kieliasiat ovat läsnä jokapäiväisessä elämässäsi?

Työni puolesta olen lähes päivittäin tekemisissä kieliaineistojen kanssa. Se, miltä etäisyydeltä katsomme kieltä, riippuu täysin sen hetkisistä työtehtävistä. Välillä prosessoimme koneellisesti laajoja tekstiaineistoja, jolloin kieli muuntuu numeroiksi ja todennäköisyyksiksi. Välillä taas koostamme ja annotoimme käsin koneoppimiseen tarkoitettuja tekstikorpuksia, jolloin saatamme keskustella yksityiskohtaisesti yksittäisistä sanavalinnoista ja niiden vaikutuksesta esimerkiksi virkkeen merkitykseen.

4. Mitä ajattelet tämänhetkisestä kielimaisemastamme? Entä kielen muutoksesta?

Kielen ylläpitäminen muuttumattomana ei mielestäni ole toivottua eikä tarkoituksenmukaista. Toki jonkinlaisten suhteellisen hitaasti muuttuvien kielenkäyttöraamien on oltava olemassa, jotta osaamme tuoda asiamme esille ymmärrettävästi niissä tilanteissa, joissa se on tarpeen. Jokainen voi halutessaan lipsua näistä raameista sopivaksi katsomissaan tilanteissa. Kielenkäytön erilaisuus on rikkaus, vaikka toki kieliteknologia olisi huomattavasti helpompaa, jos kielenkäyttö olisi hyvin tarkkarajaisesti määrätty.

5. Katsotko pystyväsi vaikuttamaan siihen, miten kieleen ja eri kieliin Suomessa suhtaudutaan?

Toivon, että kieliteknologian tutkimuksellamme on mahdollistava vaikutus. On valitettava tosiasia, että suhteellisen pienet kielet eivät ole resurssien ja teknologioiden puolesta yhtä tuettuja kuin suuremmat kielet, ja kaikkia toimintoja ei ole saatavilla pienten kielten käyttäjille. Tämä voi ohjata käyttämään arjessa entistä enemmän esimerkiksi englantia, jolloin ajatus oman äidinkielen roolista heikkenee.

Meillä TurkuNLP:ssä on aina ollut tärkeää huomioida erityisesti suomen kieli, ja toivonkin, että tutkimuksemme parantaa suomen kielen käytettävyyttä myös niissä tilanteissa, joissa teknologia on mukana. Kieliteknologian tutkimus on valitettavan pitkään painottunut vahvasti englannin kieleen, ja toivon suomen kielen esille tuomisen hyödyttävän myös muita pieniä kieliä.

6. Mitä mieltä olet Suomessa nykyään käytävästä kielikeskustelusta?

Tähän voisin ehkä vastata viime aikoina pinnalla olleen kielimallikeskustelun pohjalta, ja tuoda esille, että kieliteknologia on paljon muutakin kuin vain suuria kielimalleja.

7. Mikä on mielestäsi kielessä kauneinta ja kauheinta?

Vierasperäiset sanat ja ilmaisut monesti mainitaan kauheana asiana. En ole kova vierasperäisten ilmaisujen vastustaja, ja tiedostan käyttäväni niitä itsekin varsinkin silloin, kun kirjoitan jostain teknisemmästä aiheesta. Mutta täysin tavallisten sanojen korvaamista englanninkielisillä vastineilla yritän välttää. Toisaalta, on mielestäni kaunista, miten suomenkieliseen puheeseen voi upottaa vieraskielisen yrityksen nimen ihan vaan lausumalla sen suomen kirjoitusasun mukaan (esim. Finnair).

8. Jos olisit kielenkäytön laji tai tekstilaji, mikä laji olisit?

Ytimekäs asiateksti. Olen enemmän lukija ja kuuntelija kuin kirjoittaja ja puhuja. En koe olevani erityisen lahjakas kielellisessä ilmaisussa, joten sanon asiat mieluusti ytimekkäästi ja faktoissa pitäytyen.

9. Jos joutuisit autiolle saarelle ja saisit ottaa mukaan yhden kirjan, minkä kirjan ottaisit?

On monia kirjoja, jotka olen lukenut useampaan kertaan, ja tietyt kirjat luen aina säännöllisin väliajoin uudelleen. Käyttäisin kuitenkin tilanteen hyödyksi ja ottaisin mukaan kirjan, jonka olen jo pitkään halunnut lukea. Kotoa löytyy esimerkiksi Väinö Linnan Tuntematon sotilas, joka voisi olla hyvä vaihtoehto.

10. Mitä muuta haluat sanoa jutun lukijoille?

Lisää kieliteknologiasta löytyy tutkimusryhmän kotisivuilta.


Jenna Kanerva on kieliteknologian väitöskirjatutkija TurkuNLP-tutkimusryhmässä Turun yliopistossa. Hänen väitöstutkimuksensa keskittyy koneoppimismenetelmien soveltamiseen suomenkielisten tekstien analysoinnissa ja ymmärtämisessä. Koneoppimisen ohella hän on osallistunut useiden suomen kielen kieliteknologiakorpusten annotointiin ja kokoamiseen.

Toimitus: Olli Tamminen

Palaa otsikoihin