Ei päivää ilman tekoälyyn törmäämistä! Perinteinen media uutisoi siitä; sosiaalinen media suorastaan tulvii sitä. Kaikkia muniaan ei kuitenkaan kannata panna tekoälykoriin. Jos esimerkiksi haluaa todenmukaista tietoa sanojen merkityksistä ja käyttöyhteyksistä, kannattaa suunnata tekoälypalveluiden sijaan osoitteeseen kielitoimistonsanakirja.fi.

Kielitoimiston sanakirja on laajin ja ajantasaisin nykysuomea kuvaava sanakirja. Sitä toimitetaan Kotimaisten kielten keskuksessa kuuden kokeneen suomen kielen ammattilaisen voimin. Huolelliseen, pitkäjänteiseen toimitustyöhön sisältyy muun muassa runsaasti taustatutkimusta ja useita tarkistuskierroksia ennen uusien artikkelien julkaisemista. Kielitoimiston sanakirja pohjautuu Kotuksen laajoihin, jatkuvasti kartutettaviin nykysuomen sana-aineistoihin.

Oikeilla jäljillä

Tein pikavertailun muutamilla Kielitoimiston sanakirjan hakusanoilla, jotka julkaistiin sanakirjan edellisessä, vuoden 2024 päivityksessä. Mitä sanoja tekoäly osaa selittää sujuvasti? Missä se kompuroi?

Verbin fasilitoida selittämisestä erään tunnetun hakukoneen tekoälytyökalu selviytyy vielä kelvosti. Kielitoimiston sanakirjassa verbi on määritelty seuraavasti: ”ohjata vars. jnk määrätavoitteen saavuttamiseksi kootun ryhmän työskentelyä ja vuorovaikutusta”. Niin sanotun AI-tiivistelmän mukaan fasilitoida tarkoittaa ryhmän toiminnan helpottamista, edistämistä tai tukemista siten, että ryhmä saavuttaa yhteisen tavoitteensa. – Riittävän lähellä, vaikka vähän toisteisuutta onkin havaittavissa.

Myöskään kulttuurisota-sanan avaamisessa samainen tekoälytyökalu ei mene juurikaan metsään, vaan ydinsanoma seurailee Kielitoimiston sanakirjan selitettä ”voimakkaista ideologisista vastakkainasetteluista vars. liberaalien ja konservatiivien välillä”. Samoin tunturipeura pysyy mallikkaasti sanakirjassa kuvaillulla reviirillään (”Etelä-Norjassa ja Kuolan niemimaalla elävä peuran alalaji, josta puolikesy poro on polveutunut”).

Kuka ymmärtää kyökkikieltä?

Jo neljännen testisanan kyökkikieli kohdalla törmään kuitenkin tekoälyn ongelmiin, ja koneen antama selitys sanalle on suorastaan virheellinen. Hakukoneen AI-kylkiäinen väittää muun muassa, että kyökkikieli olisi ”humoristinen termi, jolla viitataan tiettyjen ammattialojen, kuten keittiöalan, erikoisterminologiaan tai slangiin, joita ymmärtävät vain kyseisen alan sisäpiiriläiset”.

Tosiasiassa kyökkikieli on tyyliltään arkinen ilmaus, jolla viitataan sanavarastoltaan ja käyttöalaltaan suppeaan, rakenteeltaan yksinkertaiseen kieleen. Näillä sanoin merkitys on selitetty Kielitoimiston sanakirjassa.

Merkityseron lisäksi tekoälytiivistelmässä tökkää silmään termi-sanan epämääräinen käyttö. Termi ei todellisuudessa tarkoita millaista sanaa tai ilmausta tahansa, vaan jonkin erikoisalan käsitteen vakiintunutta nimitystä, ammattisanaa. Arkikielinen kyökkikieli ei siten täytä termin kriteerejä.

Kyökin tarpeistoa. Kuva: Ilona Paajanen, Kotus.

Loppumattomat vs. luotettavat lähteet

Generatiiviset tekoälyt pohjautuvat kielimalleihin, joissa taustalla oleva niin sanottu neuroverkko ennustaa aina seuraavan sanan – eli käytännössä esittää valistuneen arvauksen. Vaikka tekoäly osuu monesti oikeaan, läheskään kaikki sen tuottama sisältö ei ole todenmukaista tai edes järkevää, koska se hyödyntää vain todennäköisyyksiä.

Kotuksen vuoden 2024 sanapoimintoihin nostettiin mukaan verbi hallusinoida (engl. hallucinate), jolla on kuvattu tekoälyn toimintaa. Tekoälyn sanotaan hallusinoivan, kun se vastaa sille osoitettuihin kehotteisiin tuottamalla epärealistisia tai järjettömiä vastauksia.

Tekoäly ei siis ole sanakirja eikä edes tietosanakirja. Turvallisemman kumppanin saat, kun tallennat Kielitoimiston sanakirjan selaimesi kirjanmerkkeihin. Mikäli kielipulmaasi ei löydy ratkaisua sanakirjasta, apua voi etsiä esimerkiksi Kielitoimiston ohjepankista, Kielikellosta tai Kotuksen kielineuvonnasta. Toisin kuin tekoälytyökaluissa, meillä viesteihin vastaa korkeasti koulutettu, kriittisesti ajatteleva ihminen.

Lähteet vastakkain. Kuvat: Minna Pyhälahti ja Ilona Paajanen. Muokkaus: Ilona Paajanen, Kotus.

Jaa