Siirry sisältöön

Kotimaisten kielten keskuksen Nykysuomen sanalista on Kielitoimiston sanakirjan hakusanoihin perustuva, päivitettävä sanalista. Siinä on yli satatuhatta taivutus- ja sanaluokkatiedoin varustettua sanaa.

Sanalista on ladattavissa alla olevasta linkistä:

Sanalista ei ole tyhjentävä tai normatiivinen luettelo suomen kielen sanoista. Sen on tarkoitus muun muassa toimia apuvälineenä suomen kieltä käsittelevien tietokoneohjelmien ja suomenkielisten käyttöliittymien kehitystyössä.

Sanalista on CSV-muodossa, ja merkistönä on UTF-8. Listaa päivitetään Kielitoimiston sanakirjan päivitysten yhteydessä vuoden tai kahden välein, ja siihen voidaan tehdä muitakin muutoksia. Sanalista julkaistaan lisenssillä Creative Commons Nimeä 4.0 Kansainvälinen (CC BY 4.0).

Sanatietueiden elementit

Sanatietue koostuu seuraavista tiedoista: 1) hakusana, 2) homonymia, 3) sanaluokka ja 4) taivutus.

Lista-sanoja sanalistalta ja Kielitoimiston sanakirjasta. Kuva: Ilona Paajanen, Kotus.

1. Hakusanat

Hakusanat on poimittu Kielitoimiston sanakirjasta sellaisinaan. Hakusanoja koskevat muut tiedot löytyvät asianomaisista sana-artikkeleista. Tällaisia muita tietoja ovat muun muassa ääntämisohjeet, rinnakkaiset kirjoitusasut, käyttöalat, tyylisävyt, merkitykset, suositukset ja tyypilliset fraasi-ilmaukset, joissa sana esiintyy.

Erityisesti on huomattava, että sanan esiintyminen Nykysuomen sanalistassa ei tarkoita sen yleistä hyväksyttävyyttä kaikissa tilanteissa: sanan käyttöala voi olla esimerkiksi arkikielinen tai sen sävy halventava tai vanhahtava. Sanalle saatetaan myös suosittaa toisenlaista kirjotusasua. Joihinkin sanoihin liittyy tavaramerkki, ja sekin tieto on mainittu Kielitoimiston sanakirjassa esiintyvän sana-artikkelin yhteydessä.

2. Homonymia

Homonymia tarkoittaa toisiinsa liittymättömien sanojen satunnaista samannäköisyyttä (esim. kilo merkityksessä ’kimmellys’ ja kilo merkityksessä ’kilogramma’). Sanalistan homonymianumerot viittaavat järjestysnumeroihin, joilla Kielitoimiston sanakirjassa on merkitty homonyymiset hakusanat.

3. Sanaluokat

Sanaluokka on merkitty samoin kuin Kielitoimiston sanakirjassa. Sanaluokat ovat:

  • substantiiviadjektiivipronomininumeraali (näitä kutsutaan yhdessä nomineiksi)
  • verbi (erikseen kieltoverbi ei)
  • adverbiprepositiopostpositiokonjunktiointerjektio (näitä kutsutaan yhdessä partikkeleiksi)

Lisäksi on huomioitu seuraavat erikoistapaukset: 

  • niin kutsutut sulaumat adverbi + kieltoverbi (esim. miksei), alistuskonjunktio + kieltoverbi (esim. ettei), rinnastuskonjunktio + kieltoverbi (muttei)
  • yhdistelmä kieltoverbi + rinnastuskonjunktio (eikä)

Yhdellä sanalla voi olla useamman sanaluokan mukaista käyttöä, jolloin sanaluokat luetellaan pilkuin erotettuna (esim. alankomaalainen adjektiivi, substantiivi). Osa adverbeista ja muista partikkeleista on kiteytyneitä taivutusmuotoja (esim. rinnalla postpositio, adverbi; vrt. rinta substantiivi).

Kaikille sanoille ei ilmoiteta sanaluokkaa. Vailla sanaluokkaa ovat yhdyssanojen alkuosina esiintyvät hakusanat (esim. ammatti-, hehto-) ja eräät sanaliitot (esim. alla mainittualun alkaen).

4. Taivutustiedot

Taivutustiedoissa olevat numerot viittaavat sanan taivutustyyppeihin ja kirjaimet astevaihtelutyyppeihin. Taivutustyypit ja astevaihtelutyypit esitellään Kielitoimiston sanakirjan Lukuohjeissa (ks. Taivutustyyppitaulukko, Astevaihtelutaulukko). Taipuvien sanojen taivutustiedot annetaan samassa muodossa kuin itse sanakirjan artikkeleissa. Jotkut sanat taipuvat useammalla kuin yhdellä tavalla, jolloin vaihtoehdot on erotettu toisistaan pilkuin.

Jos adverbi tai muu vajaasti taipuva sana esiintyy useammassa kuin yhdessä paikallissijassa, muut muodot mainitaan olosijaisen muodon yhteydessä, esim. rinnalla (myös paikallissijamuodot rinnalta, rinnalle).

Yhdyssanoissa ei tavallisesti ole taivutustietoja, koska ne taipuvat perusosansa mukaisesti (esim. hyökyaalto taipuu kuten aalto). Yhdyssanaan on merkitty taivutustieto, jos perusosaa vastaavaa hakusanaa ei ole (esim. aikaansaava) tai jos se on homonyyminen (esim. tupajumi). Mikäli yhdyssubstantiivin määriteosa on adjektiivi, taivutusindeksillä 50 tai 51 osoitetaan, taipuuko adjektiivi substantiivin mukana (esim. isoäiti : isoäidin, ei isonäidin, mutta isovarvas isonvarpaan tai isovarpaan).

Lisäksi käytetään kolmea erikoiskoodia:

99 = sana ei taivu tai taipuu vaillinaisesti

100 = sana on kirjoitettu väärin; oikeinkirjoitusohje löytyy sanan sana-artikkelista (esim. enään pitää olla: enää)

101 = sana on pronomini, jolla on epäsäännöllinen taivutus

Esimerkki aineistosta

HakusanaHomonymiaSanaluokkaTaivutustiedot
aakkonensubstantiivi38
haperoadjektiivi, substantiivi 2
isovarvassubstantiivi51, 50
itse kukinpronomini101
jotteialistuskonjunktio + kieltoverbi 99
juhlaillallinensubstantiivi
jumi1substantiivi5
jumi2substantiivi5
vihantaadjektiivi10*J, 9*J
vuotaaverbi53*F, (54*F)

Sanalistaan viittaaminen

Nykysuomen sanalista. Kotimaisten kielten keskus. Päivitetty 30.4.2024 [viitattu xx.xx.xxxx]. Saatavissa https://kaino.kotus.fi/lataa/nykysuomensanalista2024.csv

Sanalistan vuosiluku vastaa sen Kielitoimiston sanakirjan version julkaisuvuotta, josta aineisto on poimittu.

Jaa