Nykysuomen sanalista
Kotimaisten kielten keskuksen Nykysuomen sanalista on Kielitoimiston sanakirjan hakusanoihin perustuva, päivitettävä sanalista. Siinä on yli satatuhatta
taivutus- ja sanaluokkatiedoin varustettua sanaa.
Sanalista on ladattavissa alla olevasta linkistä:
Sanalista ei ole tyhjentävä tai normatiivinen luettelo suomen kielen sanoista. Sen on tarkoitus muun muassa toimia apuvälineenä suomen kieltä käsittelevien tietokoneohjelmien ja suomenkielisten käyttöliittymien kehitystyössä.
Sanalista on CSV-muodossa, ja merkistönä on UTF-8. Listaa päivitetään Kielitoimiston sanakirjan päivitysten yhteydessä, ja siihen voidaan tehdä muitakin muutoksia. Sanalista julkaistaan lisenssillä Creative Commons Nimeä 4.0 Kansainvälinen (CC BY 4.0).
Palaa otsikoihinSanatietueiden elementit
Sanatietue koostuu seuraavista tiedoista: 1) hakusana, 2) homonymia, 3) sanaluokka ja 4) taivutus.
1. Hakusanat
Hakusanat on poimittu Kielitoimiston sanakirjasta sellaisinaan. Hakusanoja koskevat muut tiedot löytyvät asianomaisista sana-artikkeleista. Tällaisia muita tietoja ovat muun muassa ääntämisohjeet, rinnakkaiset kirjoitusasut, käyttöalat, tyylisävyt, merkitykset, suositukset ja tyypilliset fraasi-ilmaukset, joissa sana esiintyy.
Erityisesti on huomattava, että sanan esiintyminen Nykysuomen sanalistassa ei tarkoita sen yleistä hyväksyttävyyttä kaikissa tilanteissa: sanan käyttöala voi olla esimerkiksi arkikielinen tai sen sävy halventava tai vanhahtava. Sanalle saatetaan myös suosittaa toisenlaista kirjotusasua. Joihinkin sanoihin liittyy tavaramerkki, ja sekin tieto on mainittu Kielitoimiston sanakirjassa esiintyvän sana-artikkelin yhteydessä.
2. Homonymia
Homonymia tarkoittaa toisiinsa liittymättömien sanojen satunnaista samannäköisyyttä (esim. kilo merkityksessä ’kimmellys’ ja kilo merkityksessä ’kilogramma’). Sanalistan homonymianumerot viittaavat järjestysnumeroihin, joilla Kielitoimiston sanakirjassa on merkitty homonyymiset hakusanat.
3. Sanaluokka
Sanaluokka on merkitty samoin kuin Kielitoimiston sanakirjassa. Sanaluokat ovat:
- substantiivi, adjektiivi, pronomini, numeraali (näitä kutsutaan yhdessä nomineiksi)
- verbi (erikseen kieltoverbi ei)
- adverbi, prepositio, postpositio, konjunktio, interjektio (näitä kutsutaan yhdessä partikkeleiksi)
Lisäksi on huomioitu seuraavat erikoistapaukset:
- niin kutsutut sulaumat adverbi + kieltoverbi (esim. miksei), alistuskonjunktio + kieltoverbi (esim. ettei), rinnastuskonjunktio + kieltoverbi (muttei)
- yhdistelmä kieltoverbi + rinnastuskonjunktio (eikä)
Yhdellä sanalla voi olla useamman sanaluokan mukaista käyttöä, jolloin sanaluokat luetellaan pilkuin erotettuna (esim. alankomaalainen adjektiivi, substantiivi). Osa adverbeista ja muista partikkeleista on kiteytyneitä taivutusmuotoja (esim. rinnalla postpositio, adverbi; vrt. rinta substantiivi).
Kaikille sanoille ei ilmoiteta sanaluokkaa. Vailla sanaluokkaa ovat yhdyssanojen alkuosina esiintyvät hakusanat (esim. ammatti-, hehto-) ja eräät sanaliitot (esim. alla mainittu, alun alkaen).
4. Taivutustiedot
Taivutustiedoissa olevat numerot viittaavat sanan taivutustyyppeihin ja kirjaimet astevaihtelutyyppeihin. Taivutustyypit ja astevaihtelutyypit esitellään Kielitoimiston sanakirjan Lukuohjeissa (ks. Taivutustyyppitaulukko, Astevaihtelutaulukko). Taipuvien sanojen taivutustiedot annetaan samassa muodossa kuin itse sanakirjan artikkeleissa. Jotkut sanat taipuvat useammalla kuin yhdellä tavalla, jolloin vaihtoehdot on erotettu toisistaan pilkuin.
Jos adverbi tai muu vajaasti taipuva sana esiintyy useammassa kuin yhdessä paikallissijassa, muut muodot mainitaan olosijaisen muodon yhteydessä, esim. rinnalla (myös paikallissijamuodot rinnalta, rinnalle).
Yhdyssanoissa ei tavallisesti ole taivutustietoja, koska ne taipuvat perusosansa mukaisesti (esim. hyökyaalto taipuu kuten aalto). Yhdyssanaan on merkitty taivutustieto, jos perusosaa vastaavaa hakusanaa ei ole (esim. aikaansaava) tai jos se on homonyyminen (esim. tupajumi). Mikäli yhdyssubstantiivin määriteosa on adjektiivi, taivutusindeksillä 50 tai 51 osoitetaan, taipuuko adjektiivi substantiivin mukana (esim. isoäiti : isoäidin, ei isonäidin, mutta isovarvas : isonvarpaan tai isovarpaan).
Lisäksi käytetään kolmea erikoiskoodia:
99 = sana ei taivu tai taipuu vaillinaisesti
100 = sana on kirjoitettu väärin; oikeinkirjoitusohje löytyy sanan sana-artikkelista (esim. enään pitää olla: enää)
101 = sana on pronomini, jolla on epäsäännöllinen taivutus
Esimerkki aineistosta
Hakusana | Homonymia | Sanaluokka | Taivutustiedot |
---|---|---|---|
aakkonen | substantiivi | 38 | |
hapero | adjektiivi, substantiivi | 2 | |
isovarvas | substantiivi | 51, 50 | |
itse kukin | pronomini | 101 | |
jottei | alistuskonjunktio + kieltoverbi | 99 | |
juhlaillallinen | substantiivi | ||
jumi | 1 | substantiivi | 5 |
jumi | 2 | substantiivi | 5 |
vihanta | adjektiivi | 10*J, 9*J | |
vuotaa | verbi | 53*F, (54*F) |
Sanalistaan viittaaminen
Nykysuomen sanalista. Kotimaisten kielten keskus. Päivitetty 30.4.2024 [viitattu xx.xx.xxxx]. Saatavissa https://kaino.kotus.fi/lataa/nykysuomensanalista2024.csv
Sanalistan vuosiluku vastaa sen Kielitoimiston sanakirjan version julkaisuvuotta, josta aineisto on poimittu.