Sana-aineistot
Kotimaisten kielten keskuksessa on laajat sanakokoelmat. Kokoelmissa on muun muassa suomen kielen murteita, vanhaa kirjasuomea ja slangia.
Nykysuomen sana-aineistot
Nykysuomen sana-arkisto koostuu yli 5,5 miljoonan sanalipun kokoelmasta, jota käytetään ensisijaisesti sanakirjatyön tarpeisiin. Arkiston tiedot on koottu pääosin kirjallisista lähteistä.
Sana-arkiston vanhin aineisto on koottu pääosin 1900-luvun alun lähteistä Nykysuomen sanakirjan (1951–1961) toimittamista varten. Sähköisen sana-arkiston eli Nykysuomen sanatietokannan vanhimmat lähteet ovat vuodelta 1984. Sanatietokantaa kartutetaan jatkuvasti, ja sitä hyödynnetään Kielitoimiston sanakirjan toimitustyössä.
Suomen murteiden sana-arkisto
Sanakokoelmista suurimpia ovat Suomen murteiden sana-arkiston kokoelmat. Niihin on kerätty 1900-luvun alusta alkaen miljoonia sanatietoja.
Suomen murteiden sanakirjaa toimitetaan Suomen murteiden sana-arkiston kokoelmien perusteella. Sanakirjasta on ilmestynyt kahdeksan painettua osaa (a–kurvottaa). Nykyisin sanakirja ilmestyy verkossa.
Sananparsikokoelma
Suomen murteiden sana-arkistoon kuulunut sananparsikokoelma luovutettiin Kansallisarkistoon vuonna 2016. Sananparsikokoelma on digitoitu Kansallisarkistossa ja se on käytettävissä arkistolaitoksen digitaaliarkistossa.
Osa sananaparsista on korpusmuodossa. Ne ovat vapaasti käytettävissä Kotimaisten kielten keskuksen verkkosivuilla. Sananparsista korpusmuodossa ovat Alatornion, Enon, Evijärven, Hailuodon, Hausjärven, Isonkyrön, Joutsenon, Juvan, Kalannin, Kivennavan, Kuhmoisten, Kurkijoen, Laukaan, Loimaan, Nivalan, Nummen, Paltamon, Pälkäneen, Riistaveden, Rovaniemen, Ruoveden, Tyrvään, Ulvilan ja Valkealan kokoelmat. Kiuruveden kokoelmasta mukana on noin kolmannes.
Vanhan kirjasuomen sanat
Vanhan kirjasuomen sanakirjaa tehdään noin puoli miljoonaa sanalippua käsittävän aineiston pohjalta. Rinnakkaisaineistona käytetään nykyään myös sähköistä tekstikorpusta. Vanhan kirjasuomen sanakirjasta on ilmestynyt kaksi painettua osaa, aakkosväli a-k, nykyisin sanakirja ilmestyy verkossa.
Karjalan sanoja
Yli puoli miljoonaa sanalippua sisältävä Karjalan kielen sana-arkisto on digitoitu. Alkuperäinen aineisto on siirretty 2016 Itä-Suomen yliopistoon.
Slangisanat
Kotimaisten kielten keskus on ollut mukana keräämässä talteen Stadin slangin eli Helsingin perinteisen puhekielen aineistoa. Slangia on pyritty tallentamaan suhteellisen säännöllisesti viimeisten viidenkymmenen vuoden aikana.