Suomen murteiden sana-arkisto koostuu laajasta pääkokoelmasta, kansatieteellisestä aineistosta sekä joukosta erilliskokoelmia. Arkisto perustuu siihen materiaaliin, jota 1900-luvun alussa alettiin kerätä kansankielen sanakirjaa (nyk. Suomen murteiden sanakirja) varten.
Ajatus kansankielen sanakirjasta sisältyy Emil Nestor Setälän vuonna 1896 esittämään sanakirjaohjelmaan, jonka mukaan tieteellisiin tarpeisiin tuli toimittaa paitsi yleiskielen ja vanhan kirjasuomen myös kansankielen sanakirja, joka esittelisi tyhjentävästi suomen murteiden sanavarat, sanojen murremuodot ja niiden levikit. Kun Setälän ehdotus hyväksyttiin, hankkeen toteuttajaksi ryhtyi Suomalaisen Kirjallisuuden Seura.
Vuosina 1916–1924 hankkeen taloudellisesta puolesta huolehti Suomen kielen sanakirjaosakeyhtiö, vuosina 1924–1976 Sanakirjasäätiö ja vuodesta 1976 lähtien se on kuulunut Kotimaisten kielten keskuksen (aik. Kotimaisten kielten tutkimuskeskus) eli Kotuksen ohjelmaan. Aineksia ovat koonneet sekä koulutetut kerääjät että lehdissä, erityisesti 1927–1990 julkaistussa Sanastajassa esitettyihin kyselyihin vastanneet kirjeenvaihtajat.
Myös murteenkeruukilpailuja on järjestetty. Joukossa on lisäksi opinnäytetöinä kerättyjä sanatietoja ja kirjallisuudesta poimittua murreaineistoa.
Pääkokoelma
Suomen murteiden sana-arkistossa (SMSA) on yli 8 miljoonaa murresanatietoa noin 400 000 sanasta. Murreaines käsittää kaikki rajojemme sisäpuolella puhuttavat suomalaismurteet sekä entiset kannakselais- ja inkeriläismurteet.
Aineksessa on mukana myös Ruotsin Länsipohjan ja Norjan Ruijan suomalaismurteet sekä Keski-Ruotsissa, Vermlannissa, asuneiden savolaislähtöisten suomalaisten jo kadonnut kielimuoto. Länsimurteiden alueelta tiedoista on noin 54,6 % ja itämurteiden noin 45,5 %.
Sanatiedot ovat arkistossa määrämuotoisilla sanalipuilla. Lipusta selviää parhaimmillaan sanan murreasu, taivutusmuotoja, merkitys ja käyttöyhteys. Kaikki liput eivät tosin ole yhtä täydellisiä. Lipuista ilmenee lisäksi tiedon lähettäjä, lähetysaika ja paikkakunta, jossa sanaa on käytetty. Jos tieto on vastaus kyselyyn, myös kyselyn numero on ilmoitettu.
Kaikkiin murresanalippuihin on kirjoitettu yleiskielistetty hakusana, ja liput on aakkostettu hakusanojen mukaan. Aines on arkistossa avohyllyissä.
Sananparsikokoelma
Suomen murteiden sana-arkistoon kuulunut sananparsikokoelma on luovutettu Kansallisarkistoon vuonna 2016. Sananparsikokoelma on digitoitu Kansallisarkistossa ja se on käytettävissä arkistolaitoksen digitaaliarkistossa.
Osa sananparsikokoelmasta on korpusmuodossa Kotimaisten kielten keskuksen verkkosivuilla vapaasti käytettävissä. Korpusmuodossa ovat Alatornion, Enon, Evijärven, Hailuodon, Hausjärven, Isonkyrön, Joutsenon, Juvan, Kalannin, Kivennavan, Kuhmoisten, Kurkijoen, Laukaan, Loimaan, Nivalan, Nummen, Paltamon, Pälkäneen, Riistaveden, Rovaniemen, Ruoveden, Tyrvään, Ulvilan ja Valkealan kokoelmat. Kiuruveden kokoelmasta on mukana noin kolmannes.
Kansatieteellinen aineisto
Kansatieteellisiä ynnä muita alkuperäisaineksia säilytetään osin omina lipustoinaan, osin kyselyvihkosiin merkittynä. Aineksista on murteellisesti kiinnostavat seikat kopioitu ja liitetty varsinaisiin kokoelmiin. Joukossa on myös valokuvia.
Kansatieteellisistä ja uskomuksellisista aineksista on olemassa noin 22 0000 sanalipun hakusanoitettu ja aakkostettu kokoelma.
Kansatieteelliset käsikirjoitukset
Kansanperinteeseen liittyviä käsikirjoituksia 1800- ja 1900-lukujen vaihteesta on arkistossa sidottuina kirjoina. Niiden aihealueita ovat esimerkiksi
- sanasto ja murteet
- ihmiselämä, vuotuisjuhlat, leikit, tavat, juhlat, hautaus
- metsästys, kalastus , maanviljelys, karjanhoito, tervanpoltto
- entisajan riihi
- naisten ja miesten tekniikka, työkalut, kulkuvälineet
- asutushistoria, rakennukset, kotitalous, ruokatalous, leipä.
Osa näiden sidosten sisällysluetteloista esitellään tämän sivun alasivuilla. Käsikirjoituksissa käsitellään tavallisesti jonkin tietyn paikkakunnan kansatieteellisiä ominaispiirteitä. Kattavan näkemyksen aineistosta saat vierailemalla arkistossa.
Erilliskokoelmat
Arkistossa on muun muassa seuraavista aihepiireistä erilliskokoelmat, jotka ovat lippumuotoisia, kuten pääkokoelmakin:
- Maija Juvaksen keräämää kansatieteellistä ja uskomuksellista sanastoa
- hyönteisten nimet
- kasvinnimet
- hevosten nimiä, lehmän nimiä
- rautatieläissanastoa
- kortinpeluu.
Arkistossa on säilytteillä myös muita pienempiä kokoelmia. Lisäksi arkistossa on lähinnä opinnäytetöiden sanastokarttoja noin 6 000 kappaletta. Karttoihin on erillinen hakemisto.
Arkistossa on kopiot Turun yliopistossa sijaitsevan Lauseopin arkiston aineistosta.
Synonyymikortisto
Tutkijan työtä helpottava apuneuvo on synonyymikortisto (140 000 korttia), joka on kerätty aikakauslehti Sanastajan kyselyihin tulleiden vastausten pohjalta. Kortistosta voi hakea murresanojen synonyymeja ja löytää muuta sanoihin liittyvää tietoa, kuten missä Sanastajan kyselyssä hakusanaa ja sen synonyymeja on kysytty.
Suomen murteiden sana-arkiston synonyymikortisto on saatavilla digitaalisessa muodossa Fairdata.fi-palvelussa. Aineistoa ei voi selata suoraan verkossa, vaan käyttäjän on ladattava pdf-tiedostot ensin omalle koneelleen.
Sanastoluettelot
Aiemman topografisen kortiston pohjalta on laadittu suomen murteiden sanastoluettelot, joista yhdyssanojen käänteisluettelo on käytettävissä paperiversiona arkistossa. Nämä yhdyssanojen käänteisluettelot on myös digitoitu.