Sitaatin matka aineistosta sanakirjaan
Vanhan kirjasuomen
sanakirjassa ovat keskeisessä asemassa
sitaatit Ruotsin vallan aikaisista julkaisuista. Tekstikatkelmat valaisevat
kunkin sanan merkityksiä ja käyttötapoja sekä niiden muutoksia kahden ja puolen
vuosisadan mittaan. Toimittajien keksimiä esimerkkejä sanakirjassa ei siis ole.
Valitessaan sitaatteja yksittäiseen sana-artikkeliin toimittaja pyrkii kokoamaan kattavan otoksen sanan käyttötavoista eri aikoina. Jos sana sisältyy vakiintuneisiin sanontatapoihin eli idiomeihin tai sananparsiin, tällaiset käytöt poimitaan myös mukaan.
Monenlaista aineistoa
Toimituksen käytössä on useanlaista aineistoa. Tärkeimpiä päivittäisessä työssä ovat noin
550 000 paperista sanalippua
käsittävä arkisto sekä noin 3,5 miljoonaa sanetta eli yksittäistä
sanaesiintymää käsittävä sähköinen
korpus, josta voi tehdä erilaisia hakuja.
Lisäksi toimittajat hyödyntävät alkuperäisteoksia, niiden valokopioita sekä noin 5 miljoonan saneen digitoitua aineistoa, joka on käytettävissä kuvatiedostoina. Niistä ei pysty siis tekemään hakuja, mutta niistä voi tarkistaa sitaattien oikeinkirjoituksen sekä etsiä lisää kontekstia ja apua lyhyiden esimerkkikatkelmien tulkintaan.
Oleellinen esiin massasta
Sanaliput ovat toimittajalle ensisijainen aineisto, jota hän täydentää korpushauilla. Korpuksen käytön apuvälineenä toimittajalla on oman aakkosvälinsä korpussanelista, josta näkyvät aakkosvälin sanojen kaikki korpukseen sisältyvät ja eri kirjoitusasuiset taivutusmuodot lukumäärineen.
Kun esiintymiä on vähän, ne kannattaa hakea kaikki, mutta kun niitä on paljon, hakua kannattaa rajata. Esimerkiksi olla-verbistä on korpuksessa satoja eri muotoja ja tuhansia yksittäisiä esiintymiä. Toimittaja tarvitsee myös luovuutta ennakoidessaan, millä kaikilla tavoilla työn alla olevaa sanaa on aikoinaan saatettu kirjoittaa; esimerkiksi o-alkuisia sanoja on kirjoitettu myös å-alkuisina.
Sanakirjaan otetaan mukaan myös sellaiset sanat, joista aineistossa on vain yksi esiintymä tai joiden käytöstä on tietoa vain vanhoissa sanakirjoissa. Varsinkin tällaisten ainokaisesiintymien merkityksestä voi olla vaikeaa saada varmuutta, mutta toimittaja joutuu usein muulloinkin selvittelemään sanan merkitystä monenlaisesta lähdekirjallisuudesta. Merkitysten selitteet pohjautuvat silti aina aineistoon itseensä, eivät vanhojen sanakirjojen tietoihin.