Idea ja valmistelevat työt
Vanhan kirjasuomen sanakirjalla (VKS) on pitkä historia. Vanhemman kirjakielen sanakirja mainitaan jo Emil Nestor Setälän Suomalaisen sanakirjatyön ohjelmassa, jonka hän esitti Suomalaisen Kirjallisuuden Seuran kokouksessa vuonna 1896. Setälän esityksen mukaan sanakirjaan tulisi sisällyttää suomen kirjakielen sanavarasto sen vanhimmista muistomerkeistä aina Gustav Renvallin sanakirjan (Suomalainen Sana-Kirja – Lexicon Linguae Fennica, 1826) ilmestymiseen, mahdollisesti jopa ns. Vanhan Kalevalan ilmestymiseen (1835) saakka.
Sanakirjan varsinaiset esityöt aloitti kuitenkin vasta professori Martti Rapola 1950-luvulla. Vanhan kirjasuomen sanakirjatyötä esittelevässä artikkelissaan Virittäjässä (1958) Rapola rajasi sanakirjan käsittelemään vuotta 1809/1810 vanhempaa aineistoa, koska tuon ajankohdan jälkeen suomen kieli alkoi uudistua niin paljon, että myöhempien aineistojen mukaan ottaminen vääristäisi kuvaa vanhasta kirjasuomesta. Samassa kirjoituksessa Rapola myös esitti ensimmäiset yleiset luonnostelut sanakirja-artikkelien rakenteesta.
Aineiston kokoaminen
Aluksi työ oli lähinnä aineiston poimimista sanalippuihin, koska suurin osa vanhinta suomenkielistä kirjallisuutta oli täysin sanastamatta eikä kaikkien aiemmin tehtyjen sanakokoelmienkaan laatu täyttänyt sanakirjatyön vaatimuksia: mm. vanhin osa sanakokoelmaa oli kerätty 1930-luvulla etymologista sanakirjaa varten, joten sanastusperiaatteet poikkesivat vanhaan kirjasuomeen keskittyvän sanakirjan tarpeista. Työ sujui aluksi hitaasti, koska sanaliput kirjoitettiin käsin. Tämän vuoksi poimittavaa aineistoa valittiin kiinnostavuuden perusteella.
Vuodesta 1966 lähtien aineistoa kartutettiin kopiokoneiden avulla, joten työ nopeutui ja kokoelmista pystyttiin tekemään kattavammat. 1970-luvun alussa kokoelmien kattavuutta analysoitiin muutamien hyvin sanastettuna pidettyjen teosten osalta (mm. Martin maanlaki, Johan Wegelius nuoremman postilla), mutta sanastus osoittautui edelleen epätäydelliseksi. Puutteiden korjaamiseksi laadittiin täydennysohjelma, johon kuului mm. sane- ja käänteisluetteloiden tekeminen Mikael Agricolan teoksista (Index Agricolaensis I–II, 1980) sekä Martin maanlainsuomennoksen ja vuoden 1642 Biblian täydennyssanastukset.
Aineistoa on täydennetty toimitustyön ohessa myöhemminkin, ja sanakirjan tarpeisiin on 1990-luvulla ja 2000-luvulla tehty laaja korpus. Korpukseen on koottu mahdollisimman monipuolinen kokoelma eri alojen kirjallisuutta, jotta korpus antaisi edustavan kuvan vanhan kirjasuomen sanastosta. Korpus sisältää tällä hetkellä lähes 3,5 miljoonaa sanaa. Korpus on myös yleisön käytettävissä Kielipankin Korp-konkordanssihakutyökalun avulla. Kokonaisina korpustekstit ovat luettavissa Kotuksen aineistopalvelu Kainossa.
Artikkelien kirjoittaminen alkaa
Varsinainen koeartikkelien kirjoittaminen alkoi vuonna 1960, ja ensimmäiset artikkelit julkaistiin Virittäjässä vuonna 1965. Julkaistut näyteartikkelit olivat kaikki e-alkuisista sanoista, joita Rapolan alustavien laskelmien mukaan oli kaikkiaan 926. Vertailun vuoksi mainittakoon, että VKS 1:ssä e-alkuisia sana-artikkeleita on kaikkiaan 1 164 (lukuun eivät sisälly viiteartikkelit).
Julkaistut näyteartikkelit poikkeavat huomattavasti VKS 1:n lopullisista artikkeleista paitsi lähdekoodien myös rakenteen osalta: asetuksiin ei viitata julkaisuvuoden vaan Fredrik Wilhelm Pippingin suomeksi painettujen julkaisujen luettelon numeron avulla, vanhojen sanakirjojen tietoihin viitataan vain sanaselitteiden yhteydessä, joidenkin sana-artikkeleiden yhteydessä on synonyymiluettelot, artikkeleissa on mainintoja sanojen yleisyydestä jne.
Vauhtiin sana-artikkelien kirjoittamisessa päästiin kunnolla vasta 1970-luvun lopulla. Tekstinkäsittelyohjelmien käyttöönotto 1980-luvulla helpotti kirjoitustyötä. Rakenteista tallentamista valmisteltiin niin ikään jo 1980-luvun lopulla, jolloin VKS oli esimerkkihankkeena, kun Kotuksessa tutkittiin rakenteisen tekstin käsittelyä. Kirjoittamista jatkettiin kuitenkin WordPerfect-ohjelmalla vuoteen 1997, jolloin siirryttiin tekstinkäsittelyyn rakenteisessa muodossa FrameMaker + SGML -ohjelmalla.
Aluksi sanakirjan toimitus työskenteli Suomalaisen Kirjallisuuden Seuran alaisuudessa, kunnes vuonna 1969 hanke liitettiin Sanakirjasäätiöön vanhan kirjasuomen jaokseksi. Vuonna 1976 Vanhan kirjasuomen sanakirjasta tuli yksi Kotimaisten kielten tutkimuskeskuksen suursanakirjahankkeista. Sanakirjasta on ilmestynyt kaksi painettua osaa: ensimmäisen osan (a–i) päätoimittaja oli Esko Koivusalo, toisen (j–k) Maija Länsimäki. Kolmannen osan (l–n) päätoimittajina ovat olleet Maija Länsimäki sekä hänen jälkeensä Riitta Palkki ja Pirkko Kuutti.
Sanakirjan toimintaympäristö
Nykyään Vanhan kirjasuomen sanakirjaa ei julkaista enää painettuna. L-alkuisista sanoista eteenpäin sanakirja on ilmestynyt vain verkossa; myös aiemmin painetut osat on liitetty täydennyksineen verkkojulkaisuun. Sanakirjan toimitustyökin on vuosikymmenten saatossa kokenut suuria mullistuksia, joista suurimpia on siirtyminen kirjoittamaan rakenteisessa muodossa.
Kolmannen osan kirjoittaminen viivästyi, ja vuonna 2010 opetusministeriön asettama Kotimaisten kielten tutkimuskeskuksen tehtäviä kartoittanut työryhmä esittikin, että Vanhan kirjasuomen sanakirjan toimitustyö keskeytettäisiin. Perustelu keskeytysesitykselle oli se, että tutkimuskeskuksella ei olisi varoja toimitustyön jatkamiseen. Työ kuitenkin jatkui.
Vuosina 2012 ja 2013 Vanhan kirjasuomen sanakirjan kolmannen osan loppuun saattamista ja toimitustyötä o-kirjaimesta eteenpäin jatkettiin Koneen Säätiön neljälle tutkijalle myöntämän henkilökohtaisen apurahan turvin. Tämän jälkeen Koneen Säätiö on myöntänyt hankkeelle kolme viisivuotista rahoitusta neljän toimittajan palkkaamiseksi. Viimeisin rahoitus vuosiksi 2024–2028 on suuruudeltaan lähes 1,4 miljoonaa euroa. Vanhan kirjasuomen sanakirjan toimitustyötä jatketaan siis edelleen Kotuksen ja Koneen Säätiön rahoituksella Kotuksen toimintaympäristössä.
VKS:n alkusanat
Painetun sanakirjan alkusanat 1985
Professori Martti Rapola esitti opetusministeriölle 14. tammikuuta 1956 suunnitelman Vanhan kirjasuomen sanakirjan laatimisesta. Ministeriö osoitti työhön varat Suomalaisen Kirjallisuuden Seuralle, ja Martti Rapola siirtyi 1956 sanakirjatyöhön Helsingin yliopiston suomen kielen professorin virasta, vuotta ennen eläkeiän täyttymistä. Myöhemmin Rapola luonnehti (Suomi 112:1, 1965) sanakirjan laajuutta näin: ”Koska kysymys on pääasiallisesti tarkkojen sitaattien varaan rakennetusta vanhan kielen ’muistomerkistä’, sen laajuudesta ei voida tinkiä. Sitä ei myöskään milloinkaan uudestaan lähdettäne toimittamaan. Arvioin, että teoksesta tulee ainakin 4:n Nykysuomen sanakirjan osan vahvuinen teos, mutta se voi täyttää 6:kin osaa.” Sanakirjan ohjelmakysymyksiä Rapola käsitteli Virittäjässä 1958.
Vanha kirjasuomi on Ruotsin vallan ajan kirjakieltä. Kauden päättymisajankohdaksi Rapola määritti vuoden 1810. Siitä lähtien kävivät kielemme uudistumispyrkimykset yhä määrätietoisemmiksi, olkoonkin että enimmät vanhan kirjasuomen piirteet säilyivät kehittyvässä kirjakielessä muuttumattomina.
Vanhan kirjasuomen sanakirjan perusaineistona ovat 1) Ruotsin vallan aikaisten suomeksi julkaistujen painotuotteiden sanasto ja 2) samalta ajalta käsikirjoituksina säilyneiden yhtenäisten suomenkielisten tekstien sanavarat. Mukaan ei ole otettu keskiaikaisiin eikä myöhempiinkään vieraskielisiin asiakirjoihin sisältyviä yksittäisiä suomenkielisiä sanoja tai lauseen katkelmia. Nimistö, sekä vieras että omakielinen, on jätetty sanakirjasta pois lukuun ottamatta mytologisia nimiä. Samoin on sivuutettu vierasperäiset sitaatinluonteiset ainekset. Mukana ovat kuitenkin ne vierasasuiset kulttuurikäsitteiden nimitykset, jotka ovat vakiintuneet kielemme pysyviksi lainasanoiksi tai joille vasta paljon myöhemmin on ilmaantunut omakielinen vastine.
Lähdeaineistoa kopioitiin aluksi käsin sanalippuihin. Tutkimuslaitos Suomen suvulta saatiin käyttöön n. 70 000 etymologista sanakirjaa varten poimittua sanalippua, joihin kuitenkin jouduttiin lisäämään kontekstitietoja. Vuoteen 1966 mennessä uutta ainesta oli kertynyt 150 000 sanalipun verran. 1960-luvun puolimaissa lähdeteoksia ryhdyttiin kopioimaan mekaanisesti. Kun kokoelman edustavuutta selvitettiin yksityiskohtaisesti 1972, havaittiin, että tavallinen, yhä käytössä oleva kielenaines oli saanut liian vähän huomiota osakseen. Samoin oli esimerkkejä monikäyttöisten sanojen eri merkityksistä ja merkitysvivahteista sekä kirjallisia käännöslainoja poimittu liian vähän. Jopa Agricolan teosten sanastuksessa havaittiin aukkoja.
Tämän takia tehtiin Mikael Agricolan teosten kielestä ATK-menetelmin täydellinen saneluettelo, joka valmistui 1975 ja ilmestyi painettuna 1980 (Index Agricolaensis). Myös eräistä muista keskeisistä lähteistä poimittiin täydellisyyttä tavoitteleva aineisto. Ensimmäisen osan ilmestyessä vanhan kirjasuomen arkisto sisältää 485 000 sanalippua. Kokoelmien edustavuudesta antaa kuvan tämän teoksen lähdeluettelo.
Vaikka Vanhan kirjasuomen sanakirja esittelee sanastoa poikkeuksellisen laajasti, erityistutkimuksia varten saatetaan tarvita yksityskohtaisempia tietoja kuin sanakirja voi antaa. Vastaisuudessa ilmeisesti joudutaan kirjakielen varhaisteoksista laatimaan samantapaisia tiedostoja kuin Index Agricolaensis. Automaattinen tietojenkäsittely on helpottanut tällaisten tiedostojen koostamista ja käyttöä. Täydellinen konkordanssi olisi tarpeen esimerkiksi vanhimmista lainsuomennosten käsikirjoituksista sekä ensimmäisestä suomenkielisestä Raamatusta.
Jo 1960-luvun alussa päätoimittaja ja hänen assistenttinsa ryhtyivät koemielessä laatimaan artikkeleita. Työn edetessä toimitusperiaatteet kuitenkin muuttuivat olennaisesti. Ne julkaistiin monisteena 1977, ja niiden mukaisesti laadituista artikkelinäytteistä pyydettiin lausuntoja sekä vanhan kirjasuomen että leksikografian asiantuntijoilta. Tämän jälkeen on esitystekniikkaan tehty vain vähäisiä muutoksia.
Vanhan kirjasuomen sanakirjan toimitus työskenteli Suomalaisen Kirjallisuuden Seuran yhteydessä vuoteen 1965. Seuraavan vuoden alusta toimitus kuului jaoksena Sanakirjasäätiöön, kunnes se 1976 siirtyi tuolloin perustettuun Kotimaisten kielten tutkimuskeskukseen. Akateemikko Martti Rapolan jälkeen Vanhan kirjasuomen sanakirjan päätoimittajaksi tuli 1972 aikaisempi toimitussihteeri, maisteri Esko Koivusalo, joka kuitenkin 1974 siirtyi kielitoimiston toimistopäälliköksi ja on sen jälkeen johtanut vanhan kirjasuomen sanakirjatyötä päätyönsä ohessa.
Sanakirjan I osan lopullisen käsikirjoituksen ovat laatineet maisterit Lahja-Irene Hellemaa, Anja Jussila ja Riitta Palkki. Varsinainen tekijyys kuuluu heille, päätoimittajan tehtävänä on ollut kiteyttää toimitusperiaatteet ja ratkaista, missä vaiheessa käsikirjoitus jätetään painettavaksi. Tarkistustyössä ja korjausluvussa on avustanut humanististen tieteiden kandidaatti Marja-Liisa Lamminsalo. Ensimmäisen osan toimittajien lisäksi ovat artikkeleita laatineet työn aikaisemmassa vaiheessa maisterit Maija Kivekäs, Liisa Nyberg ja Paula Sajavaara.
Suomalaisen Kirjallisuuden Seuran johtokunta asetti sanakirjahankkeen alkuunpanijan avuksi 1956 väliaikaisen neuvottelukunnan, johon kuuluivat professorit R. E. Nirvi ja Lauri Posti sekä apulaisprofessori Veikko Ruoppila. Kun akateemikko Rapola 1971 siirtyi sivuun sanakirjatyöstä, asetettiin sanakirjalle toimitusneuvosto, johon kuuluivat akateemikko Martti Rapola, professori Osmo Ikola ja maisteri Esko Koivusalo. Akateemikko Rapolan kuoleman jälkeen toimitusneuvostoon valittiin professori Göran Karlsson. Toimitusneuvosto on keskustellut toimitusperiaatteista ja lähteiden valinnasta.
E. N. Setälä esitti Suomalaisen Kirjallisuuden Seuran kokouksessa 12.2.1896 muistion sanakirjaohjelmasta, joka sisälsi jo suunnitteilla olleen kansankielen sanakirjan lisäksi nykykielen sanakirjan sekä ”vanhemman kirjakielen sanakirjan” (Suomi III:13, 1897). Seura yhtyi Setälän ehdotukseen. Setälä uskoi, että vanhan kirjakielen sanakirja ”voisi uudelleen elvyttää monta hyvää ja tallelle panemista ansaitsevaa sanaa ja lausepartta”. Tämä toive ei näytä enää kovin realistiselta. Sen sijaan toinen Setälän peruste näyttää edelleen pitävältä: tällaisella teoksella on ”suuri tieteellinen merkitys”. Lisäksi sillä on arvonsa monumenttina, kuvana menneestä suomalaisesta elämänmuodosta ja sen yhteyksistä länsimaiseen sivistykseen.
Opetusministeriö esitti 1984 toivomuksen, että Vanhan kirjasuomen sanakirjan ensimmäinen osa ilmestyisi Kalevalan 150-vuotisjuhlan kunniaksi Mikael Agricolan päivänä 1985. Tämä toivomus on nyt täytetty.
Helsingissä Kalevalan päivänä 1985
Esko Koivusalo
Kuvat lisätty 20.5.2021 alkusanojen Kotus.fi-sivustolle siirtämisen yhteydessä.
Verkkosanakirjan alkusanat 2014
Vanhan kirjasuomen sanakirja (VKS) on kattava kuvaus varhaisen kirjoitetun suomen kielen sanastosta. Sanakirjan aineistona ovat 1540-luvulta lähtien vuoteen 1810 asti suomeksi julkaistujen painotuotteiden sanasto sekä käsikirjoituksina säilyneiden yhtenäisten suomenkielisten tekstien sanavarat. Nyt verkossa ilmestyvä näytejakso sisältää sanakirjan kaikki m-alkuiset sanat. Myöhemmin verkossa julkaistaan l- ja n-alkuiset sanat, aiemmin painettuina ilmestyneet sanakirjan kaksi ensimmäistä osaa sekä vähitellen sanakirja-artikkelit o:sta eteenpäin.
Käyttäjilleen verkkosanakirja tarjoaa mahdollisuuden paitsi lukea sanakirjaa missä tahansa, missä verkkoyhteys toimii, myös tehdä sanakirjasta monenlaisia hakuja. Tiedon löytymistä helpottaa myös linkitys; esimerkiksi sanakirja-artikkelien lähdekoodeista on linkit asianomaisten teosten lähdetietoihin. Verkkojulkaisun käyttöliittymä on tehty Kotimaisten kielten keskuksen tietohallintoyksikössä. Näytejakson artikkelit on enimmäkseen kirjoitettu Riitta Palkin päätoimittajakaudella.
VKS:n pohjatyöt aloitti professori Martti Rapola jo 1950-luvun lopulla. Silloin VKS:stä kaavailtiin 4−6-osaista. Kahden ensimmäisen osan ilmestyttyä painettuna (a−i vuonna 1985 ja j−k vuonna 1994) seuraavaa on odotettu pitkään, ja tällä välin toimitustyössä on tapahtunut paljon muutoksia. Kolmatta osaa kirjoittaessaan toimitus on samalla laajentanut vanhan kirjasuomen sähköisiä aineistoja, siirtynyt erilaisten tekstinkäsittelyohjelmien kautta rakenteiseen ohjelmaan ja uudistanut toimitusperiaatteita. Niiden vuosikymmenten aikana, kun VKS:ää on kirjoitettu, myös selittävä kieli, nykysuomi, on ennättänyt muuttua, samoin kielentutkimuksen paradigmat. Kaikilla näillä muutoksilla on vaikutusta sanakirjan tekoon.
Vaikuttavin muutos on kuitenkin aineiston laajentuminen. Sanakirjan toisen osan julkaisemisen jälkeen lähteisiin on lisätty vajaat neljäsataa tekstiä − yli neljäsosa koko aineiston nimekemäärästä. Näistä suurin osa on liitetty sähköiseen vanhan kirjasuomen korpukseen. Sanakirjan pääaineistona on edelleen noin puoli miljoonaa sanalippua sisältävä arkisto, mutta tärkeänä rinnakkaisaineistona toimii nykyään kolmen ja puolen miljoonan saneen korpus. Sanakirjan käyttäjä hyötyy aineiston kasvusta kahdella tapaa: tästedes sanakirjassa on entistä enemmän sitaatteja vanhoista teksteistä, ja sähköisestä korpuksesta on löytynyt myös ”uusia” hakusanoja eli sanoja, joita ei aikoinaan ole poimittu sanalippuihin.
Sanakirjan toimitusperiaatteet on julkaistu painettuina vuonna 1977, ja niitä on uudistettu rakenteiseen ohjelmaan siirtymisen yhteydessä. Nyt julkaistava näytejakso noudattaa aiemmin julkaistujen osien periaatteita, mutta o:sta lähtien muutoksia tulee hiukan enemmän, mm. vanhojen sanakirjojen tietojen merkitsemisen osalta. Myös tekstivertailuihin tulee lisää tarkkuutta.
Siirtyminen verkkoon ja uusiin tekniikoihin kirjoitustyössä ovat kuitenkin vain osa muutosta. Vuonna 2011 toimittajia oli ainoastaan kaksi, ja edellisvuonna Vanhan kirjasuomen sanakirjan toimitustyö oli päätetty keskeyttää varojen puutteen vuoksi. Nyt toimittajia on kuusi, sillä vuoden 2012 alusta lähtien Koneen Säätiö on rahoittanut neljän uuden toimittajan työtä ja mahdollistanut näin sanakirjan kolmannen osan (l−n) käsikirjoituksen loppuun saattamisen ja uusien sanakirja-artikkeleiden kirjoittamisen o:sta eteenpäin. Tällä hetkellä Koneen Säätiö on myöntänyt rahoitusta artikkelityön jatkamiseen vuoden 2018 loppuun saakka. Monella tavoin on toimituksessa siis aloitettu alusta; toimitustyön oppiminen vie aikansa, ja kun samalla ovat muuttuneet niin hankkeen rahoituspohja kuin ilmestymismuotokin, voimme kokea kohdanneemme − virsirunoilija Maskun Hemminkiä lainaten – ”moned muutted, mulckauxed”.
VKS:n historiasta muualla
Päätoimittajat Riitta Palkki ja Pirkko Kuutti muistelevat videolla vuosiaan vanhan kirjasuomen sanakirjatyössä. Heitä jututtaa sanakirjantoimittaja Elina Heikkilä. Miten sanakirjan tekeminen on muuttunut vuoden 1970 jälkeen? Onko mikään pysynyt ennallaan?
Toimitussihteeri Katariina Summanen kertoo blogikirjoituksessaan niistä moninaisista muutoksista, jotka ovat olleet tarpeen siirryttäessä painetusta sanakirjasta verkkosanakirjaan.