Olen ollut kuluneen kesän korkeakouluharjoittelijana Vanhan kirjasuomen sanakirjan toimituksessa yhdessä työparini Suvi Vuorisen kanssa. (Suvin blogiteksti lempi-sanan merkityksistä vanhassa kirjasuomessa julkaistiin Elävät päät -blogissa 30. elokuuta 2021.) Olemme työskennelleet Eerik Sorolaisen Postillan digitoinnin parissa.
Kesän aikana olen usein saanut kuulla kysymyksen ”Niin mitä sää oikeen teet?” Tässä blogikirjoituksessa yritän vastata kysymykseen parhaani mukaan, kattavasti mutta yksinkertaisesti.
Selityksiä ja opetuksia
Sorolaisen Postilla on vuosina 1621 ja 1625 julkaistu saarnakokoelma, joka sisältää evankeliumitekstien selityksiä ja opetuksia kirkkovuoden jokaiselle sunnuntaille ja pyhäpäivälle. Postillan ensimmäisen osan julkaisusta tulee tänä vuonna täyteen 400 vuotta, ja Vanhan kirjasuomen sanakirjan toimittaja Elina Heikkilä on kirjoittanut Kielikelloon 2/2021 mainion artikkelin, jossa hän avaa Postillan taustaa, tarkoitusta ja sen asemaa suomen kirjakielen historiassa.
Postillasta on julkaistu vuosina 1988 ja 1990 näköispainos, ja alkuperäisteosta voi ihailla myös digitaalisessa muodossa Kansalliskirjaston Doria-julkaisuarkistossa. Postilla ei kuitenkaan toistaiseksi ole ollut saatavilla koneellisesti luettavassa muodossa, joten sen hyödyntäminen esimerkiksi Vanhan kirjasuomen sanakirjan toimitustyössä tai muussa vanhan kirjasuomen tutkimuksessa on ollut verrattain hankalaa.
Useita Ruotsin vallan aikaisia suomenkielisiä teoksia on jo aiemmin digitoitu tekstitiedostoiksi ja koottu Vanhan kirjasuomen korpukseen, ja nyt tavoitteena on liittää myös Postilla osaksi korpusta. Jotta koko parituhatsivuista kirjajärkälettä ei tarvitsi naputella koneelle käsin, on avuksi otettu Transkribus-ohjelma, joka on kehitetty juuri historiallisten dokumenttien tekstintunnistukseen. Tekoälypohjaiselle tekstintunnistusmallille on syötetty Postillan näköispainoksesta skannattuja sivuja, ja ohjelma on muuttanut ne tekstiksi.
Murretut kirjaimet tekoälyn haasteena
Kun olen joutunut selittämään harjoittelutehtävääni niin tutuille kuin tuntemattomille, olen usein kartoittanut vastapuolen pohjatietoja kysymällä ”Tiäksää mitä on fraktuura?” Oikeammin tulisi puhua goottilaisista kirjaintyypeistä: niihin kuuluvat paitsi koukeroinen fraktuura, joka on suomalaisille tuttu ainakin Sisu-askin kyljestä ja Turun Sanomien logosta, myös sellaiset kirjaintyypit kuin schwabach ja rotunda. Goottilaisia kirjaintyyppejä on sanottu myös murretuiksi kirjaimiksi (saksaksi gebrochene Schrift) – fraktuuran nimitys juontuukin latinan sanasta fractus, ’murtunut’.
Postilla on painettu usealla erilaisella ja erikokoisella goottilaisella kirjaintyypillä, ja lisäksi latinankieliset reunahuomautukset ja tekstikatkelmat on painettu nykylukijalle tutummalla antiikvalla. Jos murretut kirjaimet ovat tottumattomalle nykylukijalle välillä vaikeita tulkita, niin ne ovat koneellekin. Teoksen painojälki on varsin vaihtelevaa, sivuilla on reikiä ja musteläikkiä, ja paksuja, vain hiuksenhienosti toisistaan eroavia fraktuurakirjaimia voi olla vaikea erottaa toisistaan. Erityisesti koristeellisten suuraakkosten tunnistamisessa tekstintunnistusmallilla on ollut vaikeuksia.
Vaikka kone on tehnyt merkittävän pohjatyön, tarvitaan tekstin oikolukuun, korjaukseen ja viimeistelyyn kuitenkin myös ihmissilmiä ja -aivoja – tänä kesänä minua ja Suvia. Olemme kesän aikana oikolukeneet ja korjanneet yhteensä viitisensataa postillasivua. Työ on alkanut sivurakenteen muokkauksella: sivunumerot, otsikot, marginaalit ja leipäteksti on eroteltava toisistaan ja tekstirivit muokattava oikeaan järjestykseen. Sen jälkeen olemme ryhtyneet oikolukemaan itse tekstiä.
Vaikka Sorolaisen kieli alkaa olla oikeinkirjoituksen ja kieliopin kannalta jo johdonmukaisempaa kuin Mikael Agricolalla, on siinä kuitenkin paljon variaatiota. Esimerkiksi kieltoverbi ei voi olla kirjoitettu eij tai ey. Pelkkään omaan intuitioonsa ei siis voi oikolukiessa luottaa, vaan on seurattava tarkkaan alkuperäisen tekstin kirjoitusasua. Fraktuuraa tihrustaessa (”Onko tuo nyt c vai e, t vai k?”) silmät menevät myös nopeasti ristiin. Onneksi pulmakohtia on voinut aina pähkäillä yhdessä harjoittelutoverin tai Vanhan kirjasuomen sanakirjan toimittajien kanssa.
”Sangen surkia ia wiheljäinen asia”
Vaikka oikoluku on pääosin melko rutiininomaista, välillä monotonistakin työtä, on sen lomassa saanut nauttia myös tekstin sisältöön syventymisestä. Erityisen hupaisaa oli lukea joulupäivän saarnatekstiä keskellä kesän ensimmäistä helleaaltoa, 30-asteisessa opiskelijasolussa märkä pyyhe päässä ja kylmäkalle vatsan päällä.
Postilla heijastaa myös aikansa historiallista kontekstia: 1600-luvulla luterilaisessa kirkossa vaikutti puhdasoppinen teologinen suuntaus, ja Postilla on julkaistu keskellä kolmikymmenvuotista sotaa (1618–1648) protestanttisten ja katolisten valtakuntien välillä.
Nykyään puhutaan paljon vastakkainasettelusta ja julkisen keskustelun polarisaatiosta, mutta osattiin sitä ennenkin. Martti Parvio toteaa Postillan näköispainoksen kommentaariosioissa, että Sorolainen edustaa Ruotsin luterilaisen kirkon via media -linjaa ”katolisuuden ja reformoidun kristinuskon muodon välillä”. Tämä tarkoittaa, että niin katolisiin kuin reformoituihin kristittyihin suunnataan varsin tulikivenkatkuisia syytöksiä.
Paavi on Sorolaiselle itse Antikristus, ja myös kalvinilais-zwingliläiset reformoidut eli sakramentteerarit saavat osansa. (Sakramentteerari-nimitys juontaa juurensa ehtoolliskäsityksestä, joka poikkeaa luterilaisesta.) Eikä siinä kaikki: myös luterilaiset alamaiset jättävät sunnuntaisen kirkkomatkan väliin milloin mistäkin syystä, nukkuvat tai ajattelevat paheellisia asioita kirkonpenkissä istuessaan ja kotimatkalla unohtavat kuulemansa Jumalan sanan krouvissa juopotellessaan.
Seuraava, mielestäni niin Sorolaisen kieltä kuin ajattelua hyvin kuvaava katkelma on tarkoitettu saarnattavaksi 2. sunnuntaina ennen paastonaikaa (tunnettu myös nimellä sexagesima); kappalejako on minun lisäämäni. Saarnan pohjana oleva evankeliumiteksti on Jeesuksen kylväjävertauksesta (Luuk. 8).
Ja on se sangen surkia ia wiheljäinen asia: Ettei waiwoin [vain] pacanat, Turkit [islaminuskoiset turkkilaiset], Juuttat [juutalaiset], pawin joucko [katolilaiset] ia mwt wäärät lahcocunnat [mm. kalvinistit], joita suurin osa ia enin joucko mailmas on, tule cadotetuxi: Mutta mös sijtäkin wähästä joucosta, jotca Jumalan Seuracundan on cutzutut, ia hänen Sanans cuulewat, colme osa tule cadotetuxi. Ja se tapattu oman Inhimisten syyn tähden, jotca eij Sydämestä Jumalan sana cuule ia kätke.
Sillä Jumala taritze [tarjoaa] hänen armons ia Sanans caikille. ia tahdois että caicki pidäis autuaxi tuleman. Mutta inhimiset eij taida Jumalan sana wastan otta, eikä hedelmän cansa sitä culla ia kätke. Mutta andawat Perkelen sen Sydämestäns otta ulgos, ia nijn he kiusauxen aicana poislangewat, taicka andawat sen pois tucattua ahneudesta, rickaudesta, ia tämän elämän hecumasta
Vanhan kirjasuomen lumo
Vanhan kirjasuomen tutkimuksella on opinahjossani, Turun yliopiston suomen kielen oppiaineessa pitkät perinteet. Fuksivuoden kielen kehityksen kurssin innoittamana päädyinkin tutkimaan kandidaatintutkielmassani Mikael Agricolan kieltä.
Vaikka olen maisteriopinnoissani alkanut suuntautua enemmän nykykielen ja puhutun kielen suuntaan, on ollut virkistävää syventyä taas joksikin aikaa vanhan kirjasuomen maailmaan ja hyödyntää opintojen aikana kertynyttä osaamista. Latinankielisiä marginaalimerkintöjä ratkoessa olen päässyt aktivoimaan myös yläasteaikaista koululatinaani, ja teoksen historiallis-kulttuuris-teologista kontekstia pohtiessa on muistunut mieleen lukion kirkkohistorian kurssi.
Vanhassa kirjasuomessa mahtavinta onkin juuri se, miten monipuolista osaamista sen parissa pääsee kartuttamaan ja hyödyntämään, ja miten moneen eri alaan vanhan kirjasuomen tutkimus on kytköksissä. Lisäksi se antaa arvokasta perspektiiviä kielen kehitykseen ja variaatioon yleisesti. Kesä Kotuksessa on muutoinkin ollut ikimuistoinen, mistä on kiittäminen niin Vanhan kirjasuomen sanakirjan toimitusta kuin koko keskuksen henkilökuntaa, joka on avosylin ottanut harjoittelijat osaksi työyhteisöä.
Kirjoittaja on työskennellyt kesän 2021 korkeakouluharjoittelijana Kotimaisten kielten keskuksessa Vanhan kirjasuomen sanakirjan toimituksessa.