Ortografiaa ja morfologiaa tietokantana
Varhaisnykysuomen alkupuoliskolla eli vuosina 1810–1845 ilmestyneiden suomenkielisten teosten ortografiasta (oikeinkirjoituksesta) ja morfologiasta (muoto-opista) on koottu erillinen Excel-taulukon muodossa julkaistu tietokanta. Tietokanta perustuu Valfrid Vaseniuksen Suomalainen kirjallisuus 1544–1877 -bibliografiassa (1878) luetteloituihin teoksiin.
Haminan rauhansopimuksesta murteiden taistelun laantumiseen
Ajallisen rajauksen taakse jää Haminan rauhansopimukseen vuonna 1809 päättynyt Ruotsin vallan kausi. Loppupisteeksi on asetettu Julius ja Kaarle Krohnin Suomalaisen kirjallisuuden vaiheet -teoksessa (1897) murteiden taistelun kiivaimman vaiheen päättymisajankohtana pitämä vuosi 1845.
Vasenius (1878) on sisällyttänyt bibliografiaansa vain vähintään 16-sivuiset painotuotteet ja jättänyt muun muassa sanomalehdet luettelonsa ulkopuolelle; muutamat jäljelle jääneet (aikakaus)lehdet on aineistosta karsittu. Varsinaisiin kirjoihin näin keskittyvään tietokantaan on otettu kustakin teoksesta vain sen parhaiten ilmestymisaikaansa kuvastava ensipainos. Muutamasta kirjasta tällaista ei ole löytynyt, mutta tietokantaan on saatu koottua tiedot kaikkiaan 207 teoksesta.
Maallisia ja hengellisiä teoksia
Teoksista hieman yli puolet (108) on maallisia, hieman alle puolet (99) hengellisiä. Vaseniuksen omiin alaryhmiin jaoteltuna hengellisistä teoksista lähes puolet on saarnoja tai ”hengellisiä tutkistelemuksia”, vajaa kolmannes Raamattua ja sen selityksiä, uskonto-oppia tai rukous-, rippi- ja käsikirjoja, loput piplia- ja kirkkohistoriaa, virsiä tai hengellisiä kertomuksia.
Maallisista kirjoista hieman yli puolet on kaunokirjallisia tai kansanrunoja sisältäviä, noin kahdeksannes kasvatusta ja yleistä valistusta koskevia, vajaa kymmenesosa taloudellisia tai kielitieteellisiä. Historiaa lukuun ottamatta useimmat muut alat oikeustieteestä luonnontieteisiin ja lääketieteeseen asti ovat vain yksittäisten teosten varassa.
Käännettyjä ja suomeksi kirjoitettuja teoksia
Koko aineisto jakautuu melko tarkkaan kahtia myös käännetyn ja alun perin suomeksi kirjoitettujen teosten suhteen. Käännettyjä kirjoja on ainakin 108, alun perin suomeksi kirjoitettuja 99.
Mielenkiintoista on, että hengellisistä kirjoista yli neljä viidesosaa (82/99) on käännettyjä, kun taas maallisista kirjoista suomennoksia on vajaa neljännes (26/108). Suomennosten kokonaismäärä on kuitenkin noussut jatkuvasti, kun taas niin hengellisten kuin maallistenkin alkuperäisteosten määrä pysyy suunnilleen samana. Julkaistun kirjallisuuden määrän jatkuva kasvu on siis varhaisnykysuomen alkupuoliskolla suomennosten ansiota.
Käsiteltävinä keskeisemmät piirteet
Teoksista on luettu vähintään 16 sivun mittainen otos teoksen alusta, nimi- ja tittelilehtiä sekä (joitain kansanrunojulkaisuja lukuun ottamatta) myös mahdollisia esipuheita huomioimatta. Useimmista teoksista on luettu pitempikin jakso.
Luetusta tekstistä on poimittu keskeisimmät ortografiset ja morfologiset piirteet. Astevaihteluun kytkeytyvistä piirteistä näitä ovat d:n mahdollinen kato ja ts-yhtymän edustus (tz, ts tai tt), puhtaasti ortografista piirteistä x ~ ks, mb ~ mp, ld ~ lt, nd ~ nt ja (vahva-asteisiinkin muotoihin merkitty) ng ~ nk sekä lainasanojen myötä tulleen f-äänteen merkintä (ph ~ f ~ w).
Morfologisista piirteistä mukana ovat persoonapronominien yksikössä ja monikossa alun perin eri päätteinen akkusatiivi (n ~ t), inessiivi (päätteenä ssa tai sa, runoissa loppuheittoisenakin, kuten eräät muutkin vokaaliloppuiset päätteet), allatiivi (lle ~ llen, satunnaisesti myös loppukahdennukseen viittaavasti lleh), abessiivi (tta ~ ta, myös h:n tai ’:n avulla loppukahdennukselliseksi merkittynä tai k-loppuisena) sekä verbien monikon 1. ja 2. persoonan päätteet (mme ~ mma, tte ~ tta ym.) ja 3. persoonan imperfekti- ja konditionaalimuodot (it ~ ivat, isit ~ isivat), yhteensä siis 16 piirrettä.
Tietokannassa hahmotellaan tarvittaessa myös piirteille ominaista variaatiota. Esimerkiksi merkintä mme ~ mma ilmaisee monikon 1. persoonan päätteen varioivan otoksessa siten, että e:llinen pääte on yleisempi, merkintä mma ~ mme siten, että a:llinen muoto onkin tavallisempi. Jos varianttien yleisyydestä ei ole voitu tehdä päätelmää, merkintätapana on mm~e~a. Aivan satunnaisia piirrevariantteja on laitettu sulkeisiin.
Ainoastaan osa 1800-luvun alkupuolenkaan teoksista on digitoitu, monia on tallella vain yliopistojen vapaakappalekokoelmissa ja eräissä erikoiskirjastoissa. Tietokannan pohjalta kuka tahansa voi helposti etsiä eri alojen julkaisuja ja saada tietoa näiden keskeisistä äänne- ja muotopiirteistä.