Suomiko edistynyt tietoyhteiskunta?
Perinteisesti nämä aineistot on
tuotettu painettuna kirjana, mutta digitaalisia aineistoja on sekä
halvempi tuottaa että helpompi käyttää. Ilahduttava määrä
apuneuvoja onkin jo saatettu sähköiseen muotoon. Helmenä kruunussa
on Iso suomen kielioppi, joka on kokonaisuudessaan verkossa kaikkien
saatavilla. Oheen on jopa lisätty Sananselityksiä: Ison suomen kieliopin termejä: Ison suomen
kieliopin termejä. Etymologisen sanakirjan verkkoversio luiskahti jo
vahingossa näkyviin (kunnes keskeneräiset sivut taas salattiin),
Suomen murteiden sanakirjasta ovat verkossa maistiaisena hakusanat
kus-kyntsöttää. Karjalan kielen ja viittomakielen sanakirjat löytyvät ilmaisina Kotuksen sivuilta.
Kaino-tietokannassa on runsaasti vanhoja ja hiukan uudempiakin
tekstejä.
Valitettavasti Kielitoimiston sanakirjan ja Kielitoimiston oikeinkirjoitusoppaan sekä Kielikellon arkistojen käyttö vaati vuosittaisen
lisenssin maksamista yksityiselle palveluntarjoajalle. Minusta olisi
ensiarvoisen tärkeää, että valtiovalta osoittaisi varoja näiden
keskeisten resurssien saamiseksi vapaaseen käyttöön. Esimerkkinä
mainittakoon, että Ruotsin akatemian sanakirjaa voi kuka tahansa
käyttää verkossa – myös Ruotsin ulkopuolella. Mielelläni
näkisin netissä myös vanhan kunnon Nykysuomen sanakirjan.
Suomen kielen toimintaohjelman mukaan
"Suomessa ollaan BLARK- [Basic Language
Resource Kit] kieliresurssien kokoamisessa ja kehittämisessä melko
pahasti jäljessä paitsi suurista kielimaista myös naapurimaista."
Kaipaan kipeästi mm. suomen kielen puheentunnistusta ja digitaalisia
sanakirjoja, jotka tunnistavat suomen kielen taivutusmuodot ja
osaavat tarjota lauseyhteyteen todennäköisiä vastineita. Todella
iso miljoonien sanojen kieliaineisto (korpus) olisi myös erittäin
hyödyllinen kielenkäytön opas ja suuri apu esimerkiksi sanojen
tiheyden ja esiintymisyhteyksien hahmottamisessa. Suomi ei voi röyhistellä edistyneenä tietoyhteiskuntana ennen kuin nämä puutteet on korjattu.
Nimenomaan suomentajille
nämä apuneuvot ovat elinehto. Niiden saatavuus vaikuttaa suoraan
käännösten hintaan, laatuun ja määrään.
Palaa otsikoihin | 24 puheenvuoroa
Verkkoversio ei ole samalla tapaa kouriintuntuva, mutta toisaalta asiat löytyvät sieltä nopeammin ja helpommin, kun vain tietää, mitä on hakemassa. Suomen kielen rakenteen opettajille ja kieliopin harrastajille teos on tyhjentymätön aarrearkku.
Lisäksi tarvittaisiin uusi pedagoginen kielioppi, joka rakentuisi deskriptiivisen kieliopin pohjalle. Mutta tarvitsisiko uuden opetuskieliopinkaan olla tiukan normatiivinen? Siinäpä kysymys.
Miksi Suomen pitäisi röyhistellä edistyneenä tietoyhteiskuntana?
Sanakirjat maksavat muutaman kympin kappale. Tuleeko niistä todella niin iso menoerä, että se ”vaikuttaa suoraan käännösten hintaan, laatuun ja määrään”?
”Iso suomen kielioppi” tuli nettiin maksutta vähän sen jälkeen, kun olin ostanut painetun kirjan noin sadalla eurolla. Tunsin itseni huijatuksi.
EU:ssa on nykyisin periaatteena, että julkisin varoin tuotettu tieto on annettava vapaasti käytettäväksi niin, että yritykset saavat kilpailla sen jalostamisesta ja liittää sen omiin palveluihinsa. Ilmeisesti tästä on suomen kielen alalla poikettu niin, että oikeudet tiedon käyttöön on annettu yksityisten yritysten yksinoikeudeksi. Samalla kai tekijät ovat saaneet vähän voita leivän päälle, eli royalty-maksuja kuukausipalkkansa päälle. En missään tapauksessa kadehdi, koska kyse on akateemisesta matalapalkka-alasta. Mutta se vaikeuttaa asioita.
Muuten olen sitä mieltä, että Nykysuomen sanakirjan digitalisointi ja saattaminen vapaasti nettiin olisi merkittävää sekä käytännössä että periaatteessa. Kai Kotus voisi tälle hakea erillisrahoitusta? Päättäjät sitten ottaisivat kantaa konkreettiseen tavoitteeseen ja sen hintaan. Joku juristi voisi kohtuuttomasta mutta siedettävästä korvauksesta selvittää, miten voidaan maksaa alkuperäisten tekijöiden perikunnat suostumaan asiaan. (Tekijänoikeuslain pakkolisenssisäädöksiä voisi kai soveltaa luovasti tähän.)
Mihin muuten jäi tavoitteista englanti-suomi-sanakirja (ja suomi-englanti-sanakirja)? Sellainen kai olisi kaikkein keskeisin englannista suomennettaessa, jota suomentaminen nykyisin enimmäkseen on. Vanhoissa suomen sanakirjoissa oli metakielenä tai oheiskielenä latina, ruotsi tai saksa. Yksikieliset suomen sanakirjat ovat aika kyseenalaisia nykymaailmassa. Modernin maailman lingua francan mukaan ottamisen pitäisi olla itsestäänselvää.
Englanti-suomi-sanakirjoja toki on olemassa kaupallisina tuotteina, mutta niitä ei todellisuudessa juuri päivitetä (vuosimaksuja kyllä digiversioista perimään, mutta päivittäminen on näennäistä) ja ne ovat melkoisen suppeita tarpeisiin nähden.
Joka tapauksessa Kotus on yhä enemmän siirtynyt verkossa julkaisemiseen. Esimerkkinä mainittakoon sanakirjoista Karjalan kielen sanakirja, joka on kokonaan saatavilla, ja Suomen murteiden sanakirja, josta ensimmäinen osuus on verkossa ja painettuja osia ja uutta aineistoa on tulossa sitä mukaa kuin se saadaan tietoteknisesti asianmukaiseen muotoon. Lähivuosina on tulossa saataville myös Suomen ruotsalaismurteiden sanakirjaa Ordbok över Finlands svenska folkmål ja Vanhan kirjasuomen sanakirjaa. Lisäksi Kotuksen sivuilla on lukuisa määrä muita julkaisuja, kielenkäytön ohjeita ja laajat aineistot. Kun tekijäryhmät ovat pieniä ja tietotekniset voimavarat vähäisiä, kaikkea ei saa tehdyksi yhtä aikaa.
Monet eivät varmaankaan tule ajatelleeksi, että myös valtion laitoksen on yritettävä kerätä tuloja, joilla kustantaa toimintojaan (vrt. Valtion maksuperustelaki). Kielitoimiston sanakirja, joka edustaa nykykieltä ja josta Kersti Juva blogissaan kirjoittaa, on toistaiseksi maksullinen. Se julkaistaan sekä painettuna kirjana, joka on varsin edullinen, että sähköisenä versiona. Rojaltit sähköisestä sanakirjasta tulevat Kotuksen budjettiin, eivät virkamiehille. Nykysuomen sanakirja on puolestaan WSOY:n sanakirja, ei Kotuksen.
Kaikilla kielialueilla julkaistaan yksikielisiä sanakirjoja, Suomessa se on yksi Kotuksen tehtävistä. Englanti‒suomi-sanakirjat ovat välttämättömiä, mutta Kotuksen tehtäviin kuuluu nimenomaan kotimaisten kielten huolto ja sanakirjatyö sekä niihin liittyvä tutkimus.
Pirkko Nuolijärvi
Kotuksen johtaja
http://www.finlex.fi/fi/laki/ajantasa/1992/19920150
Sen mukaan maksuttomia tulisi yleensä olla suoritteiden, joita ei ole kohdistettu millekään erityiselle ryhmälle. Esimerkiksi Kielitoimiston sanakirja jos mikään on kai tarkoitettu yleiskäyttöiseksi. Toisaalta esimerkiksi järjestetyn kielineuvonnan (puhelinpalvelun) tulisi olla maksullista, sillä tuskin voidaan sanoa, että siitä aiheutuu vain vähäisiä kustannuksia.
On selvää, että syntyy ongelmia, jos puuhastellaan liian monenlaisia asioita. Esimerkiksi 1500-luvun suomen kieli tai ruotsin kielen vanhat suomalaismurteet ovat asioita, jotka kiinnostavat vain harvoja - ja varmaan kysyntä (valmius maksaa) olisi vielä pienempi.
Kielitoimiston sanakirjan suurin ongelma ei kuitenkaan ole sen hinta vaan sen suppeus. Suuri virhe tehtiin, kun sanakirjojen pohjana ei käytetty Nykysuomen sanakirjaa vaan vahvasti supistettua otetta siitä.
Mutta miten se kustannettaisiin – vero-, mainos-, sponsori- vai joillakin muilla varoilla?
Sanakirjaa työhönsä tai muuten hyvin paljon tarvitsevalle tuo on periaatteessa toimivaa (mutta jos sisältöä ei päivitetä jatkuvasti, niin mitä vastinetta hän saa rahoilleen). Entäpä kun käyttäjämme on mennyt kesäksi saareen tai verkko on muuten hidas tai pätkii? Ei toimi, ei. Vaikka siitä on maksettu.
Entä kaikki satunnaiskäyttäjät - kuka haluaa maksaa kirjan verran vuodessa tuotteesta jota tarvitsee pari kertaa kuussa? Tuloksena on se, että entistä harvemmalla on mahdollisuus käyttää näitä kielenkäytön apuvälineitä.
viranomainen on tuottanut ja siis maksullinen (ks. alla lain luku 2, pykälä 4).
Maksullisuutta tähdentää laissa vielä se, että niistä tavaroista, joita muutkin tuottavat, on varsinkin perittävä maksu. Tällä pyritään, estämään se, että valtio tuottaisi maksuttaa jotain tavaraa, jolla joku muu yrittää hankkia elantonsa.
2 LUKU
Suoritteiden maksullisuuden ja maksujen suuruuden yleiset perusteet
4 §
Maksulliset suoritteet
Seuraavat suoritteet tulee olla maksullisia, jollei suoritteen maksuttomuudelle ole perusteltua syytä:
1) tavarat, jotka valtion viranomainen on tuottanut;
2) palvelut, jotka on tuotettu tilauksesta tai muusta toimeksiannosta;
3) päätökset, jotka on tehty hakemuksesta;
4) käyttöoikeuksien sekä muiden oikeuksien väliaikainen luovuttaminen; sekä
5) muu toiminta, milloin suoritteen tuottaminen on seurausta vastaanottajan toimenpiteestä.
Onko Kielikone hankkinut itselleen yksinoikeudet liki rajoittamattomalla sopimuksella niin, että aineiston tuottajilla ei ole nokan koputtamista siihen, millaista bisnestä tehdään?
Jos siis haluttaisiin julkisin varoin tehdä vapaaseen käyttöön suomen kielen sanakirja, pitäisi siis ilmeisesti aloittaa tyhjästä. Sanalippuja keräilemään ja sillai. Vai onko sopimuksessa myös kilpailevan toiminnan kielto?
Tulee mieleen sanonta "maalata itsensä nurkkaan".
Ja kun sanakirja (tietosisältönä) oli tehty, oli ihan Kotuksen valinta, miten sitä jaetaan. Maksuperustelain hengen mukaista olisi, että sitä jaetaan maksutta verkossa, ja tähän kielenkäyttäjät olisivat varmaan ihan tyytyväisiä näin 2000-luvulla. Jos jokin firma haluaisi sitä printata ja myydä painokustannusten plus pienen katteen hinnalla, niin se ei ketään haittaisi.
Mutta nytpä tämä julkisin varoin tehty aineisto onkin julkaistu "tavarana", ja lisäksi sen "sähköisen" version yksinoikeus on ilmeisesti luovutettu yksityiselle yritykselle, Kielikoneelle.
Ei mitenkään itsestään selvää, pikemminkin päin vastoin. Tuosta, joka paikkaan tunkeutuvasta, pakkoenglannista kun pitäisi pyrkiä kaikin tavoin eroon.
Jos minä keskustelen toisen ihmisen kanssa, olennaisin asia on, että ymmärrämme toisiamme. Tällöin on eduksi se, että kumpikin osapuoli ymmärtää ainakin kohtuullisesti toistensa kieltä. Näissä tarpeissa yhteisestä huonostikin puhutusta englannista on korvaamaton apu.
Ne, joilla on mielestään etuoikeus alkaa nirsoilemaan että tuota kieltä en halua puhua, homehtukoot pieruihinsa umpiossaan.
Ne taas jotka haluavat ensi sijaisesti kommunikoida muidenkin kuin samankielisten ja -mielisten kesken, käyttävät sitä kieltä millä viesti menee parhaiten perille. Vaikka sitten englantia, jolla on se demokraattinen ominaisuus, että suurin osa sen käyttäjistä puhuu sitä vieraana kielenä, joten viestintä on heidäån kesken lähtökohtaisesti tasa-arvoisempaa kuin äidinkieltään ja vierasta kieltä puhuvien kesken.
Englanti on varsin kaukana siitä universaalista yleiskielestä, jollaiseksi sen nämä pyhän pakkoenglannin palvojat ry. haluaa täälläkin julistaa. Kannattaa muistaa että yli 80% maailman ihmisistä ei edelleenkään puhu englantia.
Myös suomen yleiskieli luotiin kulttuurin ja vallan välineeksi, tarkemmin sanoen kristillisen (erityisesti luterilaisen) kirkon ja Ruotsin valtion tarpeista lähtien. Sitä ei luonut parlamentaarinen komitea eikä tieteellinen neuvottelukunta.
Kyse on nyt vain siitä, että se kulttuuri, valta ja valtio, jonka tarpeisiin suomen yleiskieli luotiin, on pääosin hävinnyt ja loputkin ovat häviämässä.
Tietotekniikan alalla suomen kieli alkaa jo olla lähinnä huono vitsi: vain hyvin pätevä tietotekniikan asiantuntija saa oikeasti selvän suomenkielisestä käyttöohjeesta, koska osaa kääntää sen oudot anglismit tutuiksi englanninkielisiksi termeiksi.
Tähän ei hirveästi vaikuta se, että Suomen murteiden sanakirjasta on saatu verkkoon sanat kus–kyntsöttää. Suomen murteethan ovat jo kuolleet, vaikka niistä on vielä hiukan jäänteitä siellä täällä. (Jo 1900-luvun alussa murteentutkijat valittivat, että murteenpuhujia on vaikea löytää. Joku sanoi jotain siihen tyyliin, että murre elää siellä, missä kylien välillä kulkee vain kapea kärrytie. Tai mieluummin kai ei sitäkään.)
Tässä todellisessa maailmassa suomen kielen aseman ratkaisee se, miten hyvin se sopeutuu nykyajan ilmaisutarpeisiin. Eikä se näytä hyvältä. Ennen kuin on edes keksitty ehdotusta siitä, miten jostakin uudesta ilmiöstä voisi puhua suomeksi, se on jo menneen talven Lumia.
Olen käynyt mainitsemissasi kaupungeissa ja kuunnellut ihmisiä. Ihan ymmärrettävän suomen seassa on joskus murresana, ja jotkin sanat esiintyvät useinkin murteellisissa muodoissa. Mutta ei yksi "mie" murretta tee. Kyse on enää murretusta yleiskielestä, ja se murtaminenkin vähenee kovasti, kun esimerkiksi pitää työssä puhua eri puolilta Suomea ja muualtakin tulleiden kanssa.
Jos itse koet puhuvasi tiettyä murretta, niin tuskinpa kuitenkaan tunnistaisit puoltakaan niistä sanoista, jotka Suomen murteiden sanakirjan mukaan kuuluvat siihen.
puhutaan siis eri näkökulmasta, kun minulle murre nimenomaan on sanojen lausumistapaa, puheenrytmiä ja intomaatiota.
Minusta on toissijaista että "murresanastosta" suurin osa on hävinnyt käytöstä, koska myös se elämäntapa jossa niitä sanoja on tarvittu on muuttunut. Niinhän suomen yleiskielenkin sanasto muuttuu, ilman että monikaan väittää suomen kielen olevan häviämässä.
Kun juttelen kotiseudulleni jääneiden vanhojen koulukavereideni kanssa, heidän puhetapansa on minulle aivan selvää murretta. Ei enää samaa kieltä mitä ukkini puhui, vaikka samoin lausuttuja sanoja niissäkin on.
Mutta jos murre määritellään sellaiseksi kieleksi, joka koostuu niistä sanoista jotka löytyvät murresanakirjasta, niin kyllä varmaan on se murre kadonnut. Jos sellaista murretta on koskaan ollutkaan.
Valitettavan usein on niin, että jopa aineistot, jotka periaatteessa ovat vapaasti saatavilla, ovat käytännössä salasanan tai vastaavan takana.
Meillä Turun yliopistossa on yhdessä Informaatioteknologian ja Kieli- ja käännöstieteiden laitosten kanssa koottu Turkulainen suomen kielen puupankki (TDT), joka on vapaasti selattavissa ja ladattavissa ryhmämme kotisivuilla osoitteessa http://bionlp.utu.fi/fintreebank.html
Puupankki on siis kieliaineisto, johon on merkitty tietoa virkkeiden syntaksista eli lauserakenteesta. Merkintöjen ansiosta aineistoa voi käyttää tavallista korpusta monipuolisemmin, ja varsinkin kielentutkimuksessa tämä on erittäin hyvä ominaisuus.
Tällä hetkellä puupankin julkinen versio pitää sisällään noin 7 000 virkettä ja 100 000 sanaa, mutta projekti on yhä käynnissä, ja huomattavasti laajempi versio julkaistaneen lähiaikoina.
Tervetuloa tutustumaan!
EU:n linjan taustalla taas ei ole mikään idealistinen vapausaate vaan se, että saattamalla aineistot vapaaseen käyttöön luodaan edellytyksiä yritystoiminnalle. Annetaan raaka-ainetta tietoyhteiskunnan teollisuudelle.
Eikä linja voi vaikuttaa taannehtivasti. Kun julkisin varoin luotuihin aineistoihin on syntynyt tekijänoikeuksia tai kun oikeuksia on luovutettu yrityksille, ei niitä noin vain saa takaisin. Lisäksi tekijänoikeus vastaisuudessakin aiheuttaa rajoituksia, ellei sopimuksiin saada määräyksiä oikeuksien siirtymisestä työnantajalle. Lain mukaanhan oikeudet pääsääntöisesti jäävät työn tekijälle.
Missään ei selitetä.
Onko koko hanke kaatunut?
Tai onko se rahalla saatavissa?
Pahoittelen, jos Suomen murteiden sanakirjan tilanne ei käy tarpeeksi selvästi ilmi sanakirjan verkkoversion etusivulla.
Suomen murteiden sanakirjan toimitus työskentelee koko ajan saadakseen verkkoon lisää sanakirjaa jakson kus - kynstöttää lisäksi. Seuraavana - toivottavasti kevään 2013 aikana - verkkoon liitetään aiemmin painettuna ilmestynyt sanakirjan 8. osa, joka kattaa aakkosvälin konkeri - kurvottaa. Tämän jälkeen verkkoon viedään vähitellen kaikki muutkin aiemmin painettuna ilmestyneet osat (1 - 7; a - konkelopuu). Toimitus tekee myös kaiken aikaa töitä saadakseen verkkoon aiemmin julkaisematonta materiaalia. Seuraava täysin uusi, vain verkossa ilmestyvä jakso on kyntteli - käävätä.
Tarja Korhonen
tutkija, Suomen murteiden sanakirja