Kotuksen uutiset 2015
Yli kolmen miljoonan sanan puheaineisto verkkoon
Verkossa on nyt joustavasti katsottavissa ja kuunneltavissa yli kolmen miljoonan sanan puheaineisto.
Aineisto sisältää runsaasti iäkkäiden maaseudulla asuneiden ihmisten murrepuhetta, mutta mukana on myös nykyistä puhekieltä sisältävää materiaalia, esimerkiksi helsinkiläistä puhekieltä.
Monipuoliset hakumahdollisuudet
Julkaistavista aineistoista voi tehdä sanojen ja sananmuotojen perusteella hakuja, joiden tulokset pääsee heti myös kuuntelemaan. Osassa aineistoista voi lisäksi tehdä hakuja kieliopillisten ominaisuuksien perustella.
Vanhemmat aineistot eli Lauseopin aineiston murrekorpus ja Suomen kielen näytteitä ovat verkossa vapaasti käytettävissä. Uudempien aineistojen (Murteenseuruukorpus ja Helsingin puhekielen pitkittäiskorpus) käyttöön tarvitaan lupa.
Laajan yhteistyön tulosta
Merkittävä osa aineistosta on peräisin Kotimaisten kielten keskuksen ylläpitämästä Suomen kielen nauhoitearkistosta. Nauhoitearkistoon on kerätty vuodesta 1959 alkaen tuhansia tunteja äänitteitä suomen murteista
Aineistot
on tuotettu FIN-CLARIN-yhteistyön merkeissä. FIN-CLARIN on suomalaisten
yliopistojen, CSC:n (Tieteen tietotekniikan keskus) ja Kotimaisten
kielten keskuksen muodostama tutkimusaineistoyhteenliittymä. Nyt
julkistettavien aineistojen kehittämiseen ovat osallistuneet myös Turun
ja Helsingin yliopistojen suomen kielen oppiaineet.
Lauseopin arkiston murrekorpus
Helsingin puhekielen pitkittäiskorpus