Siirry sisältöön
Haku

Kotuksen uutiset 2015

31.3.2011 12.37

Yli kolmen miljoonan sanan puheaineisto verkkoon

Verkossa on nyt joustavasti katsottavissa ja kuunneltavissa yli kolmen miljoonan sanan puheaineisto.

Aineisto sisältää runsaasti iäkkäiden maaseudulla asuneiden ihmisten murrepuhetta, mutta mukana on myös nykyistä puhekieltä sisältävää materiaalia, esimerkiksi helsinkiläistä puhekieltä.

Monipuoliset hakumahdollisuudet

Julkaistavista aineistoista voi tehdä sanojen ja sananmuotojen perusteella hakuja, joiden tulokset pääsee heti myös kuuntelemaan. Osassa aineistoista voi lisäksi tehdä hakuja kieliopillisten ominaisuuksien perustella.

Vanhemmat aineistot eli Lauseopin aineiston murrekorpus ja Suomen kielen näytteitä ovat verkossa vapaasti käytettävissä. Uudempien aineistojen (Murteenseuruukorpus ja Helsingin puhekielen pitkittäiskorpus) käyttöön tarvitaan lupa.

Laajan yhteistyön tulosta

Merkittävä osa aineistosta on peräisin Kotimaisten kielten keskuksen ylläpitämästä Suomen kielen nauhoitearkistosta. Nauhoitearkistoon on kerätty vuodesta 1959 alkaen tuhansia tunteja äänitteitä suomen murteista

Aineistot on tuotettu FIN-CLARIN-yhteistyön merkeissä. FIN-CLARIN on suomalaisten yliopistojen, CSC:n (Tieteen tietotekniikan keskus) ja Kotimaisten kielten keskuksen muodostama tutkimusaineistoyhteenliittymä. Nyt julkistettavien aineistojen kehittämiseen ovat osallistuneet myös Turun ja Helsingin yliopistojen suomen kielen oppiaineet.

Lauseopin arkiston murrekorpus

Suomen kielen näytteitä

Murteenseuruukorpus

Helsingin puhekielen pitkittäiskorpus


Palaa otsikoihin