Suuline eesti keel arvudes. Sagedusandmestikud
Lippus, Pärtel; Lõo, Kaidi; Malmi, Anton; Pilvik, Maarja-Liisa
Loading
Abstract
Siin repositooriumis on projekti "Suuline eesti keel arvudes" raames koostatud sagedusandmestikud, mis kirjeldavad suulist eesti keelt. Andmestikud põhinevad Eesti keele spontaanse kõne korpusel, Teismeliste Keel Eestis korpusel ning käesoleva projekti raames kogutud ERR-i ja taskuhäälingu korpustel. Esitatud on sõna- ja lemmasagedusi ning n-gramme ja häälikute ja silpide sagedusi. // This repository contains frequency data collected within the project "Basic statistics of spoken Estonian" The ddatasets are based on four spoken corpora: Phonetic Corpus of Estonian Spontaneous Speech, Estonian Teen Language Corpus, ERR broadcasts and podcasts corpus. The tables present frequency counts of words, lemmas, phonemes and syllables.... Show more Show less
Keyword
word frequency; morphological analysis; phoneme frequency; spoken language; Estonian languageItem type
info:eu-repo/semantics/datasetCollections
The following license files are associated with this item: