1 to 4 of 4 Results
May 31, 2024
Lippus, Pärtel; Lõo, Kaidi; Malmi, Anton; Pilvik, Maarja-Liisa, 2024, "Suuline eesti keel arvudes. Sagedusandmestikud", https://doi.org/10.23673/RE-463, DATADOI, V1
Siin repositooriumis on projekti "Suuline eesti keel arvudes" raames koostatud sagedusandmestikud, mis kirjeldavad suulist eesti keelt. Andmestikud põhinevad Eesti keele spontaanse kõne korpusel, Teismeliste Keel Eestis korpusel ning käesoleva projekti raames kogutud ERR-i ja taskuhäälingu korpustel. Esitatud on sõna- ja lemmasagedusi ning n-gramme... |
Dec 28, 2023
Lippus, Pärtel; Pilvik, Maarja-Liisa; Lõo, Kaidi; Lindström, Liina, 2023, "Kõnetempo ja -soravuse varieerumine eesti keeles (data)", https://doi.org/10.23673/RE-452, DATADOI, V1
Siin repositooriumis on kõnetempo ja -soravuse andmestikud ja nende analüüsiks kasutatud R kood, mida on kasutatud artiklis: Pärtel Lippus, Maarja-Liisa Pilvik, Kaidi Lõo, Liina Lindström. 2024. Kõnetempo ja -soravuse varieerumine eesti keeles. Eesti Rakenduslingvistika aastaraamat 20. // This is the data & code for analysing speech rate and fluenc... |
Nov 17, 2023
Lippus, Pärtel; Alumäe, Tanel; Orasmaa, Siim; Pilvik, Maarja-Liisa; Lindström, Liina, 2023, "Eesti taskuhäälingukorpus", https://doi.org/10.23673/RE-445, DATADOI, V1
Korpus koosneb eesti taskuhäälingusaadetest ja nende transkriptsioonidest. Korpuses on kokku 10 633 episoodi 184 erinevast taskuhäälingust, kogukestusega 10 918 tundi, mis on salvestatud vahemikus 2018–2022. Salvestused on transkribeeritud Tallinna Tehnikaülikooli automaatse kõnetuvastusega ning tekstid on automaatselt morfanalüüsitud EstNLTK-ga. K... |
Nov 14, 2023
Lippus, Pärtel; Alumäe, Tanel; Orasmaa, Siim; Tsepelina, Katrin; Lindström, Liina, 2023, "Eesti Rahvusringhäälingu raadiosaadete korpus", https://doi.org/10.23673/RE-441, DATADOI, V1
Korpus koosneb ERR-i raadiosaadetest ja nende transkriptsioonidest. Korpuses on 53 000 raadiosaadet kogukestusega 16 tuhat tundi, mis on salvestatud vahemikus 1930–2022. Salvestused on transkribeeritud Tallinna Tehnikaülikooli automaatse kõnetuvastusega ning tekstid on automaatselt morfanalüüsitud EstNLTK-ga. Kokku on korpuses 109 miljonit sõna. Ko... |
