11 to 20 of 38 Results
Jun 11, 2024 - Eesti ja üldkeeleteaduse andmed
Malmi, Anton; Leppik, Katrin, 2024, "Vene emakeelega õppijate häälduskorpus", https://doi.org/10.23673/RE-467, DATADOI, V1
Projekti raames koguti erineva keeletaseme ja -taustaga eesti keele õppijatelt häälduskorpus. Salvestused korpuse jaoks tehti enne ja pärast hääldustreeningut ning hääldustreeningu ajal. Hääldustreeninguks kasutati mobiilirakendust SayEst. Pärast andmete kogumist transkribeeriti salvestused häälikutasandini ning andmestikku kasutatati eesti keele t... |
May 31, 2024 - Suuline eesti keel arvudes
Lippus, Pärtel; Lõo, Kaidi; Malmi, Anton; Pilvik, Maarja-Liisa, 2024, "Suuline eesti keel arvudes. Sagedusandmestikud", https://doi.org/10.23673/RE-463, DATADOI, V1
Siin repositooriumis on projekti "Suuline eesti keel arvudes" raames koostatud sagedusandmestikud, mis kirjeldavad suulist eesti keelt. Andmestikud põhinevad Eesti keele spontaanse kõne korpusel, Teismeliste Keel Eestis korpusel ning käesoleva projekti raames kogutud ERR-i ja taskuhäälingu korpustel. Esitatud on sõna- ja lemmasagedusi ning n-gramme... |
Feb 22, 2024 - Eesti ja üldkeeleteaduse andmed
Vihman, Virve-Anneli; Pilvik, Maarja-Liisa; Mandel, Aive; Kängsepp, Annika; Aigro, Mari; Koreinik, Kadri; Praakli, Kristiina; Lindström, Liina, 2024, "Estonian Teen Language Corpus", https://doi.org/10.23673/RE-455, DATADOI, V1
Estonian Teen Language Corpus (Eesti teismeliste keele korpus) is a corpus representing spoken and written language data, collected from Estonian teenagers (ages 9-18) between 2019-2023. The corpus consists of four types of files. Spoken language data is represented by .eaf and .tsv files (spoken_eaf.zip, spoken_tsv.zip), and contain transcriptions... |
Dec 28, 2023 - Suuline eesti keel arvudes
Lippus, Pärtel; Pilvik, Maarja-Liisa; Lõo, Kaidi; Lindström, Liina, 2023, "Kõnetempo ja -soravuse varieerumine eesti keeles (data)", https://doi.org/10.23673/RE-452, DATADOI, V1
Siin repositooriumis on kõnetempo ja -soravuse andmestikud ja nende analüüsiks kasutatud R kood, mida on kasutatud artiklis: Pärtel Lippus, Maarja-Liisa Pilvik, Kaidi Lõo, Liina Lindström. 2024. Kõnetempo ja -soravuse varieerumine eesti keeles. Eesti Rakenduslingvistika aastaraamat 20. // This is the data & code for analysing speech rate and fluenc... |
Nov 17, 2023 - Suuline eesti keel arvudes
Lippus, Pärtel; Alumäe, Tanel; Orasmaa, Siim; Pilvik, Maarja-Liisa; Lindström, Liina, 2023, "Eesti taskuhäälingukorpus", https://doi.org/10.23673/RE-445, DATADOI, V1
Korpus koosneb eesti taskuhäälingusaadetest ja nende transkriptsioonidest. Korpuses on kokku 10 633 episoodi 184 erinevast taskuhäälingust, kogukestusega 10 918 tundi, mis on salvestatud vahemikus 2018–2022. Salvestused on transkribeeritud Tallinna Tehnikaülikooli automaatse kõnetuvastusega ning tekstid on automaatselt morfanalüüsitud EstNLTK-ga. K... |
Nov 14, 2023 - Suuline eesti keel arvudes
Lippus, Pärtel; Alumäe, Tanel; Orasmaa, Siim; Tsepelina, Katrin; Lindström, Liina, 2023, "Eesti Rahvusringhäälingu raadiosaadete korpus", https://doi.org/10.23673/RE-441, DATADOI, V1
Korpus koosneb ERR-i raadiosaadetest ja nende transkriptsioonidest. Korpuses on 53 000 raadiosaadet kogukestusega 16 tuhat tundi, mis on salvestatud vahemikus 1930–2022. Salvestused on transkribeeritud Tallinna Tehnikaülikooli automaatse kõnetuvastusega ning tekstid on automaatselt morfanalüüsitud EstNLTK-ga. Kokku on korpuses 109 miljonit sõna. Ko... |
Oct 23, 2023 - Eesti ja üldkeeleteaduse andmed
Lippus, Pärtel; Aare, Kätlin; Malmi, Anton; Tuisk, Tuuli; Teras, Pire, 2023, "Phonetic Corpus of Estonian Spontaneous Speech v1.3", https://doi.org/10.23673/RE-438, DATADOI, V1
The Phonetic Corpus of Estonian Spontaneous Speech consists of recordings that have been annotated on different linguistic tiers including words and segments and their boundaries in the speech signal. The corpus mainly contains dialogues. The corpus can be used for studying different phonetic and linguistic research questions and for training vario... |
Aug 21, 2023 - Eesti ja üldkeeleteaduse andmed
Vihman, Virve-Anneli; Miljan, Merilin, 2023, "Data for "A corpus study of grammatical case forms in written and spoken Estonian: Frequency, distribution and grammatical role"", https://doi.org/10.23673/RE-429, DATADOI, V1
This dataset makes available the sample of clauses used in the study "A corpus study of grammatical case forms in written and spoken Estonian: Frequency, distribution and grammatical role". It includes 751 clauses from the fiction subcorpus of the University of Tartu’s Balanced Corpus of Written Estonian (cl.ut.ee/korpused) and 758 clauses from the... |
Apr 20, 2023 - Eesti ja üldkeeleteaduse andmed
Veismann, Ann; Proos, Mariann; Taremaa, Piia, 2023, "Andmed ja R-i kood artiklile "Kas moos ja buss seisavad endiselt? "seisma"-verbi polüseemia ja seismise kehaline kogemus"", https://doi.org/10.23673/RE-403, DATADOI, V1
See andmekogu sisaldab kahe keeleteadusliku katse toorandmeid ja puhastatud andmeid, katsete tulemustel põhineb artikkel "Kas moos ja buss seisavad endiselt? "seisma"-verbi polüseemia ja seismise kehaline kogemus". Samuti on andmekogusse lisatud statistiliseks analüüsiks kasutatud R-i kood. |
Nov 23, 2022 - Eesti ja üldkeeleteaduse andmed
Lindström, Liina; Todesk, Triin; Pilvik, Maarja-Liisa, 2022, "Eesti murrete korpus", https://doi.org/10.23673/RE-365, DATADOI, V1
Eesti murrete korpus on kõiki eesti murdeid hõlmav elektrooniline andmekogu. Korpus koosneb helisalvestistest, foneetilises transkriptsioonis murdetekstidest, lihtsustatud transkriptsioonis murdetekstidest, morfoloogiliselt märgendatud tekstidest, süntaktiliselt märgendatud tekstidest ja metaandmetest. Selles repositooriumis on kättesaadavaks tehtu... |
