Instituudi põhiülesanne on teha õppe- ning teadus- ja arendustööd ning osutada ühiskonnale vajalikke teenuseid eesti keele, soome-ugri keelte ja üldkeeleteaduse alal.

The Institute of Estonian and General Linguistics conducts in-depth teaching and world-class research on Estonian and related languages in comparison with other world languages.

Featured Dataverses

In order to use this feature you must have at least one published or linked dataverse.

Publish Dataverse

Are you sure you want to publish your dataverse? Once you do so it must remain published.

Publish Dataverse

This dataverse cannot be published because the dataverse it is in has not been published.

Delete Dataverse

Are you sure you want to delete your dataverse? You cannot undelete this dataverse.

Advanced Search

11 to 20 of 38 Results
Jun 11, 2024 - Eesti ja üldkeeleteaduse andmed
Malmi, Anton; Leppik, Katrin, 2024, "Vene emakeelega õppijate häälduskorpus", https://doi.org/10.23673/RE-467, DATADOI, V1
Projekti raames koguti erineva keeletaseme ja -taustaga eesti keele õppijatelt häälduskorpus. Salvestused korpuse jaoks tehti enne ja pärast hääldustreeningut ning hääldustreeningu ajal. Hääldustreeninguks kasutati mobiilirakendust SayEst. Pärast andmete kogumist transkribeeriti salvestused häälikutasandini ning andmestikku kasutatati eesti keele t...
May 31, 2024 - Suuline eesti keel arvudes
Lippus, Pärtel; Lõo, Kaidi; Malmi, Anton; Pilvik, Maarja-Liisa, 2024, "Suuline eesti keel arvudes. Sagedusandmestikud", https://doi.org/10.23673/RE-463, DATADOI, V1
Siin repositooriumis on projekti "Suuline eesti keel arvudes" raames koostatud sagedusandmestikud, mis kirjeldavad suulist eesti keelt. Andmestikud põhinevad Eesti keele spontaanse kõne korpusel, Teismeliste Keel Eestis korpusel ning käesoleva projekti raames kogutud ERR-i ja taskuhäälingu korpustel. Esitatud on sõna- ja lemmasagedusi ning n-gramme...
Feb 22, 2024 - Eesti ja üldkeeleteaduse andmed
Vihman, Virve-Anneli; Pilvik, Maarja-Liisa; Mandel, Aive; Kängsepp, Annika; Aigro, Mari; Koreinik, Kadri; Praakli, Kristiina; Lindström, Liina, 2024, "Estonian Teen Language Corpus", https://doi.org/10.23673/RE-455, DATADOI, V1
Estonian Teen Language Corpus (Eesti teismeliste keele korpus) is a corpus representing spoken and written language data, collected from Estonian teenagers (ages 9-18) between 2019-2023. The corpus consists of four types of files. Spoken language data is represented by .eaf and .tsv files (spoken_eaf.zip, spoken_tsv.zip), and contain transcriptions...
Dec 28, 2023 - Suuline eesti keel arvudes
Lippus, Pärtel; Pilvik, Maarja-Liisa; Lõo, Kaidi; Lindström, Liina, 2023, "Kõnetempo ja -soravuse varieerumine eesti keeles (data)", https://doi.org/10.23673/RE-452, DATADOI, V1
Siin repositooriumis on kõnetempo ja -soravuse andmestikud ja nende analüüsiks kasutatud R kood, mida on kasutatud artiklis: Pärtel Lippus, Maarja-Liisa Pilvik, Kaidi Lõo, Liina Lindström. 2024. Kõnetempo ja -soravuse varieerumine eesti keeles. Eesti Rakenduslingvistika aastaraamat 20. // This is the data & code for analysing speech rate and fluenc...
Nov 17, 2023 - Suuline eesti keel arvudes
Lippus, Pärtel; Alumäe, Tanel; Orasmaa, Siim; Pilvik, Maarja-Liisa; Lindström, Liina, 2023, "Eesti taskuhäälingukorpus", https://doi.org/10.23673/RE-445, DATADOI, V1
Korpus koosneb eesti taskuhäälingusaadetest ja nende transkriptsioonidest. Korpuses on kokku 10 633 episoodi 184 erinevast taskuhäälingust, kogukestusega 10 918 tundi, mis on salvestatud vahemikus 2018–2022. Salvestused on transkribeeritud Tallinna Tehnikaülikooli automaatse kõnetuvastusega ning tekstid on automaatselt morfanalüüsitud EstNLTK-ga. K...
Nov 14, 2023 - Suuline eesti keel arvudes
Lippus, Pärtel; Alumäe, Tanel; Orasmaa, Siim; Tsepelina, Katrin; Lindström, Liina, 2023, "Eesti Rahvusringhäälingu raadiosaadete korpus", https://doi.org/10.23673/RE-441, DATADOI, V1
Korpus koosneb ERR-i raadiosaadetest ja nende transkriptsioonidest. Korpuses on 53 000 raadiosaadet kogukestusega 16 tuhat tundi, mis on salvestatud vahemikus 1930–2022. Salvestused on transkribeeritud Tallinna Tehnikaülikooli automaatse kõnetuvastusega ning tekstid on automaatselt morfanalüüsitud EstNLTK-ga. Kokku on korpuses 109 miljonit sõna. Ko...
Oct 23, 2023 - Eesti ja üldkeeleteaduse andmed
Lippus, Pärtel; Aare, Kätlin; Malmi, Anton; Tuisk, Tuuli; Teras, Pire, 2023, "Phonetic Corpus of Estonian Spontaneous Speech v1.3", https://doi.org/10.23673/RE-438, DATADOI, V1
The Phonetic Corpus of Estonian Spontaneous Speech consists of recordings that have been annotated on different linguistic tiers including words and segments and their boundaries in the speech signal. The corpus mainly contains dialogues. The corpus can be used for studying different phonetic and linguistic research questions and for training vario...
Aug 21, 2023 - Eesti ja üldkeeleteaduse andmed
Vihman, Virve-Anneli; Miljan, Merilin, 2023, "Data for "A corpus study of grammatical case forms in written and spoken Estonian: Frequency, distribution and grammatical role"", https://doi.org/10.23673/RE-429, DATADOI, V1
This dataset makes available the sample of clauses used in the study "A corpus study of grammatical case forms in written and spoken Estonian: Frequency, distribution and grammatical role". It includes 751 clauses from the fiction subcorpus of the University of Tartu’s Balanced Corpus of Written Estonian (cl.ut.ee/korpused) and 758 clauses from the...
Apr 20, 2023 - Eesti ja üldkeeleteaduse andmed
Veismann, Ann; Proos, Mariann; Taremaa, Piia, 2023, "Andmed ja R-i kood artiklile "Kas moos ja buss seisavad endiselt? "seisma"-verbi polüseemia ja seismise kehaline kogemus"", https://doi.org/10.23673/RE-403, DATADOI, V1
See andmekogu sisaldab kahe keeleteadusliku katse toorandmeid ja puhastatud andmeid, katsete tulemustel põhineb artikkel "Kas moos ja buss seisavad endiselt? "seisma"-verbi polüseemia ja seismise kehaline kogemus". Samuti on andmekogusse lisatud statistiliseks analüüsiks kasutatud R-i kood.
Nov 23, 2022 - Eesti ja üldkeeleteaduse andmed
Lindström, Liina; Todesk, Triin; Pilvik, Maarja-Liisa, 2022, "Eesti murrete korpus", https://doi.org/10.23673/RE-365, DATADOI, V1
Eesti murrete korpus on kõiki eesti murdeid hõlmav elektrooniline andmekogu. Korpus koosneb helisalvestistest, foneetilises transkriptsioonis murdetekstidest, lihtsustatud transkriptsioonis murdetekstidest, morfoloogiliselt märgendatud tekstidest, süntaktiliselt märgendatud tekstidest ja metaandmetest. Selles repositooriumis on kättesaadavaks tehtu...
Add Data

Sign up or log in to create a dataverse or add a dataset.

Share Dataverse

Share this dataverse on your favorite social media networks.

Link Dataverse
Reset Modifications

Are you sure you want to reset the selected metadata fields? If you do this, any customizations (hidden, required, optional) you have done will no longer appear.