Browsing Eesti ja üldkeeleteaduse andmed by Title

Inari Saami geminates

Türk, Helen; Lippus, Pärtel; Pajusalu, Karl; Teras, Pire (2018-11-08)

Data extracted from the Inari Saami prosody corpus (http://dx.doi.org/10.15155/1-00-0000-0000-0000-00150L), used in Türk et al (2018). The Acoustic Correlates of Quantity in Inari Saami. Journal of Phonetics. Target words ...

Kodavere kihelkonnas 19. sajandil sündinud lapsed

Edela, Anna (2019)

Anna Edela bakalaureusetöös kasutatud andmed, mis pärinevad 19. sajandi EELK Kodavere koguduse sünnimeetrikatest, mis on üleval Eesti ajalooarhiivi Saaga andmebaasis. Need sisaldavad Kodavere kihelkonnas 1835., 1840., ...

Labiilsus liivi keeles

Rünkla, Mihkel (Tartu Ülikool, 2025)

Andmekogu sisaldab magistritöös "Labiilsus liivi keeles" (Rünkla 2025) analüüsitud 120 kuraliivi verbi (millest 68 on prototüüpselt labiilsed) koos magistritöö jaoks tehtud märgendustega.

Lisad artiklile "“Pealkiri paneb rattad käima”: uurimus pealkirjadest ja pealkirjastamise protsessist"

Miilman, Eleriin; Teiva, Nele Karolin; Tammepõld, Marri-Mariska; Roos, Reena; Komissarov, Liisa-Maria; Kiik, Laura; Tragel, Ilona (Tartu Ülikool, eesti ja üldkeeleteaduse instituut, 2025)

Lisad kuuluvad artikli "“Pealkiri paneb rattad käima”: uurimus pealkirjadest ja pealkirjastamise protsessist" juurde, mis ilmub 2025 kevadel Eesti Rakenduslingvistika Ühingu aastaraamatus.

Meadow Mari Prosody data

Lehiste, Ilse; Teras, Pire; Help, Toomas; Lippus, Pärtel; Meister, Einar; Pajusalu, Karl; Viitso, Tiit-Rein (2005)

This dataset contains the segmental durations, F0 measurements and formant values F1-F3 from the vowels in 1-4 syllable words in Meadow Mari, a Finno-Ugric language. 8 native speakers read a list of 100 sentences, each ...

(Non-)Literalness ratings for Estonian particle verbs

Aedmaa, Eleri (2018-06)

(Non-)literalness dataset of 1481 sentences formed with 184 Estonian particle verbs. Sentences are evaluated by 3 native speakers of Estonian on a 6-point scale [0,5] indicating the degree of compositionality of a particle ...

Phonetic Corpus of Estonian Spontaneous Speech v1.2

Lippus, Pärtel; Aare, Kätlin; Malmi, Anton; Tuisk, Tuuli; Teras, Pire (Institute of Estonian and General Linguistics, University of Tartu, 2021-09-08)

The Phonetic Corpus of Estonian Spontaneous Speech consists of recordings that have been annotated on different linguistic tiers including words and segments and their boundaries in the speech signal. The corpus mainly ...

Phonetic Corpus of Estonian Spontaneous Speech v1.3

Lippus, Pärtel; Aare, Kätlin; Malmi, Anton; Tuisk, Tuuli; Teras, Pire (Institute of Estonian and General Linguistics, University of Tartu, 2023-10-20)

The Phonetic Corpus of Estonian Spontaneous Speech consists of recordings that have been annotated on different linguistic tiers including words and segments and their boundaries in the speech signal. The corpus mainly ...

Pretrained word and multi-sense embeddings for Estonian

Aedmaa, Eleri (2019)

Word and multi-sense embedding for Estonian trained on lemmatized etTenTen: Corpus of the Estonian Web. Word embeddings are trained with word2vec. Sense embeddings are trained with SenseGram. Sense inventory is induced ...

The quality and quantity of Estonian intervocalic /l/ (data)

Malmi, Anton (2014)

Quantity-related variation of duration, pitch and vowel quality in spontaneous Estonian (data)

Lippus, Pärtel; Asu-Garcia, Eva Liina; Teras, Pire; Tuisk, Tuuli (2013)

This dataset is collected from the University of Tartu Phonetic Corpus of Estonian Spontaneous Speech. The dataset consists of words with CVCV (consonant-vowel-consonant-vowel) and CVCCV structure and it has been collected ...

Tartu Ülikooli liivi keele korpus

Norvik, Miina; Tuisk, Tuuli (Tartu Ülikool, eesti ja üldkeeleteaduse instituut, 2024-06-29)

Tartu Ülikooli liivi keele korpus on liivi keele näiteid koondav elektrooniline andmekogu. Esindatud on nii idaliivi, lääneliivi kui ka Īra keelekasutus. Suurem osa korpusesse koondatud materjalist pärineb kolmest ...

Utterance Final Weakening (UFW) in Pite Saami (v1.0)

Wilbur, Joshua (Institute of Estonian and General Linguistics, University of Tartu, 2025-02-19)

A .json file containing data for 182 instances of Utterance Final Weakening (UFW) in Pite Saami, a Uralic language spoken in and around the Arjeplog municipality in northern Sweden and adjacent areas in Norway. The dataset ...

Vene emakeelega õppijate häälduskorpus

Malmi, Anton; Leppik, Katrin (Tartu Ülikool, Eesti ja Üldkeeleteaduse Instituut, 2024-06-11)

Projekti raames koguti erineva keeletaseme ja -taustaga eesti keele õppijatelt häälduskorpus. Salvestused korpuse jaoks tehti enne ja pärast hääldustreeningut ning hääldustreeningu ajal. Hääldustreeninguks kasutati ...