DataDOI
    • English
    • Eesti
  • English 
    • English
    • Eesti
  • Login
View Item 
  •   DataDOI
  • Humaniora
  • Eesti ja üldkeeleteaduse instituut
  • Eesti ja üldkeeleteaduse andmed
  • View Item
  •   DataDOI
  • Humaniora
  • Eesti ja üldkeeleteaduse instituut
  • Eesti ja üldkeeleteaduse andmed
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Eesti murrete korpus

Lindström, Liina; Todesk, Triin; Pilvik, Maarja-Liisa
  • BibTex
  • EndNote (RIS)
Loading
NameSizeDescription
README.txt4.800Kb
metaandmed_murded.txt740bytesKorpuse ülevaade murdeti
metaandmed_konelejad_anon.txt41.59KbKorpuse ülevaade kõnelejati
sagedusloend_lemma_liik.txt407.0KbMärksõnade ja sõnaliikide sagedusloend
sagedusloend_lemma_liik_murdeti.txt1.219MbMärksõnade ja sõnaliikide sagedusloend murdeti
metaandmed_konelejad.txt50.63KbKorpuse ülevaade kõnelejati (nimedega)
morf_korpus.zip13.26MbMorfoloogiliselt märgendatud failid
murdekorpus.html14.09Mb
Thumbnail
Date
2022-11-23
URI
https://datadoi.ee/handle/33/492
http://dx.doi.org/10.23673/re-365
Metadata
Show full item record
Abstract
Eesti murrete korpus on kõiki eesti murdeid hõlmav elektrooniline andmekogu. Korpus koosneb helisalvestistest, foneetilises transkriptsioonis murdetekstidest, lihtsustatud transkriptsioonis murdetekstidest, morfoloogiliselt märgendatud tekstidest, süntaktiliselt märgendatud tekstidest ja metaandmetest. Selles repositooriumis on kättesaadavaks tehtud morfoloogiliselt märgendatud tekstid XML-formaadis ja nende põhjal koostatud märksõnade ja sõnaliikide sagedusloendid. Muude korpuse osadega saab tuutvuda Tartu Ülikooli eesti murrete ja sugulaskeelte arhiivi kaudu lehel https://murdearhiiv.ut.ee/....  Show more  Show less
 
The corpus of Estonian dialects is an electronic database comprising data from all Estonian dialects. The corpus consists of audio recordings, dialect texts in phonetic transcription, dialect texts in simplified transcription, morphologically annotated texts, syntactically annotated texts, and metadata. In this repository, only the morphologically annotated texts in XML format along with frequency lists of lemmas and part-of-speech tags are made available. Other parts of the corpus can be accesssed through the University of Tartu Archives of Estonian Dialects and Kindred Languages at https://murdearhiiv.ut.ee/....  Show more  Show less
 
Keyword
murded; korpus; morfoloogiline märgendus; murdeintervjuud; dialects; corpus; morphological annotation; dialect interviews
Item type
info:eu-repo/semantics/dataset
Collections
  • Eesti ja üldkeeleteaduse andmed

University of Tartu Library
Open Science
Contact Us
DSpace software
Mirage 2 Theme
 

 

Browse

Communities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

LoginRegister

Statistics

View Usage Statistics

University of Tartu Library
Open Science
Contact Us
DSpace software
Mirage 2 Theme