DataDOI
    • English
    • Eesti
  • Eesti 
    • English
    • Eesti
  • Logi sisse
Vaata 
  •   DataDOI
  • UT Humaniora
  • Eesti ja üldkeeleteaduse instituut
  • Eesti ja üldkeeleteaduse andmed
  • Vaata
  •   DataDOI
  • UT Humaniora
  • Eesti ja üldkeeleteaduse instituut
  • Eesti ja üldkeeleteaduse andmed
  • Vaata
JavaScript is disabled for your browser. Some features of this site may not work without it.

Eesti murrete korpus

Lindström, Liina; Todesk, Triin; Pilvik, Maarja-Liisa
  • Export to BibTex
  • EndNote (RIS)
Loading
NimiSuurusKirjeldus
README.txt4.800Kb
metaandmed_murded.txt740baididKorpuse ülevaade murdeti
metaandmed_konelejad_anon.txt41.59KbKorpuse ülevaade kõnelejati
sagedusloend_lemma_liik.txt407.0KbMärksõnade ja sõnaliikide sagedusloend
sagedusloend_lemma_liik_murdeti.txt1.219MbMärksõnade ja sõnaliikide sagedusloend murdeti
metaandmed_konelejad.txt50.63KbKorpuse ülevaade kõnelejati (nimedega)
morf_korpus.zip13.26MbMorfoloogiliselt märgendatud failid
murdekorpus.html14.09Mb
Thumbnail
Kuupäev
2022-11-23
URI
https://datadoi.ee/handle/33/492
https://doi.org/10.23673/re-365
Metaandmed
Näita täielikku nimetuse kirjet
Kokkuvõte
Eesti murrete korpus on kõiki eesti murdeid hõlmav elektrooniline andmekogu. Korpus koosneb helisalvestistest, foneetilises transkriptsioonis murdetekstidest, lihtsustatud transkriptsioonis murdetekstidest, morfoloogiliselt märgendatud tekstidest, süntaktiliselt märgendatud tekstidest ja metaandmetest. Selles repositooriumis on kättesaadavaks tehtud morfoloogiliselt märgendatud tekstid XML-formaadis ja nende põhjal koostatud märksõnade ja sõnaliikide sagedusloendid. Muude korpuse osadega saab tuutvuda Tartu Ülikooli eesti murrete ja sugulaskeelte arhiivi kaudu lehel https://murdearhiiv.ut.ee/....  Rohkem  Vähem
 
The corpus of Estonian dialects is an electronic database comprising data from all Estonian dialects. The corpus consists of audio recordings, dialect texts in phonetic transcription, dialect texts in simplified transcription, morphologically annotated texts, syntactically annotated texts, and metadata. In this repository, only the morphologically annotated texts in XML format along with frequency lists of lemmas and part-of-speech tags are made available. Other parts of the corpus can be accesssed through the University of Tartu Archives of Estonian Dialects and Kindred Languages at https://murdearhiiv.ut.ee/....  Rohkem  Vähem
 
Märksõna
murded; korpus; morfoloogiline märgendus; murdeintervjuud; dialects; corpus; morphological annotation; dialect interviews
Kirje tüüp
info:eu-repo/semantics/dataset
Kollektsioonid
  • Eesti ja üldkeeleteaduse andmed

Tartu Ülikooli raamatukogu
Avatud teadus
Võta ühendust
DSpace software
Mirage 2 Theme
 

 

Sirvi

Valdkonnad ja andmekogumidAastaAutoridPealkirjadMärksõnadSelles andmekogumisAastaAutoridPealkirjadMärksõnad

Minu konto

Logi sisseRegistreeri

Statistika

Vaata kasutusstatistikat

Tartu Ülikooli raamatukogu
Avatud teadus
Võta ühendust
DSpace software
Mirage 2 Theme