dc.contributor.author | Lindström, Liina | |
dc.contributor.author | Todesk, Triin | |
dc.contributor.author | Pilvik, Maarja-Liisa | |
dc.coverage.spatial | Eesti | en |
dc.coverage.spatial | Venemaa | en |
dc.date.accessioned | 2022-11-23T14:48:25Z | |
dc.date.available | 2022-11-23T14:48:25Z | |
dc.date.issued | 2022-11-23 | |
dc.identifier.uri | https://datadoi.ee/handle/33/492 | |
dc.identifier.uri | https://doi.org/10.23673/re-365 | |
dc.description.abstract | Eesti murrete korpus on kõiki eesti murdeid hõlmav elektrooniline andmekogu. Korpus koosneb helisalvestistest, foneetilises transkriptsioonis murdetekstidest, lihtsustatud transkriptsioonis murdetekstidest, morfoloogiliselt märgendatud tekstidest, süntaktiliselt märgendatud tekstidest ja metaandmetest. Selles repositooriumis on kättesaadavaks tehtud morfoloogiliselt märgendatud tekstid XML-formaadis ja nende põhjal koostatud märksõnade ja sõnaliikide sagedusloendid. Muude korpuse osadega saab tutvuda Tartu Ülikooli eesti murrete ja sugulaskeelte arhiivi kaudu lehel https://murdearhiiv.ut.ee/. | en |
dc.description.abstract | The corpus of Estonian dialects is an electronic database comprising data from all Estonian dialects. The corpus consists of audio recordings, dialect texts in phonetic transcription, dialect texts in simplified transcription, morphologically annotated texts, syntactically annotated texts, and metadata. In this repository, only the morphologically annotated texts in XML format along with frequency lists of lemmas and part-of-speech tags are made available. Other parts of the corpus can be accessed through the University of Tartu Archives of Estonian Dialects and Kindred Languages at https://murdearhiiv.ut.ee/. | en |
dc.format | XML | en |
dc.format | TXT | en |
dc.format | HTML | en |
dc.format | ZIP | en |
dc.language.iso | et | en |
dc.publisher | Tartu Ülikool, eesti ja üldkeeleteaduse instituut | en |
dc.relation | EKKM09-111 | en |
dc.relation | EKKM14-319 | |
dc.relation | TK145 | |
dc.rights | info:eu-repo/semantics/restrictedAccess | en |
dc.subject | murded | en |
dc.subject | korpus | en |
dc.subject | morfoloogiline märgendus | en |
dc.subject | murdeintervjuud | en |
dc.subject | dialects | en |
dc.subject | corpus | en |
dc.subject | morphological annotation | en |
dc.subject | dialect interviews | en |
dc.title | Eesti murrete korpus | en |
dc.type | info:eu-repo/semantics/dataset | en |