Tartu Ülikooli liivi keele korpus
Norvik, Miina; Tuisk, Tuuli
Loading
Name | Size | Description |
---|---|---|
README.txt | 2.732Kb | README-file |
liivi_korpuse_taustaks.txt | 2.739Kb | Taustainfo liivi keele korpuse kohta |
metaandmed_kirjalikud.csv | 40.25Kb | Ülevaade keelejuhtidest |
sagedusloend_tyyp_murre_kyla.csv | 586bytes | Sagedusloend teksti tüübi, murde ja küla kaupa |
sagedusloend_kirjalik_lemma_pos.csv | 53.99Kb | Sagedusloend lemma ja sõnaliigi kaupa |
sagedusloend_kirjalik_liik_vorm.csv | 8.860Kb | Sagedusloend sõnaliigi ja vormi kaupa |
sagedusloend_sonad_kokku.csv | 43bytes | Korpuses esinevate sõnade koguarv |
morf_liv_korpus.zip | 1.595Mb | Morfoloogiliselt märgendatud failid XML-formaadis |
Abstract
Tartu Ülikooli liivi keele korpus on liivi keele näiteid koondav elektrooniline andmekogu. Esindatud on nii idaliivi, lääneliivi kui ka Īra keelekasutus. Suurem osa korpusesse koondatud materjalist pärineb kolmest tekstikogumikust, kuid kasutatud on ka lindistuste litereeringuid. Sellest repositooriumist leiab morfoloogiliselt märgendatud tekstid XML-formaadis ning nende põhjalt (üksnes kirjalike tekstide kohta) koostatud märksõnade, sõnaliikide ja -vormide sagedusloendid ning keelejuhtide metaaandmed. Korpusest saab teha päringuid aadressilt https://www.murre.ut.ee, valides keeleks liivi keele. TÜ liivi keele korpus kuulub eesti murrete korpuse juurde.... Show more Show less
The Livonian language corpus of the University of Tartu is an electronic database that includes inguistic data on Livonian. The language use of the speakers from the Eastern Livonian, Western Livonian and Ira dialectal areas are represented. Most of the linguistic material found in the corpus mainly originates from three collections of texts, but transcriptions of recordings of spoken language data have also been used. This repository contains morphologically annotated texts in XML format along with frequency lists of lemmas, part-of-speech tags, morphological forms as well as metadata (only for written texts). The corpus can be accessed at https://www.murre.ut.ee by selecting Livonian as the language. The Livonian language corpus is part of the corpus of Estonian dialects.... Show more Show less