(English below) EESTI KEELES KIRJELDUS Siin repositooriumis on projekti "Eesti mitmekeelse keelekeskkonna andmestik" raames kogutud tekstid ja link keelemaastike pildikaardile. Materjal jaguneb järgmisteks osadeks: 1) Eesti-inglise kakskeelsete taskuhäälingute transkriptsioonid. 2) Discord keskkonna mitmekeelse vestluse transkriptsioonid. 3) Mitmekeelse keelemaastiku pildi kaardi link. 4) Eesti-inglise kakskeelsete laste suulise vestluse transkriptsioonid. 5) Ukraina uusimmigrantide laste kakskeelse arengu testi (MAIN) transkriptsioonid. Andmed on kogutud aastal 2023. Selle korpuse versioon (v.1.0) on kompileeritud 31.03.2024 aasta seisuga. Repositoorium sisaldab järgmisi avalikult kasutatavaid faile, mille esinumber viitab kollektsiooniosale: 1eesti_inglise_kakskeelsete_taskuhäälingute_transkpriptsioonid.zip 1eesti_inglise_kakskeelsete_taskuhäälingute_helifailid.zip 1eesti_inglise_kakskeelsete_taskuhäälingute_metadata.xlsx 2discordi_keskkonna_mitmekeelsete_vestluste_transkriptsioonid.zip 3keelemaastike_kaardi_link_kirjeldus.txt 4varajase_kakskeelsuse_materjalide_transkriptsioonid_cha.zip 5MAIN_eestikeelsete_jutustuste_transkriptsioonid_cha.zip 5MAIN_ukrainakeelsete_jutustuste_transkriptsioonid_cha.zip JUURDEPÄÄS Datadoi.ee repositooriumis registreeritud andmestikud on kasutamiseks avatud Creative Commons litsentsi alusel. Isiklikku infot sisaldanud tekstid on anonümiseeritud ning isiklikke andmeid sisaldavad kollektsioonimaterjalid pole avalikult kättesaadavad. MAIN-testide ja Discordi vestluste helifailid on kättesaadavad uurijatele konfidentsiaalsuskohustuse alusel, mis peab olema esitatud Tallinna Ülikooli Humanitaarinstituudile, ning tingimusel, et failikoopiaid kaitstakse kolmandate isikute kätte sattumiseks ega publitseerita isiku tuvastamist võimaldavaid andmeid. Palun kirjutage Olga Gerassimenkole (olga.gerassimenko@tlu.ee), kui vajate juurdepääsu kollektsiooni mitteavalikele failidele. VIITAMINE Palun viidake sellele andmestikule järgmiselt: Verschik, Anna, Reili Agrus, Piret Baird, Kapitolina Fedorova, Olga Gerassimenko, Helin Kask, Andra Kütt-Leedis, Natalia Tšuikina 2023. Eesti mitmekeelse keelekeskkonna andmestik v.1.0. Humanitaarteaduste instituut, Tallinna Ülikool (DOI). KONTAKT Täiendavate küsimuste korral pöörduge: Anna Verschik üldkeeleteaduse professor (TLÜ) anna.verschik@tlu.ee Olga Gerassimenko nooremteadur (TLÜ) olga.gerassimenko@tlu.ee ENGLISH DESCRIPTION This repository contains the texts collected within the framework of the project "Estonian Multilingual Linguistic Environment Dataset" and a link to a map of linguistic landscapes. The material is divided into the following sections: 1) Transcriptions of Estonian-English bilingual pocket pronunciations. 2) Transcripts of multilingual conversations in the Discord environment. 3) Link to the map of the multilingual linguistic landscape. 4) Estonian-English bilingual children's oral conversation transcriptions. 5) Transcripts of the Ukrainian New Immigrant Children Bilingual Development Test (MAIN). The data were collected in 2023. The version of this corpus (v.1.0) was compiled as of 31.03.2024. The repository contains the following publicly available files, with a prefix referring to the collection item: 1eesti_inglise_kakskeelsete_taskuhäälingute_transkpriptsioonid.zip - podcast transcripts (txt) 1eesti_inglise_kakskeelsete_taskuhäälingute_helifailid.zip - podcast soundfiles 1eesti_inglise_kakskeelsete_taskuhäälingute_metadata.xlsx - podcast metadata 2discordi_keskkonna_mitmekeelsete_vestluste_transkriptsioonid.zip - Discord conversation transcripts (txt) 3keelemaastike_kaardi_link_kirjeldus.txt - description of linguistic landscapes map and link 4varajase_kakskeelsuse_materjalide_transkriptsioonid_cha.zip - early bilingualism data transcripts (cha) 5MAIN_eestikeelsete_jutustuste_transkriptsioonid_cha.zip - MAIN test Estonian data transcripts (cha) 5MAIN_ukrainakeelsete_jutustuste_transkriptsioonid_cha.zip - MAIN test Ukrainian data transcripts (cha) ACCESS The datasets registered in the Datadoi.ee repository are open for use under a Creative Commons license. Texts containing personal information have been anonymised, and collection materials containing personal information are not publicly available. The audio files of the MAIN tests and Discord conversations are available to researchers under a confidentiality agreement presented to the Tallinn University Institute of Humanities, and on condition that the file copies are protected from disclosure to third parties and that no personally identifiable information is published. Please contact Olga Gerassimenko (olga.gerassimenko@tlu.ee) if you need access to non-public files in the collection. REFER TO Please cite this collection as follows: Verschik, Anna, Reili Agrus, Piret Baird, Kapitolina Fedorova, Olga Gerassimenko, Helin Kask, Andra Kütt-Leedis, Natalia Chuikina 2023. Estonian Multilingual Language Environment Dataset v.1.0. Institute of Humanities, Tallinn University (DOI). CONTACT For further questions please contact: Anna Verschik Professor of General Linguistics (Tallinn University). anna.verschik@tlu.ee Olga Gerassimenko Junior Researcher (Tallinn University) olga.gerassimenko@tlu.ee