tekstýnas (lot. textum – audeklas, pynė, sujungimas), kompiuterinių tekstų rinkinys. Reprezentuoja kurią nors kalbą ar jos atmainą (pvz., tam tikrą funkcinį stilių). Pagal tam tikrus principus sudaromas tekstynas leidžia atlikti automatinę kalbos analizę, nustatyti žodžių bei jų formų vartosenos dažnumą, jų ryšį su tam tikru kontekstu ir kita. Tekstynas plačiai naudojamas rengiant įvairius žodynus, tiriant gramatinę kalbos sandarą, žodžių tvarką ir kita. Tipologiškai tekstynai skirstomi pagal komunikacijos kanalą (rašytinės ir sakytinės kalbos tekstynai), pateikimo ir saugojimo formą (tekstiniai ir multimodaliniai, t. y. duomenų bazės su garso ir vaizdo įrašais ir jų transkripcija), kalbų skaičių (vienkalbiai, dvikalbiai, daugiakalbiai, lygiagretieji tekstynai), kalbos anotavimą (neanotuoti, morfologiškai, fonetiškai ar sintaksiškai anotuoti), aprėptį (bendrieji ir specializuoti), reprezentuojamos kalbos pobūdį (sinchroniniai ir diachroniniai tekstynai). Tekstynus sudarymo ir naudojimo principus bei metodus tiria tekstynų lingvistika (anglų k. corpus linguistic).

LIETUVIŲ kalba kaupiama dabartinės lietuvių kalbos tekstynas (140,9 mln. žodžių), lietuvių mokslo kalbos (apie 9 mln. žodžių), lygiagretusis tekstynas (anglų, lietuvių, čekų kalbomis; apie 8 mln. žodžių), sakytinės lietuvių kalbos tekstynas (apie 230 000 žodžių; visi tesktynai 2014), sakytinės žiniasklaidos tesktynas (apie 300 000 žodžių; 1960–2010) ir kiti tekstynai.

Papildoma informacija
Turinys
Bendra informacija
Straipsnio informacija
Autorius (-iai)
Redaktorius (-iai)
Publikuota
Redaguota
Siūlykite savo nuotrauką