Dolnoserbski tekstowy korpus

(Komfortne pytanje w nowem korpusu)

Žrědła

Na toś tom boce namakajośo informacije wó tekstach, kótarež su se wobźěłowali za komfortne pytanje w Dolnoserbskem tekstowem korpusu (nowy korpus). Slědujo nalicenje wobstatkow nowego korpusa, kótaryž se stawnje wutwarjujo.

DSB-REF
Dolnoserbski referencny korpus
Pla dolnoserbskego referencnego korpusa jadna se wó zběrku něźi 68.000 fragmentow z dolnoserbskich tekstow z lět 1990 do 2015. Korpus zapśimjejo dogromady něźi milion tekstowych słow (tokenow) a stoj za nowše dolnoserbske pismojstwo. Zakład za pśipadne wuzwólenje tekstowych fragmentow jo twóriła baza 3,5 milionow tokenow z wudaśow tyźenika „Nowy Casnik“ (ca. 69%) a lětnego kalendarja „Pratyja“ (31%).
Wuźěłanje referencnego korpusa jo se spěchowało wót Logo Załožby za serbski lud Załožby za serbski lud, kótaraž dostawa lětnje pódpěru z dankowych srědkow na zakłaźe góspodaŕskich planow, wobzamknjonych wót Zwězkowego sejma, Krajnego sejma Bramborskeje a Sakskego krajnego sejma.
DSB-HIST
Historiske pismojstwo (Dolnoserbska digitalna biblioteka)
Toś ta zběrka wobpśimujo historiske publicistiske, beletristiske a wěcne teksty z nabóžninskim a swětnym wopśimjeśim, kótarež su za lekturu pśigótowane w Dolnoserbskej digitalnej bibliotece. Korpus zapśimjejo tuchylu něźi 15 milionow tekstowych słow (tokenow) a se sukcesiwnje rozšyrja.