Niedersorbisches Textkorpus

(Komfortsuche im neuen Korpus)

Quellen

Auf dieser Seite finden Sie Informationen zu den Texten, die für die Komfortsuche im Niedersorbischen Textkorpus aufbereitet worden sind (neues Korpus). Es folgt eine Auflistung der Bestandteile des neuen Korpus, das sich noch im Aufbau befindet.

DSB-HIST

Historisches Schrifttum (Niedersorbische Digitale Bibliothek)

Die Sammlung umfasst historische publizistische und belletristische Texte sowie Sachtexte mit religiösen und weltlichen Inhalten, für die auch ein separater Lesezugang in der Niedersorbischen Digitalen Bibliothek bereitgestellt wurde. Das Korpus umfasst derzeit insgesamt knapp 15 Millionen Textwörter (Tokens) und wird weiter ausgebaut.

Das Vorhaben wurde gefördert durch Logo der Beauftragten der Bundesregierung für Kultur und Medien die Beauftragte der Bundesregierung für Kultur und Medien und zwar als Modul des kooperativen Strukturwandel-Sofortprojekts Inwertsetzung des immateriellen Kulturerbes im deutsch-slawischen Kontext.

Informationen zu den enthaltenen Texten finden im Katalog der Niedersorbischen Digitalen Bibliothek.

DSB-NOW

Neuestes niedersorbisches Schrifttum (ab 2019)

Das Korpus besteht aus Texten, die im Rahmen des Projekts Ständiges Monitoring des ober- und niedersorbischen Schrifttums aufbereitet wurden. Seit 2019 liefert der Domowina-Verlag auf Grundlage einer Vereinbarung mit dem Sorbischen Institut und der Stiftung für das sorbische Volk als Basis die im Jahresverlauf veröffentlichten niedersorbischen Texte. Diese werden dann im Sorbischen Institut zu hochwertigen Korpustexten verarbeitet, z. B. weitgehend lemmatisiert. Da ein Großteil des aktuellen Schrifttums im Domowina-Verlag erscheint, deckt das Korpus einen wesentlichen Teil des neusten niedersorbischen Schrifttums ab. (Es umfasst in Einzelfällen auch Neuausgaben oder Übersetzungen älterer Texte; auch finden sich z. B. in den publizistischen Quellen nicht selten ältere Texte oder Textfragmente.)

Das aktuelle Korpus enthält alle im Rahmen des Projekts bearbeiteten Texte der Jahre 2019–2022 und wird zukünftig jährlich erweitert. Das Korpus des neuesten niedersorbischen Schrifttumgs umfasst zurzeit etwa 2 Millionen Tokens (laufende Textwörter). Sie sind hier in Form von über 150 000 Fragmenten (meist Sätzen) zugänglich und durchsuchbar. Eine umfangreichere oder gar vollständige Präsentation der Texte – wie beim Korpus „Historisches Schrifttum“ – ist aus urheberrechtlichen Gründen nicht möglich.

Das Logo der Stiftung für das sorbische Volk ständige Monitoring des ober- und niedersorbischen Schrifttums wird gefördert durch die Stiftung für das sorbische Volk, die jährlich auf der Grundlage der beschlossenen Haushalte des Deutschen Bundestages, des Landtages Brandenburg und des Sächsischen Landtages Zuwendungen aus Steuermitteln erhält.

Die Textfragmente entstammen folgenden Veröffentlichungen und decken deren niedersorbische Textanteile vollständig ab:
2019
  • Nowy Casnik 70 (2019) 11–13, 15–52
  • Rozhlad (2019) 1–12
  • Serbska pratyja 2020
  • Bóže słowo na kuždy źeń 2020. Gronka ochranojskeje bratšojskeje wósady / zest. Hartmut S. Leipner. — Budyšyn: LND, 2019. — 120 s.
  • Findus a kokot-spiwarik / Sven Nordqvist. Pśeł. Madlena Norberg. — Budyšyn: LND, 2019. — 32 s.: il.
  • Kšet Knut a bur Žur / Jurij Koch. Il. Cleo-Petra Kurze. — Budyšyn: LND, 2019. — 28 s.: il.
  • Mejstaŕ Krabat. Dušny serbski guslowaŕ / Měto Nowak-Njechorński. Pśeł. Wylem Bjero. — Budyšyn: LND, 2019. — 48 s.: il.
  • Wósłonki mójogo žywjenja / Erwin Hanuš. — Budyšyn: LND, 2019. — 200 s.: il.
2020
  • Nowy Casnik 71 (2020) 1–53
  • Rozhlad (2020) 1–12
  • Serbska pratyja 2021
  • Bóže słowo na kuždy źeń 2021. Gronka ochranojskeje bratšojskeje wósady / zest. Hartmut S. Leipner. — Budyšyn: LND, 2020. — 120 b.
  • Rybkow połne kupadło. Šybałe basni za źiśi / Dorothea Šołćina. Ilustrěrowała Barbara Schumann. — Budyšyn: LND, 2020. — 48 b.: il.
  • Slědne dny Strowja / Angela Stachowa. Z górnoserbšćiny pśestajił Hartmut S. Leipner. Wobalka a ilustracije: Sofija Natuškec. — Budyšyn: LND, 2020. — 74 b.: il.
  • Wuchack głupack a druge tšojeńka / Jill-Francis Ketlicojc. Ilustrěrował Thomas Binder. — Budyšyn: LND, 2020. — 64 b.: il.
  • Wósłonki mójogo žywjenja / Erwin Hanuš. — Budyšyn: LND, 2019, wuśišć 2020. — 200 b.: il.
2021
  • Nowy Casnik 72 (2021) 1–52
  • Rozhlad (2021) 1–12
  • Serbska pratyja 2022
  • Basnjeca banjawa / Źilka. Ilustrěrowała Martina Burghart-Vollhardt — Budyšyn: LND, 2021. — 40 b.: il.
  • Bóže słowo na kuždy źeń 2022. Gronka ochranojskeje bratšojskeje wósady / zest. Hartmut S. Leipner. — Budyšyn: LND, 2021. — 120 s.
  • Pyšnje woblacone : dolnoserbska rejowańska drastwa = Schön gekleidet : die niedersorbische/wendische Tanztracht / Doris Heinze. Fota, pśełožk do dolnoserbšćiny a naźěłanje indeksow Delia E. Münchowa — Bautzen: LND, 2021. — 72 b.: il.
2022
  • Nowy Casnik 73 (2022) 1–52
  • Rozhlad (2022) 1–12
  • Serbska pratyja 2023
  • Bóže słowo na kuždy źeń 2023. Gronka ochranojskeje bratšojskeje wósady / zest. Hartmut S. Leipner. — Budyšyn: LND, 2022. — 120 s.
  • Findus a góńtwa za lišku / Sven Nordqvist. Pśestajiła Madlena Norberg. — Budyšyn: LND, 2022. — 28 b.: il.
DSB-REF

Niedersorbisches Referenzkorpus

Beim niedersorbischen Referenzkorpus handelt es sich um eine Sammlung von etwa 68 000 Fragmenten aus niedersorbischen Texten der Jahre 1990 bis 2015. Das Korpus umfasst insgesamt etwa eine Million Textwörter (Tokens) und steht für das neuere niedersorbische Schrifttum. Als Grundlage für eine zufällige Auswahl der Textfragmente diente eine 3,5-Millionen-Token-Textbasis aus Ausgaben der Wochenzeitung „Nowy Casnik“ (ca. 69 %) und des Jahreskalenders „Pratyja“ (31 %).

Die Logo der Stiftung für das sorbische Volk Erstellung des Referenzkorpus wurde gefördert durch die Stiftung für das sorbische Volk, die jährlich auf der Grundlage der beschlossenen Haushalte des Deutschen Bundestages, des Landtages Brandenburg und des Sächsischen Landtages Zuwendungen aus Steuermitteln erhält.