Reguläre Ausdrücke
Obwohl das Niedersorbische wie jede Sprache aus tausenden verschiedenen Wörtern besteht, findet man trotzdem eine Menge regulärer Wiederholungen. So enden alle Formen wie cytajśo, chwatajśo, dawajśo auf -ajśo. Es wäre nicht möglich, alle diese Formen im Korpus zu finden, wenn die Suche für jedes Verb gesondert durchgeführt werden müsste. In solchen Fällen sind reguläre Ausdrücke eine große Hilfe. Die Verwendung derselben wird in der folgenden Tabelle erklärt.
Ausdruck | Kurzerklärung | Bedeutung | Beispiel | findet (z. B.) |
---|---|---|---|---|
. | PUNKT: Er ersetzt jedwedes Zeichen. | irgendein Zeichen | .uby | luby, zuby, ruby usw. |
[ ] | ECKIGE KLAMMERN: In ihnen wird eine Folge gesuchter Zeichen definiert, z. B. findet [abc] das Zeichen a bzw. b bzw. c. | jedes in ihnen eingeschlossene Zeichen | [dsR]om | dom, som, Rom |
[ - ] | ECKIGE KLAMMERN: In ihnen kann auch ein Intervall definiert werden. Dies geschieht mit Hilfe des Bindestrichs. | Buchstaben bzw. Zahlenintervall | [a-z] | Alle Buchstaben von a bis z (ohne diakritische Zeichen) |
[a-zčćěłńóŕšśžź] | findet alle ns. Buchstaben | |||
[0-9] | 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 | |||
[j-m]už | juž, kuž, luž, muž (falls solche Formen im Korpus existieren) | |||
[^] | DACH: Es schließt Zeichen aus, die in ECKIGEN KLAMMERN STEHEN. | nicht diese Zeichen | [^l]uby | zuby, ruby usw.aber nicht: luby |
[^0-9] | jedes Zeichen, das keine Ziffer ist | |||
( | ) | EINFACHE KLAMMERN: In ihnen steht eine Liste alternativer Ausdrücke oder Zeichen, die durch den Operator „|“ (UND) voneinander getrennt sind. | Alternativen | (D|d)om | Dom, dom |
([Ss]|[Tt])am | Sam, sam, Tam, tam | |||
\ | BACKSLASH: Er bewirkt, dass spezielle Zeichen bei der Suche nicht als reguläre Ausdrücke interpretiert werden, sondern als normale Texteinheit. | die spezielle Bedeutung eines Zeichens ignorieren | \? | ? |
Wiederholungen | ||||
? | FRAGEZEICHEN: Das vor ihm stehende Zeichen wird null- oder einmal wiederholt. | 0-mal oder 1-mal | za? | z, za |
* | STERNCHEN: Das vor ihm stehende Zeichen wird beliebig oft (auch nullmal) wiederholt. | 0-mal oder beliebig oft | hm* | h, hm, hmm, hmmm usw. |
+ | PLUS: Das vor ihm stehende Zeichen wird einmal oder öfter wiederholt. | 1-mal oder öfter | hm+ | hm, hmm, hmmm usw. |
{n} | GESCHWEIFTE KLAMMERN: Die in ihnen eingeschlossene Zahl n gibt an, wie oft der reguläre Ausdruck oder das jeweilige Zeichen wiederholt wird. | n-mal | dom.{3} | domowy, domcyk usw. |
{m,n} | GESCHWEIFTE KLAMMERN: In ihnen kann auch ein Häufigkeitsintervall für das Auftreten des vorhergehenden Zeichens angegeben werden. | m- bis n-mal | .{3,7} | jede Kette, die aus drei bis sieben Zeichen besteht, z. B. jedes Wort mit drei bis sieben Buchstaben. |
hm{1,4} | hm, hmm, hmmm, hmmmm |
Noch ein Hinweis: Wenn eine Suchabfrage mit kleinen Buchstaben geschrieben wird, so werden Formen mit Großbuchstaben in der Regel nicht gefunden. Falls beispielsweise die Form „ten“ gesucht wird, werden „Ten“ oder „TEN“ nicht gefunden. Um diese Unterscheidung zwischen Groß- und Kleinschreibung zu ignorieren, kann vor die gesuchte Form „(?i)“ geschrieben werden. So findet „(?i)dom“ die Formen Dom, dom, DOM usw.
Einige Suchbeispiele
- dom.*
- findetalle Wörter, die mit dom- beginnen, z. B. dom, domašk, domcyk, domowina, domownja usw.
- dom[auk]*
- findet dom, doma, domu, domk
- dom[auk]+
- findet doma, domu, domk
- ru[kc][aieu]
- findet ruka, ruki, ruce, ruku (aber auch: ruci, rucu usw.)
- ru(ka|ki|ce|ku|koma|kowu)
- findet ruka, ruki, ruce, ruku, rukoma, rukowu (aber nicht: ruk, rukow, rukom, rukam usw.)
- .+owu.+
- findetalle Wörter, bei denen in der Mitte (aber nicht am Anfang bzw. Ende) -owu- auftritt, z. B. głowubólenje, wótnowujo, Nowuš usw.
- [zſ]a(s|ſſ|ß)ej
- findet zasej, ſaſſej, ſaßej (aber auch: zaſſej, zaßej, ſasej)
- w?(š|ſch|ſ̷ch)[iyü]kno
- findet wšykno, šykno, wſchykno, ſchykno, wſ̷chykno, ſ̷chykno, wšikno, šikno, wſchikno, ſchikno, wſ̷chikno, ſ̷chikno, wšükno, šükno, wſchükno, ſchükno, wſ̷chükno, ſ̷chükno
- .*arskego
- findetalle Wörter, die auf -arskego enden, z. B. wójarskego, bergarskego, pšosarskego usw.
- .*arske[gm][ou]
- findetalle Wörter, die auf -arskego, -arskemu, aber auch auf -arskegu, -arskemo enden
- .*arsk(ego|emu|ogo|omu)
- findetalle Wörter, die auf -arskego, -arskemu, -arskogo, -arskomu enden
siehe auch: Rechtschreibvarianten