Von Patrick Brookshire und Marjam Trautmann
https://studiengang-digitale-methodik.pages.gitlab.rlp.net/modul-5/5c/slides/daten/
Eine Datensammlung ist eine mögliche Repräsentation des untersuchten Gegenstands/Phänomens! Datenkritik ist ein zentraler und stetig begleitender Aspekt in der datengeleiteten Forschung.
Bezeichnung | Beispiel | Erläuterung |
---|---|---|
Character | a |
Das Zeichen a |
Escaped Character | \. |
Das Zeichen . (Die Zeichen \ . ^ $ | + * ? ( ) [ ] { } müssen escaped werden) |
Wildcard | . |
ein beliebiges Zeichen |
Bezeichnung | Beispiel | Erläuterung |
---|---|---|
Character Class | [ab-] |
Das Zeichen a, b oder - |
Character Range | [a-z] |
Das Zeichen a, b, c, … oder z (Kurzschreibweise für eine Character Class aus Zeichen, die in der ASCII-Tabelle aufeinanderfolgen.) |
logisches Oder | `a | b |
logisches Nicht | [^ab] |
ein beliebiges Zeichen außer a und b |
Hinweise:
[A-ZÄÖÜa-zäöüß]
). Daher sollte das Zeichen - stets am Anfang oder Ende stehen ([-ab]
und [ab-]
finden a, b und -, [a-b]
jedoch nur a und b) .[.,;:()]
findet die entsprechenden Satzzeichen)Bezeichnung | Beispiel | Erläuterung |
---|---|---|
“Exact Quantifier” | a{2} |
zweimal das Zeichen a |
“Min Quantifier” | a{2,} |
mindestens zweimal das Zeichen a |
“Min/Max Quantifier” | a{2,3} |
zwei- bis dreimal das Zeichen a |
? Quantifier | a? |
ein- oder keinmal das Zeichen a (Kurzschreibweise von a{0,1} ) |
+ Quantifier | a+ |
mindestens einmal das Zeichen a (Kurzschreibweise von a{1,} ) |
* Quantifier | a* |
keinmal oder beliebig oft das Zeichen a (Kurzschreibweise von a{0,} ) |
Hinweis: Jeder Quantifier-Ausdruck wird durch angehängtes ?
lazy (d.h. findet die kürzeste passende Zeichenfolge). So findet etwa a+
im Text aaa
genau einmal aaa
, während a+?
dreimal a
findet.
Bezeichnung | Beispiel | Erläuterung |
---|---|---|
Group | (ab) |
die Zeichenfolge ab |
Backreference | $1 bzw. \1 |
der Inhalt der ersten Gruppe (je nach Programmiersprache/Tool wird entweder $ oder __ verwendet) |
Hinweis: Groups ermöglichen auch logische oder Quantifier-Ausdrücke, die mehrere Zeichen umfassen (z.B. C(ä|ae)sar
oder ([Mm]a){2}
).