Laudatio Repository
Laudatio Repository
Institution: Humboldt-Universität zu Berlin
Kategorie: Projekt
Website: https://www.laudatio-repository.org/
Kurzbeschreibung
Der Dienst bietet über eine REST-API Zugriff auf Metadaten von linguistischen Korpora, Dokumenten und Annotationen. Zielgruppe sind Forschende und Lehrende an Hochschulen, die auf Basis strukturierter Textdaten arbeiten. Der Hauptnutzen liegt in der standardisierten, programmgestützten Abfrage und Analyse von Korpusinhalten, insbesondere für die computergestützte Sprachforschung. Die API ermöglicht die Integration in Forschungsworkflows und die Nutzung von Korpusdaten in wissenschaftlichen Projekten.
Allgemeinverständliche Beschreibung
-
Thematische Einordnung
Fachgebiete
Geisteswissenschaften Informatik Linguistik Theologie Geschichte
Forschungsfelder
- Linguistik
- Didaktik
- Theater
- Geschichte
- Theologie
Spezialisierungen
- Digital Humanities
- Korpuslinguistik
- Historische Sprachwissenschaft
- Textannotation
- Metadatenmanagement
- Open Access
- Forschungsdateninfrastruktur
- Linguistische Forschungstheater
- Digitale Edition
- Text- und Sprachanalyse
- Multilayer-Analyse
- Semantic Web
- REST-API für linguistische Daten
- Textbewegung: Theater und Sprache (Projektbezug)
Schlagworte
- Laudatio repository API - REST API - Corpus data - Document metadata - Annotation metadata - ElasticSearch integration - JSON response format - Search and retrieval - Metadata indexing - Linguistic corpora
Förderung
Fördergeber: -
Förderprogramm: -
Förderkennzeichen: Textbewegung: Theater und Sprache
Förderzeitraum: 2013
Projektvolumen: -
Team & Partner
Projektleitung
- Prof. Dr. Maik Walter (Humboldt-Universität zu Berlin)
Beteiligte Personen
- Carolin Odebrecht (Infrastructure)
- Maik Walter (Editor)
- Stefanie Dipper (Editor)
- Simone Schultz-Balluff (Editor)
- Maria Anselm (Annotator)
- Katharina Bort (Annotator)
- Malin Frey (Annotator)
- Sarah Klein (Annotator)
- Julia Krasselt (Annotator)
- Nadine Lordick (Annotator)
- Sarah Malke (Annotator)
- Julika Nelken (Annotator)
- Maurice Spengler (Annotator)
- Helena Wedig (Annotator)
Beteiligte Einrichtungen
-
Externe Partner
Keine externen Partner genannt
Projektinhalte
Ziele
- Bereitstellung eines öffentlich zugänglichen Repositoriums für linguistisch annotierte Textkorpora
- Bereitstellung einer REST-API zur Programmierung des Zugriffs auf Korpora, Dokumente und Annotationen
- Unterstützung der Forschung in den Bereichen Linguistik, Geschichte und Theologie durch hochwertige, annotierte Textdaten
- Förderung der wissenschaftlichen Zusammenarbeit durch standardisierte und dokumentierte Datenformate
- Sicherstellung der Langzeitarchivierung und Nachvollziehbarkeit von Forschungsdaten
Arbeitspakete
- WP1: Corpus- und Dokumentenmanagement
- WP2: Annotation und Datenstrukturierung
- WP3: Such- und Analysefunktionen
- WP4: Benutzeroberfläche und Visualisierung
- WP5: Dokumentation und Open-Access-Veröffentlichung
Methoden
- Tokenisierung der Transkription 'text'
- Konvertierung der Annotationsebene 'tok' vom treetaggeroutput nach relANNIS via SaltNPepper
- Manual annotation of the columns of the text
- Import of the columns to CorA
- Conversion of CoraXML to Annis via Pepper
- Manual annotation
- Automatic annotation
- Collation and Inspection
- Transcription
- Import
- Conversion
Erwartete Ergebnisse
- Erstellt und veröffentlicht ein digitales Korpus von 201 Kinder- und Hausmärchen sowie 10 Kinderlegenden der Brüder Grimm
- Enthält die Ausgabe letzter Hand der Brüder Grimm aus dem Jahr 1857
- Kompiliert und aufbereitet für das Vertiefungsseminar "Dramapädagogik des Märchens: Linguistik, Didaktik und Theater" an der Universität Tübingen
- Enthält Transkriptionen, Tokenisierung, POS-Tagging, Lemmatisierung und Meta-Informationen
- Verwendet die Wikisource-Editionsrichtlinien für die Textaufbereitung
- Ist unter der Creative Commons Attribution 3.0 Unported License veröffentlicht
- Enthält 211 Dokumente (Märchen und Legenden) mit insgesamt 295.880 Tokens
- Wird über eine REST-API zugänglich gemacht, die Suche, Abfrage und Durchsuchung von Korpus, Dokumenten und Annotationen ermöglicht
- Ist Teil des Open-Source-Projekts "Textbewegung: Theater und Sprache" an der Humboldt-Universität zu Berlin
Kontakt
Ansprechperson: -
E-Mail: -
Projekt-Website: https://www.laudatio-repository.org/
Erfasst: 2026-01-14
Quelle: https://www.laudatio-repository.org/