📊 Projekt

Laudatio Repository

Institution: Humboldt-Universität zu Berlin Kategorie: Projekt
Website: https://www.laudatio-repository.org/

Kurzbeschreibung

Der Dienst bietet über eine REST-API Zugriff auf Metadaten von linguistischen Korpora, Dokumenten und Annotationen. Zielgruppe sind Forschende und Lehrende an Hochschulen, die auf Basis strukturierter Textdaten arbeiten. Der Hauptnutzen liegt in der standardisierten, programmgestützten Abfrage und Analyse von Korpusinhalten, insbesondere für die computergestützte Sprachforschung. Die API ermöglicht die Integration in Forschungsworkflows und die Nutzung von Korpusdaten in wissenschaftlichen Projekten.

Allgemeinverständliche Beschreibung

Thematische Einordnung

Fachgebiete

Geisteswissenschaften Informatik Linguistik Theologie Geschichte

Forschungsfelder

Linguistik
Didaktik
Theater
Geschichte
Theologie

Spezialisierungen

Digital Humanities
Korpuslinguistik
Historische Sprachwissenschaft
Textannotation
Metadatenmanagement
Open Access
Forschungsdateninfrastruktur
Linguistische Forschungstheater
Digitale Edition
Text- und Sprachanalyse
Multilayer-Analyse
Semantic Web
REST-API für linguistische Daten
Textbewegung: Theater und Sprache (Projektbezug)

Schlagworte

Laudatio repository API - REST API - Corpus data - Document metadata - Annotation metadata - ElasticSearch integration - JSON response format - Search and retrieval - Metadata indexing - Linguistic corpora

Förderung

Fördergeber: -
Förderprogramm: -
Förderkennzeichen: Textbewegung: Theater und Sprache
Förderzeitraum: 2013
Projektvolumen: -

Team & Partner

Projektleitung

Prof. Dr. Maik Walter (Humboldt-Universität zu Berlin)

Beteiligte Personen

Carolin Odebrecht (Infrastructure)
Maik Walter (Editor)
Stefanie Dipper (Editor)
Simone Schultz-Balluff (Editor)
Maria Anselm (Annotator)
Katharina Bort (Annotator)
Malin Frey (Annotator)
Sarah Klein (Annotator)
Julia Krasselt (Annotator)
Nadine Lordick (Annotator)
Sarah Malke (Annotator)
Julika Nelken (Annotator)
Maurice Spengler (Annotator)
Helena Wedig (Annotator)

Beteiligte Einrichtungen

Externe Partner

Keine externen Partner genannt

Projektinhalte

Ziele

Bereitstellung eines öffentlich zugänglichen Repositoriums für linguistisch annotierte Textkorpora
Bereitstellung einer REST-API zur Programmierung des Zugriffs auf Korpora, Dokumente und Annotationen
Unterstützung der Forschung in den Bereichen Linguistik, Geschichte und Theologie durch hochwertige, annotierte Textdaten
Förderung der wissenschaftlichen Zusammenarbeit durch standardisierte und dokumentierte Datenformate
Sicherstellung der Langzeitarchivierung und Nachvollziehbarkeit von Forschungsdaten

Arbeitspakete

WP1: Corpus- und Dokumentenmanagement
WP2: Annotation und Datenstrukturierung
WP3: Such- und Analysefunktionen
WP4: Benutzeroberfläche und Visualisierung
WP5: Dokumentation und Open-Access-Veröffentlichung

Methoden

Tokenisierung der Transkription 'text'
Konvertierung der Annotationsebene 'tok' vom treetaggeroutput nach relANNIS via SaltNPepper
Manual annotation of the columns of the text
Import of the columns to CorA
Conversion of CoraXML to Annis via Pepper
Manual annotation
Automatic annotation
Collation and Inspection
Transcription
Import
Conversion

Erwartete Ergebnisse

Erstellt und veröffentlicht ein digitales Korpus von 201 Kinder- und Hausmärchen sowie 10 Kinderlegenden der Brüder Grimm
Enthält die Ausgabe letzter Hand der Brüder Grimm aus dem Jahr 1857
Kompiliert und aufbereitet für das Vertiefungsseminar "Dramapädagogik des Märchens: Linguistik, Didaktik und Theater" an der Universität Tübingen
Enthält Transkriptionen, Tokenisierung, POS-Tagging, Lemmatisierung und Meta-Informationen
Verwendet die Wikisource-Editionsrichtlinien für die Textaufbereitung
Ist unter der Creative Commons Attribution 3.0 Unported License veröffentlicht
Enthält 211 Dokumente (Märchen und Legenden) mit insgesamt 295.880 Tokens
Wird über eine REST-API zugänglich gemacht, die Suche, Abfrage und Durchsuchung von Korpus, Dokumenten und Annotationen ermöglicht
Ist Teil des Open-Source-Projekts "Textbewegung: Theater und Sprache" an der Humboldt-Universität zu Berlin

Kontakt

Ansprechperson: -
E-Mail: -
Projekt-Website: https://www.laudatio-repository.org/

Erfasst: 2026-01-14
Quelle: https://www.laudatio-repository.org/

Website besuchen

Informationen

Institution: Humboldt-Universität zu Berlin

Kontakt

Ansprechperson: - Prof. Dr. Maik Walter (Humboldt-Universität zu Berlin)

Kategorie: Projekt
Hinzugefügt: 31.01.2026
Quelle: Originalwebsite ↗