📊 Projekt

Laudatio Repository

Humboldt-Universität zu Berlin

Laudatio Repository

Institution: Humboldt-Universität zu Berlin Kategorie: Projekt
Website: https://www.laudatio-repository.org/

Kurzbeschreibung

Der Dienst bietet über eine REST-API Zugriff auf Metadaten von linguistischen Korpora, Dokumenten und Annotationen. Zielgruppe sind Forschende und Lehrende an Hochschulen, die auf Basis strukturierter Textdaten arbeiten. Der Hauptnutzen liegt in der standardisierten, programmgestützten Abfrage und Analyse von Korpusinhalten, insbesondere für die computergestützte Sprachforschung. Die API ermöglicht die Integration in Forschungsworkflows und die Nutzung von Korpusdaten in wissenschaftlichen Projekten.

Allgemeinverständliche Beschreibung

-


Thematische Einordnung

Fachgebiete

Geisteswissenschaften Informatik Linguistik Theologie Geschichte

Forschungsfelder

  • Linguistik
  • Didaktik
  • Theater
  • Geschichte
  • Theologie

Spezialisierungen

  • Digital Humanities
  • Korpuslinguistik
  • Historische Sprachwissenschaft
  • Textannotation
  • Metadatenmanagement
  • Open Access
  • Forschungsdateninfrastruktur
  • Linguistische Forschungstheater
  • Digitale Edition
  • Text- und Sprachanalyse
  • Multilayer-Analyse
  • Semantic Web
  • REST-API für linguistische Daten
  • Textbewegung: Theater und Sprache (Projektbezug)

Schlagworte

  • Laudatio repository API - REST API - Corpus data - Document metadata - Annotation metadata - ElasticSearch integration - JSON response format - Search and retrieval - Metadata indexing - Linguistic corpora

Förderung

Fördergeber: -
Förderprogramm: -
Förderkennzeichen: Textbewegung: Theater und Sprache
Förderzeitraum: 2013
Projektvolumen: -


Team & Partner

Projektleitung

  • Prof. Dr. Maik Walter (Humboldt-Universität zu Berlin)

Beteiligte Personen

  • Carolin Odebrecht (Infrastructure)
  • Maik Walter (Editor)
  • Stefanie Dipper (Editor)
  • Simone Schultz-Balluff (Editor)
  • Maria Anselm (Annotator)
  • Katharina Bort (Annotator)
  • Malin Frey (Annotator)
  • Sarah Klein (Annotator)
  • Julia Krasselt (Annotator)
  • Nadine Lordick (Annotator)
  • Sarah Malke (Annotator)
  • Julika Nelken (Annotator)
  • Maurice Spengler (Annotator)
  • Helena Wedig (Annotator)

Beteiligte Einrichtungen

-

Externe Partner

Keine externen Partner genannt


Projektinhalte

Ziele

  • Bereitstellung eines öffentlich zugänglichen Repositoriums für linguistisch annotierte Textkorpora
  • Bereitstellung einer REST-API zur Programmierung des Zugriffs auf Korpora, Dokumente und Annotationen
  • Unterstützung der Forschung in den Bereichen Linguistik, Geschichte und Theologie durch hochwertige, annotierte Textdaten
  • Förderung der wissenschaftlichen Zusammenarbeit durch standardisierte und dokumentierte Datenformate
  • Sicherstellung der Langzeitarchivierung und Nachvollziehbarkeit von Forschungsdaten

Arbeitspakete

  • WP1: Corpus- und Dokumentenmanagement
  • WP2: Annotation und Datenstrukturierung
  • WP3: Such- und Analysefunktionen
  • WP4: Benutzeroberfläche und Visualisierung
  • WP5: Dokumentation und Open-Access-Veröffentlichung

Methoden

  • Tokenisierung der Transkription 'text'
  • Konvertierung der Annotationsebene 'tok' vom treetaggeroutput nach relANNIS via SaltNPepper
  • Manual annotation of the columns of the text
  • Import of the columns to CorA
  • Conversion of CoraXML to Annis via Pepper
  • Manual annotation
  • Automatic annotation
  • Collation and Inspection
  • Transcription
  • Import
  • Conversion

Erwartete Ergebnisse

  • Erstellt und veröffentlicht ein digitales Korpus von 201 Kinder- und Hausmärchen sowie 10 Kinderlegenden der Brüder Grimm
  • Enthält die Ausgabe letzter Hand der Brüder Grimm aus dem Jahr 1857
  • Kompiliert und aufbereitet für das Vertiefungsseminar "Dramapädagogik des Märchens: Linguistik, Didaktik und Theater" an der Universität Tübingen
  • Enthält Transkriptionen, Tokenisierung, POS-Tagging, Lemmatisierung und Meta-Informationen
  • Verwendet die Wikisource-Editionsrichtlinien für die Textaufbereitung
  • Ist unter der Creative Commons Attribution 3.0 Unported License veröffentlicht
  • Enthält 211 Dokumente (Märchen und Legenden) mit insgesamt 295.880 Tokens
  • Wird über eine REST-API zugänglich gemacht, die Suche, Abfrage und Durchsuchung von Korpus, Dokumenten und Annotationen ermöglicht
  • Ist Teil des Open-Source-Projekts "Textbewegung: Theater und Sprache" an der Humboldt-Universität zu Berlin

Kontakt

Ansprechperson: -
E-Mail: -
Projekt-Website: https://www.laudatio-repository.org/


Erfasst: 2026-01-14
Quelle: https://www.laudatio-repository.org/

Website besuchen