📊 Projekt

Computational Literary Studies Infrastructure (CLS INFRA)

Institute of Polish Language at the Polish Academy of Sciences

Computational Literary Studies Infrastructure (CLS INFRA)

Institution: Institute of Polish Language at the Polish Academy of Sciences Kategorie: Projekt
Website: https://clsinfra.io/

Kurzbeschreibung

Das Dienstleistungsangebot dient der Standardisierung und Integration von literarischen Datenbeständen für die computergestützte Literaturwissenschaft. Es richtet sich an Forschende und Hochschulen in den Geisteswissenschaften, insbesondere an diejenigen, die mit multilingualen und heterogenen Textkorpora arbeiten. Der Hauptnutzen liegt in der Verbesserung der Zugänglichkeit, Wiederverwendbarkeit und Reproduzierbarkeit von Forschungsdaten durch ein gemeinsames Infrastruktur- und Datenmodell. Hochschulen profitieren von einer vereinfachten Datenverwaltung und einer stärkeren Vernetzung zwischen Forschungsgruppen.

Allgemeinverständliche Beschreibung

-


Thematische Einordnung

Fachgebiete

  • Geisteswissenschaften
  • Informatik
  • Digital Humanities
  • Literaturwissenschaft
  • Computational Literary Studies
  • Sprachwissenschaft
  • Kognitive Wissenschaft
  • Philosophie
  • Kunstgeschichte
  • Medizinische Humanwissenschaften

Forschungsfelder

  • Computational Literary Studies
  • Natural Language Processing (NLP)
  • Stylometry / Computational Stylistics
  • Multilingual Text Analysis
  • Digital Humanities
  • Text Mining
  • Named Entity Recognition (NER)
  • Relational Extraction (REX)
  • Sentiment Analysis (SA)
  • Aspect-Based Sentiment Analysis (ABSA)
  • Programmatic Corpora
  • Linked Open Data
  • Data Curation and Sharing
  • Metadata Standards for Literary Corpora
  • Literary Network Analysis
  • Genre Analysis
  • Authorship Attribution
  • Literary History
  • Gender Analysis
  • Canonicity Studies
  • Digital Editions
  • Text Encoding Initiative (TEI)
  • Corpus Enrichment
  • Machine Learning in Humanities
  • Computational Semantics
  • Cross-Lingual Transfer Learning
  • Readability Studies
  • Historical Social Network Analysis
  • Literary Data Infrastructure
  • Reproducible Research in Humanities
  • Open Science in Humanities
  • Transnational Access to Research Infrastructures
  • Training and Skills Development in Digital Humanities

Spezialisierungen

  • Computational Literary Studies (CLS)
  • Digital Humanities (DH)
  • Multilingual literary data infrastructure
  • Data curation and standardization
  • Natural Language Processing (NLP) for literary texts
  • Programmable corpora development
  • Linked Open Data (LOD) integration
  • Transnational Access (TNA) for research infrastructure
  • Training and skills development in CLS
  • Methodological best practices documentation
  • Open Science and data sharing policies
  • Interoperability of literary corpora and tools
  • Corpus enrichment and annotation
  • Reproducibility in digital literary research
  • Cross-lingual computational stylistics
  • Literary network analysis
  • Sentiment and aspect-based sentiment analysis (ABSA)
  • Named Entity Recognition (NER) and Relational Extraction (REX)
  • Text mining and distant reading
  • Digital editions and scholarly editing
  • Research data life cycle management
  • Metadata standards for literary corpora
  • Integration of AI and generative models in humanities research
  • Application of CLS methods beyond academia (journalism, policy, GLAM, medical humanities)

Schlagworte

  • CLS INFRA
  • Computational Literary Studies
  • Programmable Corpora
  • DraCor
  • NLP toolchains
  • Multilingual literary data
  • TEI standard
  • Transnational Access
  • Training Schools
  • Open Science

Förderung

Fördergeber: -
Förderprogramm: Horizon 2020
Förderkennzeichen: 101004984
Förderzeitraum: 2022-2025
Projektvolumen: 1.5 Mio. Euro


Team & Partner

Projektleitung

  • Prof. Maciej Eder (Institute of Polish Language, Polish Academy of Sciences)

Beteiligte Personen

  • Dr. Julie M. Birkholz (Assistant Professor Digital Humanities, Lead of KBR’s Digital Research Lab)
  • Ingo Börner (Research Associate, University of Potsdam)
  • Ruth Bruchertseifer (Researcher)
  • Floor Buschenhenke (Researcher)
  • Joanna Byszuk (Research Associate, Computational Stylistics Group)
  • Sally Chambers (Digital Humanities Research Coordinator, Ghent Centre for Digital Humanities)
  • Mag. Phil. Vera Maria Charvat (Researcher)
  • Mgr. Silvie Cinková Ph.D. (Researcher, Charles University)
  • Tess Dejaeghere (Researcher)
  • Anna Dijkstra (Work Package 4 Coordinator)
  • Julia Dudar (Researcher)
  • DI Matej Ďurčo (Researcher)
  • Evgeniia Fileva (Researcher, University of Trier)
  • Vicky Garnett (Training and Education Officer, DARIAH-EU)
  • Françoise Gouzi (Open Science Officer, DARIAH-EU)
  • Dr. Sarah Hoover (Postdoctoral Researcher, NUI Galway)
  • Bartłomiej Kunda (Coordinating Manager, Institute of Polish Language)
  • Prof. Dr. Els Lefever (Associate Professor, Ghent University)
  • PD Dr. Michał Mrugalski (Researcher)
  • Dr. Ciara L. Murphy (Postdoctoral Researcher, NUI Galway)
  • Dr. Carolin Odebrecht (Researcher)
  • Eliza Papaki (Researcher)
  • Marco Raciti (Researcher)
  • Dr.

Beteiligte Einrichtungen

-

Externe Partner

  • Austrian Academy of Sciences
  • Charles University
  • Digital Research Infrastructure for the Arts and Humanities
  • Ghent Centre for Digital Humanities, Ghent University
  • Belgrade Centre for Digital Humanities
  • Huygens Institute for the History of the Netherlands (Royal Netherlands Academy of Arts and Sciences)
  • Trier Center for Digital Humanities, Trier University
  • Moore Institute, National University of Ireland Galway
  • The Trinity Centre for Digital Humanities, Trinity College Dublin
  • Institute of Polish Language at the Polish Academy of Sciences
  • University of Potsdam
  • National University of Distance Education
  • École Normale Supérieure de Lyon
  • Humboldt University of Berlin

Projektinhalte

Ziele

  • Aufbau einer gemeinsamen, nachhaltigen Infrastruktur für die computatio­nale Literaturwissenschaft in Europa
  • Standardisierung und Vereinheitlichung von Daten, Tools und Methoden in der Literaturwissenschaft
  • Verbesserung des Zugriffs und der Wiederverwendbarkeit multilinguistischer literarischer Daten
  • Förderung der Zusammenarbeit zwischen gut und weniger gut ressourcengesicherten Forschungseinrichtungen
  • Erweiterung der Anwendungsmöglichkeiten computatio­naler Literaturanalyse über akademische Grenzen hinaus (z. B. in Journalismus, Politik, Medizin)

Arbeitspakete

  • WP1: Project Management and Coordination
  • WP2: Communication, Dissemination, and Exploitation
  • WP3: Methodological Considerations and Community Building
  • WP4: Training and Skills Development
  • WP5: Data Landscape Review and Institutional Perspectives
  • WP6: Data Inventory and Toolkit Development
  • WP7: Building the Ecosystem of Programmable Corpora
  • WP8: NLP Toolchains and Corpus Enrichment
  • WP9: Transnational Access (TNA) Programme

Methoden

  • Stylometrie (Multilingual Stylometry Showcase)
  • Netzwerkanalyse (Detecting Small Worlds in a Corpus of Thousands of Theater Plays)
  • Aspektbasierte Sentimentanalyse (ABSA)
  • Named Entity Recognition (NER)
  • Relational Extraction (REX)
  • Textmining
  • Natural Language Processing (NLP)
  • Programmable Corpora
  • TEI-Standard (Text Encoding Initiative)
  • Versionierung von lebenden und programmierbaren Korpora
  • Datenannotation
  • Korpusmanagement
  • Korpusenrichment
  • Multilinguale Workflow-Entwicklung
  • Open Science Praktiken
  • Forschungsdatenmanagement
  • FAIR-Daten (Findable, Accessible, Interoperable, Reusable)
  • Linked Open Data (LOD)
  • Retrieval-Augmented Generation (RAG)
  • Generative KI-Ansätze
  • Korpusbildung und -konsolidierung
  • Datenstandardisierung
  • Transformationstoolbox (VELD-Mechanismus)
  • Open-Source-Toolchains
  • Jupyter Notebooks zur Dokumentation und Wiederverwendung von Workflows
  • Corpus-Enrichment und NLP-Toolchains
  • Scansionanalyse und -visualisierung (Poetrylab + rantanplan)
  • Metrikentwicklung für die computergestützte Dramenanalyse

Erwartete Ergebnisse

  • Aufbau einer gemeinsamen, nachhaltigen Infrastruktur für die computatio­nale Literaturwissenschaft in Europa
  • Standardisierung und Vereinheitlichung von literarischen Daten, Methoden und Tools
  • Verbesserung des Zugriffs und der Wiederverwendbarkeit von literarischen Daten durch einheitliche Standards und Interoperabilität
  • Schaffung eines zentralen Katalogs (CLSCor) zur Auffindbarkeit von literarischen Korpora und Werkzeugen
  • Entwicklung eines Transformationstools (VELD) zur Harmonisierung und Umwandlung von Datenformaten
  • Erstellung von Programmierbaren Korpora (Programmable Corpora) mit offenen APIs für maschinenlesbare Texte
  • Förderung der Reproduzierbarkeit von Forschung durch Versionierung von Korpora und APIs
  • Erweiterung der Forschungskompetenzen durch Trainingsschulen und Bildungsangebote für Forschende mit unterschiedlichem Hintergrund
  • Entwicklung von Werkzeugen und Workflows für die Annotation, NLP-Verarbeitung und Datenanalyse in mehrsprachigen Kontexten
  • Schaffung eines umfassenden Toolkits für die Datenweitergabe und -verwaltung entlang des Forschungsdatenlebenszyklus
  • Stärkung der Zusammenarbeit zwischen Forschungseinrichtungen und der transnationalen Zugang zu Schlüsselressourcen (TNA-Fellowships)
  • Erhö

Kontakt

Ansprechperson: - Dr. Julie M. Birkholz - Ingo Börner - Ruth Bruchertseifer - Floor Buschenhenke - Joanna Byszuk - Sally Chambers - Mag. Phil. Vera Maria Charvat - Mgr. Silvie Cinková Ph.D. - Tess Dejaeghere - Anna Dijkstra - Julia Dudar - DI Matej Ďurčo - Prof. Maciej Eder - Dr Jennifer Edmond - Evgeniia Fileva - Vicky Garnett - Françoise Gouzi - Dr Sarah Hoover - Dr Michal Křen - Bartłomiej Kunda - Prof. Dr. Els Lefever - PD Dr. Michał Mrugalski - Dr Ciara L. Murphy - Dr. Carolin Odebrecht - Eliza Papaki - Marco Raciti - Dr Emily Ridge - Ass. Prof. Salvador Ros - Prof. Dr. Christof Schöch - Dr Artjoms Šeļa - Dr Justin Tonra - Dr. Erzsébet Tóth-Czifra - Prof Dr Peer Trilcke - Prof. Dr Karina van Dalen-Oskam - Lisanne M. van Rossum rMA - Vera Yakupova - Dr Joris van Zundert
E-Mail: info@clsinfra.io
Projekt-Website: https://clsinfra.io/


Erfasst: 2026-01-14
Quelle: https://clsinfra.io/

Website besuchen