Distant Reading for European Literary History (COST Action CA16204)
Distant Reading for European Literary History – COST Action CA16204
Distant Reading for European Literary History (COST Action CA16204)
Institution: Distant Reading for European Literary History – COST Action CA16204
Kategorie: Projekt
Website: https://www.distant-reading.net/
Kurzbeschreibung
Der Dienst ELTeC (European Literary Text Collection) ist eine multilinguale Sammlung volltextlicher Romane aus mindestens zehn europäischen Sprachen, die für computergestützte Analysen im Bereich der Literaturwissenschaft entwickelt wurde. Zielgruppe sind Forschende in den Geisteswissenschaften, insbesondere in der Digitalen Humanistik. Der Hauptnutzen für Hochschulen liegt in der Bereitstellung standardisierter, annotierter Textdaten, die die vergleichende, datenbasierte Analyse europäischer literarischer Traditionen ermöglicht und die Entwicklung und Validierung neuer methodischer Ansätze unterstützt.
Allgemeinverständliche Beschreibung
-
Thematische Einordnung
Fachgebiete
Geisteswissenschaften Informatik Digital Humanities Literaturwissenschaft Sprachwissenschaft Computational Linguistics Textencoding Digitalisierung Kulturwissenschaften
Forschungsfelder
- Distant Reading
- Computational Literary Studies
- Multilingual Literary Text Analysis
- Digital Humanities
- Text Mining
- Natural Language Processing (NLP)
- Authorship Attribution
- Topic Modeling
- Stylistic Analysis
- Named Entity Recognition (NER)
- Sentiment Analysis
- Text Annotation and Encoding (TEI)
- Linked Open Data (LOD) in Humanities
- Literary Periodization
- Canonization Studies
- Computational Stylistics
- Character Network Analysis
- Language-Independent Text Analysis
- Cross-National Literary Comparison
- Data Curation for Literary Corpora
- Open Science in Humanities
- Computational Historiography
Spezialisierungen
- Distant Reading (computational Textanalyse großer literarischer Textmengen)
- Entwicklung einer multilingualen europäischen Literaturtextsammlung (ELTeC)
- Erstellung und Nutzung von Linked Open Data (ELTeC-LLOD) für literarische Texte
- Entwicklung und Anwendung von Methoden der computergestützten Stilometrie
- Anwendung von Natural Language Processing (NLP) für literarische Texte (z. B. POS-Tagging, Lemmatisierung, Named Entity Recognition)
- Analyse von literarischen Themen und Motiven mittels Topic Modeling
- Untersuchung der inneren Lebenswelten von Romanfiguren (z. B. Verwendung von Verben zur Beschreibung innerer Zustände)
- Analyse von Titelpraktiken und Genres in europäischen Romanen
- Entwicklung von Open Science-Prinzipien und Open-Access-Ressourcen
- Förderung der Inklusion und Gleichstellung von Frauen in der digitalen Geisteswissenschaft
- Interdisziplinäre Zusammenarbeit zwischen Literaturwissenschaft, Informatik und Sprachwissenschaft
- Entwicklung von Standards und Best Practices für die digitale Literaturforschung
- Integration von Wikidata und anderen Linked Data-Quellen in literarische Forschung
- Analyse der Entwicklung von Satzlängen im 19. Jahrhundert
- Quantitative Inhaltsanalyse von literarischen Texten (z. B. in der slowenischen Prosa) -
Schlagworte
- Distant Reading - European Literary Text Collection - ELTeC - Multilingual Literary Corpus - Computational Literary Analysis - Digital Humanities - Text Mining - Literary History - Authorship Attribution - Topic Modeling
Förderung
Fördergeber: -
Förderprogramm: COST Action CA16204
Förderkennzeichen: CA16204
Förderzeitraum: 2017-2023
Projektvolumen: 1.5 Mio. Euro
Team & Partner
Projektleitung
Prof. Dr. Christof Schöch (Universität Trier)
Beteiligte Personen
- Dr. Ranka Stanković (Teammitglied, Working Group 1)
- Dr. Cvetana Krstev (Teammitglied, Working Group 1)
- Dr. Duško Vitas (Teammitglied, Working Group 1)
- Dr. Mihailo Škorić (Teammitglied, Working Group 1)
- Dr. Milica Ikonić Nešić (Teammitglied, Working Group 1)
- Dr. Olivera Kitanović (Teammitglied, Working Group 1)
- Dr. Miloš Utvić (Teammitglied, Working Group 1)
- Dr. Tomaž Erjavec (Teammitglied, Working Group 3)
- Dr. Roxana Patras (Teammitglied, Working Group 3)
- Dr. Diana Santos (Teammitglied, Working Group 3)
- Dr. Gábor Palkó (Teammitglied, Working Group 2)
- Dr. Agnes Hilger (Teammitglied, Working Group 2)
- Dr. Fotis Jannidis (Teammitglied, Working Group 2)
- Dr. Pieter Francois (Teammitglied, Working Group 2)
- Dr. Lou Burnard (Teammitglied, Working Group 2)
- Dr. Joanna Byszuk (Teammitglied, Working Group 2)
- Dr. Maciej Eder (Teammit
Beteiligte Einrichtungen
-
Externe Partner
INSUFFICIENT
Projektinhalte
Ziele
- Aufbau einer multilingualen europäischen Literaturtextsammlung (ELTeC) mit ca. 2.500 volltextlichen Romanen in mindestens 10 Sprachen
- Entwicklung und Standardisierung innovativer computergestützter Methoden für die Distant Reading in mehreren europäischen literarischen Traditionen
- Theoretische und methodische Neubewertung grundlegender Konzepte der Literaturgeschichte und Literaturtheorie im Kontext datenbasierter Forschung
- Förderung der Kompetenzentwicklung, insbesondere bei Nachwuchswissenschaftler:innen, in Methoden der Distant Reading und Datenpflege
- Unterstützung der Inklusion und Gleichstellung, insbesondere durch gezielte Maßnahmen zur Förderung der Beteiligung von Frauen in der digitalen Geisteswissenschaft
Arbeitspakete
- WP1: European Literary Text Collection (ELTeC) – Erstellung und Pflege einer multilingualen Sammlung von Romanen in mindestens 10 europäischen Sprachen
- WP2: Entwicklung und Anwendung innovativer Methoden der Distant Reading für europäische literarische Traditionen
- WP3: Theoretische und methodologische Untersuchung der Konsequenzen von Distant Reading für die Literaturgeschichte und Literaturtheorie
- WP4: Kapazitätsaufbau und Förderung von Early Career Investigators (ECIs) in Distant Reading-Methoden
- WP5: Unterstützung bei der Einreichung von Förderanträgen auf nationaler und europäischer Ebene
- WP6: Förderung der Geschlechtergleichstellung und Verbesserung der Teilhabe von Frauen in der Forschung
Methoden
- Distant Reading
- Computational methods of analysis
- Authorship attribution
- Topic modelling
- Character network analysis
- Stylistic analysis
- Computational stylistics
- Network analysis
- Benchmarking
- Language-dependent performance evaluation
- Literary periodization
- Canonization
- Theoretical assumptions and foundations of Distant Reading research
- Data curation
- Standards
- Best practices
- Textometric methods
- Named Entity Recognition (NER)
- Geo-Tagging
- Sentiment Analysis
- Parallel stylometric document embeddings
- Deep learning based language models
- LDA topic modeling
- Lemmatization
- POS-tagging
- Morphosyntactic analysis
- Direct speech detection
- Quantitative content analysis
- Dispersion-based measures of distinctiveness
- Machine learning approaches
- Sequence modeling
- Transformer architecture
- Multilingual sentence embedder
- Finite-state methodology
- Manual cleaning
- Encoding
- Annotation
- Format conversion
- Data management tools
- AntConc
- TXM
- StyloR
- Nooj
- Heurist
- Transkribus
- Oxygen
- OCR (Optical Character Recognition)
- TEI (Text Encoding Initiative)
- NLP Interchange Format (NIF)
- Linked Data
- SPARQL queries
- Wikification
- OpenRefine
- QuickStatements
- NLP (Natural Language Processing)
- Computational linguistics
- Digital humanities
- Close reading
- Big Data analysis
- Algorithm
Erwartete Ergebnisse
- Erstellung einer multilingualen europäischen Literaturtextsammlung (ELTeC) mit etwa 2.500 volltextlichen Romanen in mindestens 10 europäischen Sprachen
- Entwicklung und Standardisierung innovativer computergestützter Methoden zur literarischen Textanalyse für mehrere europäische literarische Traditionen
- Etablierung gemeinsamer theoretischer und praktischer Rahmenbedingungen für die Distant Reading-Forschung
- Förderung der Akquisition modernster Distant-Reading-Methoden, insbesondere durch Early Career Investigators (ECIs)
- Unterstützung der Erstellung und Einreichung von Wettbewerbsanträgen auf nationaler und europäischer Ebene
- Verbesserung der Geschlechterbalance in der Forschung durch gezielte Maßnahmen zur Förderung der Teilnahme von Frauen
- Schaffung eines offenen, nachhaltigen und zugänglichen Forschungsinfrastruktur-Ökosystems für die europäische Literaturgeschichte
- Erhöhung der Sichtbarkeit und Relevanz der europäischen Literaturgeschichte durch datenbasierte, multilinguale und interdisziplinäre Forschung
- Entwicklung von Standards, Best Practices und Tools für die Distant Reading-Forschung
- Förderung der Zusammenarbeit und des Austauschs zwischen Forschenden aus verschiedenen Ländern und Disziplinen
- Erhöhung der Transparenz und Nachvollziehbarkeit von Forschungsergebnissen durch Open Science-Prinzipien
- Schaffung einer
Kontakt
Ansprechperson: Christof Schöch
E-Mail: -
Projekt-Website: https://www.distant-reading.net/
Erfasst: 2026-01-14
Quelle: https://www.distant-reading.net/