📊 Projekt

KI-FOR 5363 DeSBi (Fusing Deep Learning and Statistics towards Understanding Structured Biomedical Data)

Humboldt-Universität zu Berlin

KI-FOR 5363 DeSBi (Fusing Deep Learning and Statistics towards Understanding Structured Biomedical Data)

Institution: Humboldt-Universität zu Berlin Kategorie: Projekt
Website: https://desbi.de/

Kurzbeschreibung

Der Dienst bietet eine Methode zur statistischen Prüfung von bedingter Unabhängigkeit für strukturierte Daten wie Bilder und tabellarische Informationen. Er ermöglicht die Anwendung von tiefen Lernverfahren zur Dateneinbettung und kombiniert diese mit nichtparametrischen Tests. Zielgruppe sind Forschende in der Biomedizin, die komplexe multimodale Datensätze analysieren. Hochschulen profitieren durch verbesserte statistische Inferenz und Validierung von Modellen in hochdimensionalen Daten.

Allgemeinverständliche Beschreibung

-


Thematische Einordnung

Fachgebiete

Informatik Medizin Statistik Biologie Maschinelles Lernen Künstliche Intelligenz Biomathematik Computational Biology Neuroinformatik Genomik Bildverarbeitung Biostatistik Data Science

Forschungsfelder

  • Deep Learning
  • Statistik
  • Medizinische Bildgebung
  • Genomik
  • Kausale Inferenz
  • Zeitreihenanalyse
  • Rechnerische Biologie
  • Erklärbarkeit künstlicher Intelligenz (Explainable AI)
  • Bildanalyse
  • Strukturierte biomedizinische Daten
  • Bedingte Unabhängigkeitstests
  • Transferlernen
  • Unsicherheitsquantifizierung
  • Konfundenzkontrolle
  • Genomweite Assoziationsstudien (GWAS)
  • Neuronale Netze
  • Datenintegration (Multimodalität

Spezialisierungen

  • Entwicklung von bedingten Unabhängigkeitsprüfungen (CITs) für strukturierte Daten wie Bilder
  • Nutzung von Deep Learning zur Dateneinbettung (data embedding) für multimodale Datensätze
  • Anwendung statistischer Tests als Schlüsselinstrument für die Inferenz in multimodalen Datensets
  • Gewährleistung der Kontrolle des Typ-I-Fehlers bei großen Hypothesensets
  • Steigerung der statistischen Power durch Transferlernen und optimal gelernte Einbettungen
  • Entwicklung effizienter Algorithmen und benutzerfreundlicher Software für die Anwendung in der Biomedizin
  • Anwendung auf große biomedizinische Datensätze wie das UK Biobank
  • Integration in andere Projekte (P2, P4, P7) zur visuellen Erklärung und Analyse von Daten

Schlagworte

  • P1: Deep conditional independence tests / - Conditional Independence Tests / - Deep Learning / - Image Analysis / - Multimodal Data / - Statistical Inference / - UK Biobank / - Transfer Learning / - Nonparametric Testing / - Data Embedding

Förderung

Fördergeber: -
Förderprogramm: KI-FOR 5363
Förderkennzeichen: KI-FOR 5363
Förderzeitraum: 2023 - 2027
Projektvolumen: Das Volumen oder "INSUFFICIENT"


Team & Partner

Projektleitung

  • Prof. Dr. Sonja Greven (Humboldt-Universität zu Berlin)
  • Prof. Dr. Christoph Lippert (University of Potsdam / Hasso-Plattner Institute)

Beteiligte Personen

  • Marco Simnacher (PhD Candidate)
  • Hani Park (PhD Candidate)
  • Xiangnan Xu (Postdoc)
  • Clara Hoffmann (PhD Student)
  • Dilyara Bareeva (PhD student)
  • Jim Berend (PhD student)
  • Lorenz Hufe (PhD student)
  • Sahar Iravani (Postdoc)
  • Masoumeh Javanbakhat (Postdoc)
  • Georg Keilbar (Postdoc)
  • Piotr Komorowski (PhD student)
  • Wei-Cheng Lai (PhD candidate)
  • Gabriel Nobis (PhD Candidate)
  • Roshan Rane (PhD Candidate)
  • Moritz Seiler (PhD Candidate)
  • Manuel Pfeuffer (PhD Cadidate)
  • Paulo Yanez Sarmiento (PhD Candidate)
  • Hadya Yassin (PhD Candidate)
  • Claudia Winklmayr (PhD Cadidate)
  • Maximilian Dreyer (PhD student)
  • Eshant English (PhD student)
  • Maarten Jung (PhD student)
  • Marta Lemanczyk (PhD student)
  • Alexander Rakowski (PhD student)
  • Sepideh Saran (PhD student)
  • Juliana Schneider (PhD student)
  • Ekkehard Schnoor (Postdoc)

Beteiligte Einrichtungen

-

Externe Partner

Humboldt-Universität zu Berlin, University of Potsdam, Hasso Plattner Institute (HPI), Max Delbrück Center for Molecular Medicine (MDC), Karlsruher Institut für Technologie (KIT), Charité – Universitätsmedizin Berlin, Fraunhofer Heinrich Hertz Institute (Fraunhofer HHI), Technische Universität Berlin


Projektinhalte

Ziele

  • Entwicklung von bedingten Unabhängigkeitsprüfungen (CITs) für strukturierte Daten wie Bilder durch den Einsatz von Deep Learning zur Dateneinbettung
  • Gewährleistung von Typ-I-Fehler-Kontrolle bei statistischen Tests für multimodale Datensätze im biomedizinischen Bereich
  • Verbesserung der statistischen Power durch Transferlernen, optimal gelernte Einbettungen und maßgeschneiderte CITs für diese Einbettungen
  • Bereitstellung effizienter Algorithmen und benutzerfreundlicher Software zur Anwendung auf große biomedizinische Datensätze wie den UK Biobank
  • Anwendung der Tests in weiteren Projekten (P2, P4, P7) zur visuellen Erklärung und Analyse von multimodalen Daten

Arbeitspakete

  • P1: Deep conditional independence tests with an application to imaging genetics
  • P2: Visual explanations for statistical tests
  • P3: Explainable AI for microscopy image analysis
  • P4: Explainable AI for functional genomics
  • P5: Sparse and robust explanations for structured data
  • P6: Uncertainty quantification in biomedical deep learning
  • P7: Causal inference with multimodal data

Methoden

  • Deep nonparametric conditional independence tests (DNCITs)
  • Embedding maps for feature representation extraction
  • Layer-wise relevance propagation (LRP) with pruning for sparsity
  • Pruned layer-wise relevance propagation for sparse explanations
  • Transfer learning for optimal embeddings
  • Adversarially learned penalty for feature subspace independence
  • Metadata-guided Feature Disentanglement (MFD)
  • Procedurally generated dataset (Arctique) for uncertainty quantification
  • Online visualization tool with Con-score metric (DeepRepViz)
  • Virtual inspection layers for time series data
  • Reactive model correction via conditional bias suppression (R-ClArC)
  • Gradient penalization in latent space for bias unlearning
  • Concept Activation Vectors (CAVs) with pattern-based computation
  • DualView for post-hoc data attribution via surrogate modeling
  • Regression in quotient metric spaces (e.g., square-root-velocity framework)
  • Model guidance via explanations to turn classifiers into segmentation models
  • PURE method for disentangling polysemantic neurons via relevant circuits
  • Explaining predictive uncertainty through second-order effects (CovLRP, CovGI)
  • Reveal to Revise (R2R) framework for iterative bias correction
  • Right for the right reasons paradigm for weakly supervised segmentation
  • Understanding model decisions via prototypical concept-based explanations
  • TransferGWAS for genome-wide association studies on high-dimensional imaging data

Erwartete Ergebnisse

  • Entwicklung von bedingten Unabhängigkeitsprüfungen (CITs) für strukturierte Daten wie Bilder, die auf Deep Learning-basierten Dateneinbettungen basieren
  • Gewährleistung von Typ-I-Fehler-Kontrolle bei großen Mengen der Nullhypothese der bedingten Unabhängigkeit
  • Erhöhung der statistischen Power durch Transferlernen, optimal gelernte Einbettungen und leistungsfähige CITs, die für diese Einbettungen spezifisch sind
  • Bereitstellung effizienter Algorithmen und benutzerfreundlicher Software für die Anwendung in der Forschung
  • Validierung der Methoden anhand des UK Biobank-Datensatzes zur Überprüfung der Anwendbarkeit auf großskalige biomedizinische Datensätze
  • Integration der Tests in visuelle Erklärungsmethoden (P2) sowie Anwendung in Projekten P4 und P7
  • Bereitstellung von Stichprobenumfangs- und Power-Berechnungen für CITs, um Forschern die Planung von Experimenten auf Basis wissenschaftlicher Fragen zu ermöglichen

Kontakt

Ansprechperson: Eliza Mandieva, Project Coordinator
E-Mail: eliza.mandieva@hu-berlin.de
Projekt-Website: https://desbi.de/


Erfasst: 2026-01-14
Quelle: https://desbi.de/

Website besuchen