📊 Projekt

KI-FOR 5363 DeSBi (Fusing Deep Learning and Statistics towards Understanding Structured Biomedical Data)

Humboldt-Universität zu Berlin

KI-FOR 5363 DeSBi (Fusing Deep Learning and Statistics towards Understanding Structured Biomedical Data)

Institution: Humboldt-Universität zu Berlin Kategorie: Projekt
Website: https://desbi.de/

Kurzbeschreibung

Der Dienst bietet eine Methode zur statistischen Prüfung von bedingter Unabhängigkeit für strukturierte Daten wie Bilder und tabellarische Daten, insbesondere in multimodalen biomedizinischen Datensätzen. Zielgruppe sind Forschende in der Biomedizin, die inferenzbasierte Analysen an komplexen Daten durchführen möchten. Der Hauptnutzen liegt in der Bereitstellung von validierten, leistungsfähigen Tests mit Kontrolle des Typ-I-Fehlers und hoher statistischer Power. Hochschulen profitieren durch verbesserte methodische Grundlagen für die Analyse hochdimensionaler biomedizinischer Daten.

Allgemeinverständliche Beschreibung

-


Thematische Einordnung

Fachgebiete

Informatik Medizin Naturwissenschaften Statistik Biologie Maschinelles Lernen Künstliche Intelligenz Biomedizinische Informatik Genomik Neuroinformatik Bildverarbeitung Mathematik Systembiologie Computational Biology Pharmakologie Epidemiologie

Forschungsfelder

  • Deep Learning
  • Statistik
  • Medizinische Bildgebung
  • Genomik
  • Kausale Inferenz
  • Zeitreihenanalyse
  • Relevanzanalyse von neuronalen Netzen (Explainable AI)
  • Strukturierte biomedizinische Datenanalyse
  • Bildverarbeitung (Bildsegmentierung, -klassifikation)
  • Genetische Assoziationsstudien (GWAS)
  • Unsicherheitsquantifizierung in maschinellem Lernen
  • Transferlernen
  • Disentanglement von Merkmalen
  • Konzeptbasierte Erklärungen
  • Bedingte Unabhängigkeitstests
  • Biomedizinische Anwendungen von KI
  • Computational Biology
  • RNA- und Proteinsequenzanalyse

Spezialisierungen

  • Entwicklung von bedingten Unabhängigkeitsprüfungen (CITs) für strukturierte Daten wie Bilder
  • Nutzung von Deep Learning zur Dateneinbettung (data embedding) für statistische Tests
  • Anwendung statistischer Tests als Schlüsselinstrument für multimodale Datensätze im biomedizinischen Bereich
  • Gewährleistung der Kontrolle des Typ-I-Fehlers bei großen Mengen der Nullhypothese der bedingten Unabhängigkeit
  • Steigerung der statistischen Power durch Transferlernen und optimal gelernte Einbettungen
  • Entwicklung effizienter Algorithmen und benutzerfreundlicher Software für die Anwendung in großen biomedizinischen Datensätzen wie dem UK Biobank
  • Integration in andere Projekte (P2, P4, P7) zur visuellen Erklärung und Analyse multimodaler Daten
  • Bereitstellung von Werkzeugen für die experimentelle Planung basierend auf wissenschaftlichen Fragen mittels CITs

Schlagworte

  • P1: Deep conditional independence tests - Conditional independence testing - Multimodal datasets - Deep learning embeddings - Statistical inference - Imaging genetics - Nonparametric tests - Transfer learning - Type I error control - UK Biobank applications

Förderung

Fördergeber: -
Förderprogramm: KI-FOR 5363
Förderkennzeichen: KI-FOR 5363
Förderzeitraum: 2023 - 2027
Projektvolumen: -


Team & Partner

Projektleitung

  • Prof. Dr. Sonja Greven (Humboldt-Universität zu Berlin)
  • Prof. Dr. Christoph Lippert (University of Potsdam / Hasso-Plattner Institute)

Beteiligte Personen

  • Marco Simnacher (PhD Candidate)
  • Hani Park (PhD Candidate)
  • Xiangnan Xu (Postdoc)
  • Clara Hoffmann (PhD Student)
  • Dilyara Bareeva (PhD student)
  • Jim Berend (PhD student)
  • Lorenz Hufe (PhD student)
  • Sahar Iravani (Postdoc)
  • Masoumeh Javanbakhat (Postdoc)
  • Georg Keilbar (Postdoc)
  • Piotr Komorowski (PhD student)
  • Wei-Cheng Lai (PhD candidate)
  • Gabriel Nobis (PhD Candidate)
  • Roshan Rane (PhD Candidate)
  • Moritz Seiler (PhD Candidate)
  • Manuel Pfeuffer (PhD Cadidate)
  • Paulo Yanez Sarmiento (PhD Candidate)
  • Hadya Yassin (PhD Candidate)
  • Claudia Winklmayr (PhD Cadidate)
  • Maximilian Dreyer (PhD student)
  • Eshant English (PhD student)
  • Maarten Jung (PhD student)
  • Marta Lemanczyk (PhD student)
  • Alexander Rakowski (PhD student)
  • Sepideh Saran (PhD student)
  • Juliana Schneider (PhD student)
  • Ekkehard Schnoor (Postdoc)

Beteiligte Einrichtungen

-

Externe Partner

Humboldt-Universität zu Berlin, University of Potsdam, Hasso Plattner Institute (HPI), Max Delbrück Center for Molecular Medicine (MDC), Karlsruher Institut für Technologie (KIT), Charité – Universitätsmedizin Berlin, Fraunhofer Heinrich Hertz Institute (Fraunhofer HHI), Technische Universität Berlin


Projektinhalte

Ziele

  • Entwicklung von bedingten Unabhängigkeitsprüfungen (CITs) für strukturierte Daten wie Bilder durch den Einsatz von Deep Learning zur Dateneinbettung
  • Gewährleistung von Typ-I-Fehler-Kontrolle bei statistischen Tests für multimodale Datensätze im biomedizinischen Bereich
  • Verbesserung der statistischen Power durch Transferlernen, optimal gelernte Einbettungen und maßgeschneiderte CITs für diese Einbettungen
  • Bereitstellung effizienter Algorithmen und benutzerfreundlicher Software zur Anwendung auf große biomedizinische Datensätze wie den UK Biobank
  • Anwendung der Tests in weiteren Projekten (P2, P4, P7) zur visuellen Erklärung und Analyse multimodaler Daten

Arbeitspakete

  • P1: Deep conditional independence tests with an application to imaging genetics
  • P2: Visual explanations for statistical tests
  • P3: Explainable AI for microscopy image analysis
  • P4: Deep learning for functional genomics
  • P5: Sparse and robust explanations for structured data
  • P6: Uncertainty quantification in biomedical deep learning
  • P7: Causal inference with multimodal data

Methoden

  • Deep nonparametric conditional independence tests (DNCITs)
  • Embedding maps for feature representation extraction
  • Layer-wise relevance propagation (LRP) with pruning for sparsity
  • Pruned layer-wise relevance propagation for sparse explanations
  • Transfer learning for optimal embeddings
  • Nonparametric conditional independence tests (CITs)
  • Adversarially learned penalty for feature subspace independence
  • Metadata-guided feature disentanglement (MFD)
  • Procedurally generated dataset (Arctique) for uncertainty quantification
  • Online visualization tool (DeepRepViz) for latent representation inspection
  • Con-score (concept encoding score) for quantifying confounder influence
  • Virtual inspection layers for time series data interpretation
  • Reactive model correction via conditional bias suppression (R-ClArC)
  • Gradient penalization in latent space for bias unlearning
  • Pattern-based Concept Activation Vectors (CAVs) to overcome directional divergence
  • DualView for post-hoc data attribution using surrogate modeling
  • Regression in quotient metric spaces (e.g., square-root-velocity framework)
  • Splines for modeling smooth conditional mean curves
  • Concept-based explanations using prototypes (Understanding the (Extra-)Ordinary)
  • Reveal to Revise (R2R) framework for iterative bias correction
  • Model guidance via explanations to turn classifiers into segmentation models
  • PURE method for turning polysemantic neurons into pure features via circuit identification

Erwartete Ergebnisse

  • Entwicklung von bedingten Unabhängigkeitsprüfungen (CITs) für strukturierte Daten wie Bilder, die Deep Learning zur Dateneinbettung nutzen
  • Gewährleistung von Typ-I-Fehler-Kontrolle bei großen Mengen der Nullhypothese der bedingten Unabhängigkeit
  • Erhöhung der statistischen Power durch Transferlernen, optimal gelernte Einbettungen und leistungsfähige CITs, die speziell für diese Einbettungen angepasst sind
  • Bereitstellung effizienter Algorithmen und benutzerfreundlicher Software für die Anwendung in großskaligen biomedizinischen Datensätzen wie dem UK Biobank
  • Anwendung der Tests in den Projekten P2, P4 und P7, insbesondere als Eingabe für visuelle Erklärungstests
  • Bereitstellung von Stichprobenumfangs- und Power-Berechnungen für CITs, um Forschern die Planung von Experimenten basierend auf wissenschaftlichen Fragen zu ermöglichen

Kontakt

Ansprechperson: Eliza Mandieva, Project Coordinator
E-Mail: eliza.mandieva@hu-berlin.de
Projekt-Website: https://desbi.de/


Erfasst: 2026-01-14
Quelle: https://desbi.de/

Website besuchen