📊 Projekt

KI-FOR 5363 DeSBi (Fusing Deep Learning and Statistics towards Understanding Structured Biomedical Data)

Institution: Humboldt-Universität zu Berlin Kategorie: Projekt
Website: https://desbi.de/

Kurzbeschreibung

Der Dienst bietet eine Methode zur statistischen Prüfung von bedingter Unabhängigkeit für strukturierte Daten wie Bilder und tabellarische Informationen. Er ermöglicht die Anwendung von tiefen Lernverfahren zur Dateneinbettung und kombiniert diese mit nichtparametrischen Tests. Zielgruppe sind Forschende in der Biomedizin, die komplexe multimodale Datensätze analysieren. Hochschulen profitieren durch verbesserte statistische Inferenz und Validierung von Modellen in hochdimensionalen Daten.

Allgemeinverständliche Beschreibung

Thematische Einordnung

Fachgebiete

Informatik Medizin Statistik Biologie Maschinelles Lernen Künstliche Intelligenz Biomathematik Computational Biology Neuroinformatik Genomik Bildverarbeitung Biostatistik Data Science

Forschungsfelder

Deep Learning
Statistik
Medizinische Bildgebung
Genomik
Kausale Inferenz
Zeitreihenanalyse
Rechnerische Biologie
Erklärbarkeit künstlicher Intelligenz (Explainable AI)
Bildanalyse
Strukturierte biomedizinische Daten
Bedingte Unabhängigkeitstests
Transferlernen
Unsicherheitsquantifizierung
Konfundenzkontrolle
Genomweite Assoziationsstudien (GWAS)
Neuronale Netze
Datenintegration (Multimodalität

Spezialisierungen

Entwicklung von bedingten Unabhängigkeitsprüfungen (CITs) für strukturierte Daten wie Bilder
Nutzung von Deep Learning zur Dateneinbettung (data embedding) für multimodale Datensätze
Anwendung statistischer Tests als Schlüsselinstrument für die Inferenz in multimodalen Datensets
Gewährleistung der Kontrolle des Typ-I-Fehlers bei großen Hypothesensets
Steigerung der statistischen Power durch Transferlernen und optimal gelernte Einbettungen
Entwicklung effizienter Algorithmen und benutzerfreundlicher Software für die Anwendung in der Biomedizin
Anwendung auf große biomedizinische Datensätze wie das UK Biobank
Integration in andere Projekte (P2, P4, P7) zur visuellen Erklärung und Analyse von Daten

Schlagworte

P1: Deep conditional independence tests / - Conditional Independence Tests / - Deep Learning / - Image Analysis / - Multimodal Data / - Statistical Inference / - UK Biobank / - Transfer Learning / - Nonparametric Testing / - Data Embedding

Förderung

Fördergeber: -
Förderprogramm: KI-FOR 5363
Förderkennzeichen: KI-FOR 5363
Förderzeitraum: 2023 - 2027
Projektvolumen: Das Volumen oder "INSUFFICIENT"

Team & Partner

Projektleitung

Prof. Dr. Sonja Greven (Humboldt-Universität zu Berlin)
Prof. Dr. Christoph Lippert (University of Potsdam / Hasso-Plattner Institute)

Beteiligte Personen

Marco Simnacher (PhD Candidate)
Hani Park (PhD Candidate)
Xiangnan Xu (Postdoc)
Clara Hoffmann (PhD Student)
Dilyara Bareeva (PhD student)
Jim Berend (PhD student)
Lorenz Hufe (PhD student)
Sahar Iravani (Postdoc)
Masoumeh Javanbakhat (Postdoc)
Georg Keilbar (Postdoc)
Piotr Komorowski (PhD student)
Wei-Cheng Lai (PhD candidate)
Gabriel Nobis (PhD Candidate)
Roshan Rane (PhD Candidate)
Moritz Seiler (PhD Candidate)
Manuel Pfeuffer (PhD Cadidate)
Paulo Yanez Sarmiento (PhD Candidate)
Hadya Yassin (PhD Candidate)
Claudia Winklmayr (PhD Cadidate)
Maximilian Dreyer (PhD student)
Eshant English (PhD student)
Maarten Jung (PhD student)
Marta Lemanczyk (PhD student)
Alexander Rakowski (PhD student)
Sepideh Saran (PhD student)
Juliana Schneider (PhD student)
Ekkehard Schnoor (Postdoc)

Beteiligte Einrichtungen

Externe Partner

Humboldt-Universität zu Berlin, University of Potsdam, Hasso Plattner Institute (HPI), Max Delbrück Center for Molecular Medicine (MDC), Karlsruher Institut für Technologie (KIT), Charité – Universitätsmedizin Berlin, Fraunhofer Heinrich Hertz Institute (Fraunhofer HHI), Technische Universität Berlin

Projektinhalte

Ziele

Entwicklung von bedingten Unabhängigkeitsprüfungen (CITs) für strukturierte Daten wie Bilder durch den Einsatz von Deep Learning zur Dateneinbettung
Gewährleistung von Typ-I-Fehler-Kontrolle bei statistischen Tests für multimodale Datensätze im biomedizinischen Bereich
Verbesserung der statistischen Power durch Transferlernen, optimal gelernte Einbettungen und maßgeschneiderte CITs für diese Einbettungen
Bereitstellung effizienter Algorithmen und benutzerfreundlicher Software zur Anwendung auf große biomedizinische Datensätze wie den UK Biobank
Anwendung der Tests in weiteren Projekten (P2, P4, P7) zur visuellen Erklärung und Analyse von multimodalen Daten

Arbeitspakete

P1: Deep conditional independence tests with an application to imaging genetics
P2: Visual explanations for statistical tests
P3: Explainable AI for microscopy image analysis
P4: Explainable AI for functional genomics
P5: Sparse and robust explanations for structured data
P6: Uncertainty quantification in biomedical deep learning
P7: Causal inference with multimodal data

Methoden

Deep nonparametric conditional independence tests (DNCITs)
Embedding maps for feature representation extraction
Layer-wise relevance propagation (LRP) with pruning for sparsity
Pruned layer-wise relevance propagation for sparse explanations
Transfer learning for optimal embeddings
Adversarially learned penalty for feature subspace independence
Metadata-guided Feature Disentanglement (MFD)
Procedurally generated dataset (Arctique) for uncertainty quantification
Online visualization tool with Con-score metric (DeepRepViz)
Virtual inspection layers for time series data
Reactive model correction via conditional bias suppression (R-ClArC)
Gradient penalization in latent space for bias unlearning
Concept Activation Vectors (CAVs) with pattern-based computation
DualView for post-hoc data attribution via surrogate modeling
Regression in quotient metric spaces (e.g., square-root-velocity framework)
Model guidance via explanations to turn classifiers into segmentation models
PURE method for disentangling polysemantic neurons via relevant circuits
Explaining predictive uncertainty through second-order effects (CovLRP, CovGI)
Reveal to Revise (R2R) framework for iterative bias correction
Right for the right reasons paradigm for weakly supervised segmentation
Understanding model decisions via prototypical concept-based explanations
TransferGWAS for genome-wide association studies on high-dimensional imaging data

Erwartete Ergebnisse

Entwicklung von bedingten Unabhängigkeitsprüfungen (CITs) für strukturierte Daten wie Bilder, die auf Deep Learning-basierten Dateneinbettungen basieren
Gewährleistung von Typ-I-Fehler-Kontrolle bei großen Mengen der Nullhypothese der bedingten Unabhängigkeit
Erhöhung der statistischen Power durch Transferlernen, optimal gelernte Einbettungen und leistungsfähige CITs, die für diese Einbettungen spezifisch sind
Bereitstellung effizienter Algorithmen und benutzerfreundlicher Software für die Anwendung in der Forschung
Validierung der Methoden anhand des UK Biobank-Datensatzes zur Überprüfung der Anwendbarkeit auf großskalige biomedizinische Datensätze
Integration der Tests in visuelle Erklärungsmethoden (P2) sowie Anwendung in Projekten P4 und P7
Bereitstellung von Stichprobenumfangs- und Power-Berechnungen für CITs, um Forschern die Planung von Experimenten auf Basis wissenschaftlicher Fragen zu ermöglichen

Kontakt

Ansprechperson: Eliza Mandieva, Project Coordinator
E-Mail: eliza.mandieva@hu-berlin.de
Projekt-Website: https://desbi.de/

Erfasst: 2026-01-14
Quelle: https://desbi.de/

Website besuchen

Informationen

Institution: Humboldt-Universität zu Berlin

Kontakt

Ansprechperson: - Prof. Dr. Sonja Greven (Humboldt-Universität zu Berlin) - Prof. Dr. Christoph Lippert (University of Potsdam / Hasso-Plattner Institute)
E-Mail: eliza.mandieva@hu-berlin.de

Kategorie: Projekt
Hinzugefügt: 14.01.2026
Quelle: Originalwebsite ↗