CNRS, Grenoble-France - Octobre 2023 - Septembre 2026
• Conception et maintenance de workflows de calcul statistique reproductibles pour l'analyse de données de séquençage de protéines bactériennes à grande échelle utilisant Python, R et PostgreSQL.
• Développement de code d'analyse modulaire et réutilisable pour supporter les analyses exploratoires et confirmatoires à travers plusieurs projets de recherche.
• Implémentation de pipelines automatisés pour le prétraitement des données, l'analyse, et la génération de rapports statistiques validés et de visualisations.
• Collaboration étroite avec des biologistes et experts du domaine pour traduire les questions scientifiques en solutions analytiques et statistiques robustes.
• Application de standards de qualité et de documentation pour assurer la traçabilité, la reproductibilité et la maintenabilité à long terme des résultats analytiques.
University of Calgary, Calgary-Canada - Juillet 2025 - Août 2025
• Conseil et formation des équipes de recherche sur la conception et l'implémentation de workflows de data science et de calcul statistique reproductibles.
• Contribution au développement d'une architecture scalable et modulaire pour la personnalisation de workflows analytiques et de machine learning.
• Traduction des exigences utilisateurs et de recherche en solutions analytiques maintenables et bien documentées (méthode publiée à ICLR 2025).
GMT Science, Paris-France - Février 2023 - Août 2023
• Conception et benchmark de modèles analytiques et statistiques pour les données de métagénomique shotgun afin d'identifier les signatures du cancer colorectal.
• Construction de pipelines analytiques end-to-end, incluant le prétraitement des données, l'ingénierie des features et l'évaluation des modèles.
• Réalisation d'analyses statistiques exploratoires et descriptives (PCA, PCoA) et tests d'hypothèses non-paramétriques (Wilcoxon, Kruskal–Wallis).
• Production de résumés statistiques interprétables et de visualisations pour supporter la génération d'insights scientifiques.
IDEEV, Paris-France - Octobre 2022 - Janvier 2023
• Traitement et analyse de jeux de données de métabarcoding (16S) utilisant des workflows statistiques standardisés.
• Réalisation d'analyses de diversité, réduction de dimensionnalité et analyse exploratoire de données.
• Contribution aux pratiques de recherche reproductible à travers un code structuré et des étapes d'analyse documentées.
BioSTM, Paris-France - Février 2022 - Août 2022
• Implémentation d'extensions accélérées GPU (CUDA/C++) de logiciels analytiques internes utilisés dans des environnements de laboratoire.
• Application de techniques d'apprentissage non supervisé et de réduction de dimensionnalité sur des jeux de données transcriptomiques normalisés (maladie NASH).
• Support à l'interprétation statistique et à la validation des résultats analytiques.
University of Mittweida, Mittweida-Allemagne - Mars 2021 - Novembre 2021
• Contribution à plusieurs projets de modélisation statistique liés à la COVID-19, résultant en publications peer-reviewed.
• Support à l'enseignement et au tutorat en statistiques et mathématiques, avec emphase sur la communication claire de concepts complexes.