Expériences Professionnelles

Data Scientist

CNRS, Grenoble-France - Octobre 2023 - Septembre 2026

• Conception et maintenance de workflows de calcul statistique reproductibles pour l'analyse de données de séquençage de protéines bactériennes à grande échelle utilisant Python, R et PostgreSQL.

• Développement de code d'analyse modulaire et réutilisable pour supporter les analyses exploratoires et confirmatoires à travers plusieurs projets de recherche.

• Implémentation de pipelines automatisés pour le prétraitement des données, l'analyse, et la génération de rapports statistiques validés et de visualisations.

• Collaboration étroite avec des biologistes et experts du domaine pour traduire les questions scientifiques en solutions analytiques et statistiques robustes.

• Application de standards de qualité et de documentation pour assurer la traçabilité, la reproductibilité et la maintenabilité à long terme des résultats analytiques.

Consultant Data Scientist

University of Calgary, Calgary-Canada - Juillet 2025 - Août 2025

• Conseil et formation des équipes de recherche sur la conception et l'implémentation de workflows de data science et de calcul statistique reproductibles.

• Contribution au développement d'une architecture scalable et modulaire pour la personnalisation de workflows analytiques et de machine learning.

• Traduction des exigences utilisateurs et de recherche en solutions analytiques maintenables et bien documentées (méthode publiée à ICLR 2025).

Ingénieur Machine Learning

GMT Science, Paris-France - Février 2023 - Août 2023

• Conception et benchmark de modèles analytiques et statistiques pour les données de métagénomique shotgun afin d'identifier les signatures du cancer colorectal.

• Construction de pipelines analytiques end-to-end, incluant le prétraitement des données, l'ingénierie des features et l'évaluation des modèles.

• Réalisation d'analyses statistiques exploratoires et descriptives (PCA, PCoA) et tests d'hypothèses non-paramétriques (Wilcoxon, Kruskal–Wallis).

• Production de résumés statistiques interprétables et de visualisations pour supporter la génération d'insights scientifiques.

Stagiaire Data Scientist

IDEEV, Paris-France - Octobre 2022 - Janvier 2023

• Traitement et analyse de jeux de données de métabarcoding (16S) utilisant des workflows statistiques standardisés.

• Réalisation d'analyses de diversité, réduction de dimensionnalité et analyse exploratoire de données.

• Contribution aux pratiques de recherche reproductible à travers un code structuré et des étapes d'analyse documentées.

Data Scientist Génomique

BioSTM, Paris-France - Février 2022 - Août 2022

• Implémentation d'extensions accélérées GPU (CUDA/C++) de logiciels analytiques internes utilisés dans des environnements de laboratoire.

• Application de techniques d'apprentissage non supervisé et de réduction de dimensionnalité sur des jeux de données transcriptomiques normalisés (maladie NASH).

• Support à l'interprétation statistique et à la validation des résultats analytiques.

Assistant de Recherche en Statistique

University of Mittweida, Mittweida-Allemagne - Mars 2021 - Novembre 2021

• Contribution à plusieurs projets de modélisation statistique liés à la COVID-19, résultant en publications peer-reviewed.

• Support à l'enseignement et au tutorat en statistiques et mathématiques, avec emphase sur la communication claire de concepts complexes.