Passer au contenu

/ Département de mathématiques et de statistique

Je donne

Rechercher

 

Wolf, Guy

Vcard

Professeur agrégé

Faculté des arts et des sciences - Département de mathématiques et de statistique

André-Aisenstadt Local 6165

514 343-6694

Courriels

Affiliations

  • Membre Centre de recherches mathématiques
  • Membre Institut de valorisation des données
  • Membre Institut des algorithmes d'apprentissage de Montréal
  • Membre IVADO — Institut de valorisation des données
  • Membre MILA — Institut des algorithmes d'apprentissage de Montréal

Expertise

Mes sujets de recherche se situent à l'intersection de l'apprentissage automatique, des sciences des données et des mathématiques appliquées. En particulier, je suis intéressé par les méthodes d'exploration des données qui utilisent l'apprentissage des variétés et l'apprentissage profond géométrique. Je m'intéresse aussi aux applications d'analyse exploratoire des données biomédicales, surtout ceux qui portent sur les données de cellules uniques (p.ex. scRNA-seq et CyTOF).

Encadrement Tout déplier Tout replier

Intrinsic latent structures in machine learning : diffusion distances, representation alignment, and graph inference Thèses et mémoires dirigés / 2026-02
Natik, Amine
Abstract
Au cours des deux dernières décennies, l’apprentissage automatique (ML), et plus particulièrement l’apprentissage profond (DL), ont révolutionné de nombreux domaines en découvrant des structures prédictives à partir de jeux de données de grande dimension. Cependant, l’exploitation efficace de ces méthodes dépend crucialement de la reconnaissance des structures géométriques et latentes inhérentes aux données et aux architectures des modèles. Le thème central de cette thèse est que les données réelles résident souvent sur ou à proximité de structures géométriques de faible dimension intégrées dans des espaces de grande dimension. En identifiant ces structures latentes (géométriques, probabilistes ou combinatoires), nous pouvons améliorer l’interprétabilité, la robustesse et l’évolutivité des méthodes d’apprentissage automatique. De nombreux modèles exploitant ces idées, tels que les réseaux neuronaux sur graphes (GNN), les plongements basés sur la diffusion et les méthodes spectrales, sont désormais courants en bioinformatique, en vision par ordinateur et en traitement du langage naturel. Cette thèse vise à approfondir la compréhension et l’application des structures géométriques et latentes intrinsèques à travers quatre contributions complémentaires : (1) Nous proposons la Diffusion Earth Mover’s Distance (Diffusion EMD) comme mesure géométrique entre distributions ; (2) Nous étudions l’efficacité du Centered Kernel Alignment (CKA) pour comparer des représentations neuronales ; (3) Nous présentons GraphPPD, un cadre bayésien prédictif pour l’inférence incertaine sur graphes ; et (4) Nous analysons théoriquement l’algorithme spectral de sériation et sa robustesse pour récupérer des ordres latents à partir de données bruitées. Tout d’abord, nous proposons la Diffusion EMD, une méthode rapide et évolutive pour comparer des jeux de données de grande dimension modélisés comme des distributions sur un graphe partagé. En diffusant la masse de probabilité à travers la structure du graphe plutôt qu’en utilisant l’espace euclidien, la Diffusion EMD s’aligne plus étroitement avec la géométrie variétale des données. Elle est équivalente topologiquement à l’EMD classique avec v une distance géodésique sous des hypothèses variétales, tout en étant plus efficace et différentiable. Cela permet des comparaisons précises à grande échelle, comme celles nécessaires en biologie unicellulaire, révélant des structures au niveau des patients. Ensuite, nous étudions l’efficacité du CKA, une métrique de similarité utilisée pour comparer des représentations neuronales. Nous montrons que le CKA peut être très sensible à des transformations simples, telles que des translations affines, en particulier dans les contextes à haute dimension ou avec peu d’échantillons. Cela soulève des préoccupations sur sa fiabilité et souligne la nécessité d’alternatives plus robustes. Troisièmement, nous introduisons GraphPPD, un cadre bayésien variationnel conçu pour modéliser l’incertitude dans les tâches de prédiction au niveau des graphes. Alors que la plupart des méthodes existantes se concentrent sur l’incertitude au niveau des noeuds ou des liens, GraphPPD capture les distributions prédictives postérieures complètes au niveau du graphe. Basé sur des plongements obtenus à partir de GNN standard, il permet une quantification adaptative de l’incertitude et améliore la calibration en présence de changements de distribution, facilitant une prise de décision plus fiable. Enfin, nous étudions la sériation spectrale, une méthode classique pour récupérer un ordre séquentiel latent à partir de données de similarité par paires. Nous analysons ses performances dans une classe générale de modèles de graphes aléatoires, montrant qu’elle récupère systématiquement l’ordre latent même en présence de bruit important. Sous des hypothèses modérées sur la structure du graphe, la sériation spectrale fournit des estimations d’ordre avec des taux de convergence démontrables. Ces résultats confirment la robustesse des méthodes spectrales dans des contextes tels que la génomique et les systèmes de recommandation. Ensemble, ces contributions démontrent l’importance des structures intrinsèques géométriques et latentes dans l’apprentissage automatique moderne. Cette thèse est organisée en format portefeuille, présentant quatre projets de recherche adaptés et intégrés. Bien que chaque chapitre aborde un problème distinct, ils éclairent ensemble des facettes complémentaires de la capture et de l’exploitation des structures latentes pour faire progresser la théorie et la pratique de l’apprentissage automatique.

Advances in optimal transport for biology; from manifold learning to generative modeling Thèses et mémoires dirigés / 2025-09
Huguet, Guillaume
Abstract
Cette thèse explore l'intersection du transport optimal (OT, de l'anglais optimal transport), de l'apprentissage de variétés et de modèles génératifs, en mettant l'accent sur les applications en biologie computationnelle. Nous introduisons de nouvelles méthodes et approximations pour le transport optimal (formulations primale et duale) et la modélisation dynamique, ainsi que des techniques pour définir des caractéristiques géométriques des données. Ces contributions aboutissent à des applications telles que l'inférence de trajectoires pour des observations de cellules à des points temporels multiples et la génération de protéines dans des tâches inconditionnelles et conditionnelles a des motifs. La première partie se concentre sur l'extraction de caractéristiques qualifiant un espace non-Euclidien à partir d'ensembles de données, en définissant une approximation des distances géodésiques basée sur la diffusion. Cette distance est appliquée à la réduction de la dimensionnalité des données et comme fonction de coût dans l'OT. En outre, un processus dynamique est introduit, offrant une représentation multi-échelle des ensembles de données avec des garanties de convergence vers un point unique. Ce résultat facilite les applications, par exemple, dans l'analyse des données topologiques. La deuxième partie examine les approximations statiques de l'OT qui utilisent implicitement les distances géodésiques comme fonction de coût. En s'appuyant sur des opérateurs de diffusion basés sur les graphes, ces méthodes approximent les formulations primales et duales d'OT. Les applications comprennent le calcul efficace des distances de Wasserstein, l'interpolation des distributions et la construction de barycentres, avec un succès notable dans l'analyse des données RNA-seq unicellulaires et des organoïdes dérivés de patients. La troisième partie passe aux formulations dynamiques de l'OT et aux modèles génératifs. Une nouvelle méthode d'inférence de trajectoire inspirée de l'OT dynamique est proposée, qui apprend un champ de vecteurs dans un espace qui approxime une variété et décode la trajectoire dans l'espace des gènes. Cela permet d'obtenir des informations interprétables sur l'évolution des populations cellulaires grâce aux tendances et aux regroupements de gènes. Enfin, une approche de modélisation générative basée sur le flux dans l'espace SE(3) est introduite pour la génération de protéines. En apprenant un champ vectoriel conditionnel aux séquences d’acides aminées, cette méthode permet d'obtenir une grande diversité et une grande capacité de conception dans les protéines générées. Cette thèse fait progresser les méthodes basées sur l'OT, l'apprentissage de variétés et les modèles génératifs dynamiques applicabilité a des défis particuliers en biologie. Les méthodes présentées ouvrent des voies pour la recherche future, y compris la mise à l'échelle des approximations OT, l'intégration de la dynamique de la croissance cellulaire, et l'extension de la conception des protéines à des représentations plus fines comme les interactions entre protéines.

Overcoming the challenges in geometric deep learning via hybrid graph neural network architectures Thèses et mémoires dirigés / 2024-11
Wenkel, Jan Frederik
Abstract
Les progrès technologiques nous permettent aujourd’hui de recueillir des données de différentes modalités, telles que le texte, l'audio, l'image ou la vidéo, à une échelle sans précédent. L'apprentissage profond est l'outil principal qui permet de comprendre et d'exploiter ces collections de données massives. Les capacités actuelles incluant des tâches prédictives telles que l'analyse des sentiments dans les textes, la classification de la musique et des images, la segmentation des images ou la reconnaissance des actions dans les vidéos, ainsi que des tâches génératives telles que la génération de textes, d'images, de musique et même de vidéos. Le succès de l'apprentissage profond dans de nombreuses applications est largement attribué à la capacité des méthodes à exploiter la structure intrinsèque des données. Les tâches de traitement d'images, par exemple, ont donné naissance aux réseaux neuronaux convolutifs qui utilisent l'organisation spatiale des pixels. Cependant, l'analyse des séries temporelles a donné naissance aux réseaux neuronaux récurrents qui utilisent l'organisation temporelle dans leur traitement de l'information en utilisant, par exemple, des mécanismes de mémoire. Alors que ces modalités peuvent être représentées dans des domaines Euclidiens qui possèdent des propriétés théoriques relativement agréables, d'autres modalités toutes aussi intéressantes possédant une structure plus abstraite. Les données des réseaux sociaux, des moteurs de recherche, des petites molécules ou des protéines sont naturellement représentées par des graphes. L'apprentissage profond géométrique est dirigé vers la généralisation de réseaux neuronaux qui peuvent utiliser la structure à de tels domaines non-Euclidiens. Les principaux outils sont les réseaux neuronaux de graphes qui généralisent les principes des réseaux neuronaux convolutionnels dans le domaine de la vision au domaine des graphes. Cela a permis de développer des méthodes puissantes pour de diverses applications, telles que l'analyse des réseaux sociaux et l’analyse ou la génération de molécules. Toutefois, ces méthodes sont limitées par plusieurs défis fondamentaux liés au paradigme central de passage de messages, c'est-à-dire le calcul répété de moyennes d’information au niveau des sommets par rapport au voisinage de chaque sommet. En conséquence, les représentations locales au niveau des sommets deviennent soit trop similaires en raison des calculs de moyenne répétés, soit les champs récepteurs des modèles sont trop petits pour que les informations ne puissent pas être partagées entre les sommets distants. Cette thèse présentera des approches pour relever ces défis en commençant par analyser et comprendre des données pertinentes et en identifiant les propriétés structurelles qui permettent un apprentissage efficace des représentations des graphes. Nous formulons ensuite un cadre théorique basé sur la théorie du traitement des signaux de graphes qui nous permet de développer de nouvelles architectures GNN puissantes qui exploitent ces propriétés, tout en atténuant les défis courants. Nous constatons que les modèles hybrides qui combinent les méthodes existantes et les nouveaux principes présentés dans cette thèse sont particulièrement puissants. Nous fournissons des garanties théoriques qui établissent les capacités théoriques des architectures proposées et présentons une analyse empirique qui démontre l'efficacité de ces nouvelles architectures dans une variété d’applications telles que les réseaux sociaux, la biochimie et l'optimisation combinatoire.

Horseshoe regularization for wavelet-based lensing inversion Thèses et mémoires dirigés / 2024-03
Nafisi, Hasti
Abstract
Gravitational lensing, a phenomenon in astronomy, occurs when the gravitational field of a massive object, such as a galaxy or a black hole, bends the path of light from a distant object behind it. This bending results in a distortion or magnification of the distant object's image, often seen as arcs or rings surrounding the foreground object. The Starlet wavelet transform offers a robust approach to representing galaxy images sparsely. This technique breaks down an image into wavelet coefficients at various scales and orientations, effectively capturing both large-scale structures and fine details. The Starlet wavelet transform offers a robust approach to representing galaxy images sparsely. This technique breaks down an image into wavelet coefficients at various scales and orientations, effectively capturing both large-scale structures and fine details. The horseshoe prior has emerged as a highly effective Bayesian technique for promoting sparsity and regularization in statistical modeling. It aggressively shrinks negligible values while preserving important features, making it particularly useful in situations where the reconstruction of an original image from limited noisy observations is inherently challenging. The main objective of this thesis is to apply sparse regularization techniques, particularly the horseshoe prior, to reconstruct the background source galaxy from gravitationally lensed images. By demonstrating the effectiveness of the horseshoe prior in this context, this thesis tackles the challenging inverse problem of reconstructing lensed galaxy images. Our proposed methodology involves applying the horseshoe prior to the wavelet coefficients of lensed galaxy images. By exploiting the sparsity of the wavelet representation and the noise-suppressing behavior of the horseshoe prior, we achieve well-regularized reconstructions that reduce noise and artifacts while preserving structural details. Experiments conducted on simulated lensed galaxy images demonstrate lower mean squared error and higher structural similarity with the horseshoe prior compared to alternative methods, validating its efficacy as an efficient sparse modeling technique.

Application de méthodes d’apprentissage profond pour images avec structure additionnelle à différents contextes Thèses et mémoires dirigés / 2023-05
Alsène-Racicot, Laurent
Abstract
Les méthodes d’apprentissage profond connaissent une croissance fulgurante. Une explication de ce phénomène est l’essor de la puissance de calcul combiné à l’accessibilité de données en grande quantité. Néanmoins, plusieurs applications de la vie réelle présentent des difficultés: la disponibilité et la qualité des données peuvent être faibles, l’étiquetage des données peut être ardu, etc. Dans ce mémoire, nous examinons deux contextes : celui des données limitées et celui du modèle économique CATS. Pour pallier les difficultés rencontrées dans ces contextes, nous utilisons des modèles d’apprentissage profond pour images avec structure additionnelle. Dans un premier temps, nous examinons les réseaux de scattering et étudions leur version paramétrée sur des petits jeux de données. Dans un second temps, nous adaptons les modèles de diffusion afin de proposer une alternative aux modèles à base d’agents qui sont complexes à construire et à optimiser. Nous vérifions empiriquement la faisabilité de cette démarche en modélisant le marché de l’emploi du modèle CATS. Nous constatons tout d’abord que les réseaux de scattering paramétrés sont performants sur des jeux de données de classification pour des petits échantillons de données. Nous démontrons que les réseaux de scattering paramétrés performent mieux que ceux non paramétrés, c’est-à-dire les réseaux de scattering traditionnels. En effet, nous constatons que des banques de filtres adaptés aux jeux de données permettent d’améliorer l’apprentissage. En outre, nous observons que les filtres appris se différencient selon les jeux de données. Nous vérifions également la propriété de robustesse aux petites déformations lisses expérimentalement. Ensuite, nous confirmons que les modèles de diffusion peuvent être adaptés pour modéliser le marché de l’emploi du modèle CATS dans une approche d’apprentissage profond. Nous vérifions ce fait pour deux architectures de réseau de neurones différentes. De plus, nous constatons que les performances sont maintenues pour différents scénarios impliquant l’apprentissage avec une ou plusieurs séries temporelles issues de CATS, lesquelles peuvent être tirées à partir d’hyperparamètres standards ou de perturbations de ceux-ci.

Exploratory and predictive methods for multivariate time series data analysis in healthcare Thèses et mémoires dirigés / 2022-08
Aumon, Adrien Andréas
Abstract
Ce mémoire s'inscrit dans l'émergente globalisation de l'intelligence artificielle aux domaines de la santé. Par le biais de l'application d'algorithmes modernes d'apprentissage automatique à deux études de cas concrètes, l'objectif est d'exposer de manière rigoureuse et intelligible aux experts de la santé comment l'intelligence artificielle exploite des données cliniques à la fois multivariées et longitudinales à des fins de visualisation et de prognostic de populations de patients en situation d'urgence médicale. Nos résultats montrent que la récente méthode de réduction de la dimensionalité PHATE couplée à un algorithme de regroupement surpasse d'autres méthodes plus établies dans la projection en deux dimensions de trajectoires multidimensionelles et aide ainsi les experts à mieux visualiser l'évolution de certaines sous-populations. Nous mettons aussi en évidence l'efficacité des réseaux de neurones récurrents traditionnels et conditionnels dans le prognostic précoce de patients malades. Enfin, nous évoquons l'analyse topologique de données comme piste de solution adéquate aux problèmes usuels de données incomplètes et irrégulières auxquels nous faisons face inévitablement au cours de la seconde étude de cas.

Projets de recherche Tout déplier Tout replier

Méthodes de persistence en mathématiques pures et appliquées FRQNT/Fonds de recherche du Québec - Nature et technologies (FQRNT) / 2024 - 2028

Combining Space, Time, and cell types to decode and explain the effect sizes of rare genomic variants on cognition and psychopathology IRSC/Instituts de recherche en santé du Canada / 2023 - 2030

Multiscale data geometric networks for learning representations and dynamics of biological systems National Science Foundation / 2023 - 2026

Vers une meilleure compréhension et une utilisation efficace du calcul en profondeur dans les réseaux de neurones modernes FRQNT/Fonds de recherche du Québec - Nature et technologies (FQRNT) / 2023 - 2026

Des données pour raconter // Vincent Chrétien SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements / 2023 - 2023

Centre de recherches mathématiques (CRM) FRQNT/Fonds de recherche du Québec - Nature et technologies (FQRNT) / 2022 - 2029

Diffusion Geometry & Topology Approach to Data Fusion and Mitigating Batch Effects SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements / 2022 - 2024

Representation learning and exploration of data geometries CRSNG/Conseil de recherches en sciences naturelles et génie du Canada (CRSNG) / 2021 - 2027

Representation learning and exploration of data geometries CRSNG/Conseil de recherches en sciences naturelles et génie du Canada (CRSNG) / 2021 - 2025

Exploitation de structures de graphes dans les réseaux de neurones par transformée de scattering géométrique FRQNT/Fonds de recherche du Québec - Nature et technologies (FQRNT) / 2021 - 2024

Geometry preserving deep networks SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements / 2021 - 2024

Integreted data-driven approaches for understanding immunological data SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements / 2021 - 2021

Unified approach to graph structure utilization in data science SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements / 2020 - 2023

PHATE-NET SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements / 2020 - 2020

Finding emergent structure un multi-sample biological data with the dual geometry of cells and features NIH/National Institutes of Health (NIH) / 2019 - 2024

Finding emergent structure un multi-sample biological data with the dual geometry of cells and features NIH/National Institutes of Health (NIH) / 2019 - 2023

Probing learned network structure in a multi-task setting SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements / 2019 - 2019

Programme de fonds de démarrage et d'opération pour professeure IVADO - Compte pour le fonds d'opération - Guy Wolf SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements / 2018 - 2022

Programme de fonds de démarrage et d'opération pour professeure IVADO - Compte pour le fonds d'opération - Guy Wolf SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements / 2018 - 2021

Programme de fonds de démarrage et d'opération pour professeure IVADO - Compte pour le fonds de démarrage - Guy Wolf SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements / 2018 - 2019