Passer au contenu

/ Département de mathématiques et de statistique

Je donne

Rechercher

 

Wolf, Guy

Vcard

Professeur agrégé

Faculté des arts et des sciences - Département de mathématiques et de statistique

André-Aisenstadt Local 6165

514 343-6694

Courriels

Affiliations

  • Membre Centre de recherches mathématiques
  • Membre Institut de valorisation des données
  • Membre Institut des algorithmes d'apprentissage de Montréal
  • Membre IVADO — Institut de valorisation des données
  • Membre MILA — Institut des algorithmes d'apprentissage de Montréal

Expertise

Mes sujets de recherche se situent à l'intersection de l'apprentissage automatique, des sciences des données et des mathématiques appliquées. En particulier, je suis intéressé par les méthodes d'exploration des données qui utilisent l'apprentissage des variétés et l'apprentissage profond géométrique. Je m'intéresse aussi aux applications d'analyse exploratoire des données biomédicales, surtout ceux qui portent sur les données de cellules uniques (p.ex. scRNA-seq et CyTOF).

Encadrement Tout déplier Tout replier

Overcoming the challenges in geometric deep learning via hybrid graph neural network architectures Thèses et mémoires dirigés / 2024-11
Wenkel, Jan Frederik
Abstract
Les progrès technologiques nous permettent aujourd’hui de recueillir des données de différentes modalités, telles que le texte, l'audio, l'image ou la vidéo, à une échelle sans précédent. L'apprentissage profond est l'outil principal qui permet de comprendre et d'exploiter ces collections de données massives. Les capacités actuelles incluant des tâches prédictives telles que l'analyse des sentiments dans les textes, la classification de la musique et des images, la segmentation des images ou la reconnaissance des actions dans les vidéos, ainsi que des tâches génératives telles que la génération de textes, d'images, de musique et même de vidéos. Le succès de l'apprentissage profond dans de nombreuses applications est largement attribué à la capacité des méthodes à exploiter la structure intrinsèque des données. Les tâches de traitement d'images, par exemple, ont donné naissance aux réseaux neuronaux convolutifs qui utilisent l'organisation spatiale des pixels. Cependant, l'analyse des séries temporelles a donné naissance aux réseaux neuronaux récurrents qui utilisent l'organisation temporelle dans leur traitement de l'information en utilisant, par exemple, des mécanismes de mémoire. Alors que ces modalités peuvent être représentées dans des domaines Euclidiens qui possèdent des propriétés théoriques relativement agréables, d'autres modalités toutes aussi intéressantes possédant une structure plus abstraite. Les données des réseaux sociaux, des moteurs de recherche, des petites molécules ou des protéines sont naturellement représentées par des graphes. L'apprentissage profond géométrique est dirigé vers la généralisation de réseaux neuronaux qui peuvent utiliser la structure à de tels domaines non-Euclidiens. Les principaux outils sont les réseaux neuronaux de graphes qui généralisent les principes des réseaux neuronaux convolutionnels dans le domaine de la vision au domaine des graphes. Cela a permis de développer des méthodes puissantes pour de diverses applications, telles que l'analyse des réseaux sociaux et l’analyse ou la génération de molécules. Toutefois, ces méthodes sont limitées par plusieurs défis fondamentaux liés au paradigme central de passage de messages, c'est-à-dire le calcul répété de moyennes d’information au niveau des sommets par rapport au voisinage de chaque sommet. En conséquence, les représentations locales au niveau des sommets deviennent soit trop similaires en raison des calculs de moyenne répétés, soit les champs récepteurs des modèles sont trop petits pour que les informations ne puissent pas être partagées entre les sommets distants. Cette thèse présentera des approches pour relever ces défis en commençant par analyser et comprendre des données pertinentes et en identifiant les propriétés structurelles qui permettent un apprentissage efficace des représentations des graphes. Nous formulons ensuite un cadre théorique basé sur la théorie du traitement des signaux de graphes qui nous permet de développer de nouvelles architectures GNN puissantes qui exploitent ces propriétés, tout en atténuant les défis courants. Nous constatons que les modèles hybrides qui combinent les méthodes existantes et les nouveaux principes présentés dans cette thèse sont particulièrement puissants. Nous fournissons des garanties théoriques qui établissent les capacités théoriques des architectures proposées et présentons une analyse empirique qui démontre l'efficacité de ces nouvelles architectures dans une variété d’applications telles que les réseaux sociaux, la biochimie et l'optimisation combinatoire.

Horseshoe regularization for wavelet-based lensing inversion Thèses et mémoires dirigés / 2024-03
Nafisi, Hasti
Abstract
Gravitational lensing, a phenomenon in astronomy, occurs when the gravitational field of a massive object, such as a galaxy or a black hole, bends the path of light from a distant object behind it. This bending results in a distortion or magnification of the distant object's image, often seen as arcs or rings surrounding the foreground object. The Starlet wavelet transform offers a robust approach to representing galaxy images sparsely. This technique breaks down an image into wavelet coefficients at various scales and orientations, effectively capturing both large-scale structures and fine details. The Starlet wavelet transform offers a robust approach to representing galaxy images sparsely. This technique breaks down an image into wavelet coefficients at various scales and orientations, effectively capturing both large-scale structures and fine details. The horseshoe prior has emerged as a highly effective Bayesian technique for promoting sparsity and regularization in statistical modeling. It aggressively shrinks negligible values while preserving important features, making it particularly useful in situations where the reconstruction of an original image from limited noisy observations is inherently challenging. The main objective of this thesis is to apply sparse regularization techniques, particularly the horseshoe prior, to reconstruct the background source galaxy from gravitationally lensed images. By demonstrating the effectiveness of the horseshoe prior in this context, this thesis tackles the challenging inverse problem of reconstructing lensed galaxy images. Our proposed methodology involves applying the horseshoe prior to the wavelet coefficients of lensed galaxy images. By exploiting the sparsity of the wavelet representation and the noise-suppressing behavior of the horseshoe prior, we achieve well-regularized reconstructions that reduce noise and artifacts while preserving structural details. Experiments conducted on simulated lensed galaxy images demonstrate lower mean squared error and higher structural similarity with the horseshoe prior compared to alternative methods, validating its efficacy as an efficient sparse modeling technique.

Application de méthodes d’apprentissage profond pour images avec structure additionnelle à différents contextes Thèses et mémoires dirigés / 2023-05
Alsène-Racicot, Laurent
Abstract
Les méthodes d’apprentissage profond connaissent une croissance fulgurante. Une explication de ce phénomène est l’essor de la puissance de calcul combiné à l’accessibilité de données en grande quantité. Néanmoins, plusieurs applications de la vie réelle présentent des difficultés: la disponibilité et la qualité des données peuvent être faibles, l’étiquetage des données peut être ardu, etc. Dans ce mémoire, nous examinons deux contextes : celui des données limitées et celui du modèle économique CATS. Pour pallier les difficultés rencontrées dans ces contextes, nous utilisons des modèles d’apprentissage profond pour images avec structure additionnelle. Dans un premier temps, nous examinons les réseaux de scattering et étudions leur version paramétrée sur des petits jeux de données. Dans un second temps, nous adaptons les modèles de diffusion afin de proposer une alternative aux modèles à base d’agents qui sont complexes à construire et à optimiser. Nous vérifions empiriquement la faisabilité de cette démarche en modélisant le marché de l’emploi du modèle CATS. Nous constatons tout d’abord que les réseaux de scattering paramétrés sont performants sur des jeux de données de classification pour des petits échantillons de données. Nous démontrons que les réseaux de scattering paramétrés performent mieux que ceux non paramétrés, c’est-à-dire les réseaux de scattering traditionnels. En effet, nous constatons que des banques de filtres adaptés aux jeux de données permettent d’améliorer l’apprentissage. En outre, nous observons que les filtres appris se différencient selon les jeux de données. Nous vérifions également la propriété de robustesse aux petites déformations lisses expérimentalement. Ensuite, nous confirmons que les modèles de diffusion peuvent être adaptés pour modéliser le marché de l’emploi du modèle CATS dans une approche d’apprentissage profond. Nous vérifions ce fait pour deux architectures de réseau de neurones différentes. De plus, nous constatons que les performances sont maintenues pour différents scénarios impliquant l’apprentissage avec une ou plusieurs séries temporelles issues de CATS, lesquelles peuvent être tirées à partir d’hyperparamètres standards ou de perturbations de ceux-ci.

Exploratory and predictive methods for multivariate time series data analysis in healthcare Thèses et mémoires dirigés / 2022-08
Aumon, Adrien Andréas
Abstract
Ce mémoire s'inscrit dans l'émergente globalisation de l'intelligence artificielle aux domaines de la santé. Par le biais de l'application d'algorithmes modernes d'apprentissage automatique à deux études de cas concrètes, l'objectif est d'exposer de manière rigoureuse et intelligible aux experts de la santé comment l'intelligence artificielle exploite des données cliniques à la fois multivariées et longitudinales à des fins de visualisation et de prognostic de populations de patients en situation d'urgence médicale. Nos résultats montrent que la récente méthode de réduction de la dimensionalité PHATE couplée à un algorithme de regroupement surpasse d'autres méthodes plus établies dans la projection en deux dimensions de trajectoires multidimensionelles et aide ainsi les experts à mieux visualiser l'évolution de certaines sous-populations. Nous mettons aussi en évidence l'efficacité des réseaux de neurones récurrents traditionnels et conditionnels dans le prognostic précoce de patients malades. Enfin, nous évoquons l'analyse topologique de données comme piste de solution adéquate aux problèmes usuels de données incomplètes et irrégulières auxquels nous faisons face inévitablement au cours de la seconde étude de cas.

Projets de recherche Tout déplier Tout replier

Méthodes de persistence en mathématiques pures et appliquées FRQNT/Fonds de recherche du Québec - Nature et technologies (FQRNT) / 2024 - 2028

Combining Space, Time, and cell types to decode and explain the effect sizes of rare genomic variants on cognition and psychopathology IRSC/Instituts de recherche en santé du Canada / 2023 - 2030

Multiscale data geometric networks for learning representations and dynamics of biological systems National Science Foundation / 2023 - 2026

Vers une meilleure compréhension et une utilisation efficace du calcul en profondeur dans les réseaux de neurones modernes FRQNT/Fonds de recherche du Québec - Nature et technologies (FQRNT) / 2023 - 2026

Des données pour raconter // Vincent Chrétien SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements / 2023 - 2023

Centre de recherches mathématiques (CRM) FRQNT/Fonds de recherche du Québec - Nature et technologies (FQRNT) / 2022 - 2029

Diffusion Geometry & Topology Approach to Data Fusion and Mitigating Batch Effects SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements / 2022 - 2024

Representation learning and exploration of data geometries CRSNG/Conseil de recherches en sciences naturelles et génie du Canada (CRSNG) / 2021 - 2027

Representation learning and exploration of data geometries CRSNG/Conseil de recherches en sciences naturelles et génie du Canada (CRSNG) / 2021 - 2025

Exploitation de structures de graphes dans les réseaux de neurones par transformée de scattering géométrique FRQNT/Fonds de recherche du Québec - Nature et technologies (FQRNT) / 2021 - 2024

Geometry preserving deep networks SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements / 2021 - 2024

Integreted data-driven approaches for understanding immunological data SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements / 2021 - 2021

Unified approach to graph structure utilization in data science SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements / 2020 - 2023

PHATE-NET SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements / 2020 - 2020

Finding emergent structure un multi-sample biological data with the dual geometry of cells and features NIH/National Institutes of Health (NIH) / 2019 - 2024

Finding emergent structure un multi-sample biological data with the dual geometry of cells and features NIH/National Institutes of Health (NIH) / 2019 - 2023

Probing learned network structure in a multi-task setting SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements / 2019 - 2019

Programme de fonds de démarrage et d'opération pour professeure IVADO - Compte pour le fonds d'opération - Guy Wolf SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements / 2018 - 2022

Programme de fonds de démarrage et d'opération pour professeure IVADO - Compte pour le fonds d'opération - Guy Wolf SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements / 2018 - 2021

Programme de fonds de démarrage et d'opération pour professeure IVADO - Compte pour le fonds de démarrage - Guy Wolf SPIIE/Secrétariat des programmes interorganismes à l’intention des établissements / 2018 - 2019