Thèmes

Thèmes

Contexte

Avec les progrès de la médecine moderne, un grand nombre de rencontres médicales (visites médicales, examens, médicaments, imagerie, tests moléculaires, etc.) ont lieu dans notre système de santé. En fait, la quantité de nouvelles données de santé mondiales générées en 2020 devrait avoir atteint 2 314 exaoctets. La plupart des contenus des dossiers médicaux électroniques (DME) de nos hôpitaux sont enregistrés via des tableaux de données éparses avec une forte probabilité de valeurs manquantes. Les DME possèdent néanmoins une grande quantité de données hétérogènes provenant de différentes sources, dont la plupart ne sont souvent pas exploitées de manière optimale pour caractériser et prédire le comportement des maladies. Par exemple, l'imagerie médicale (i.e. l'imagerie par résonance magnétique, IRM) serait une source immense de données potentielles pour décoder les phénotypes de cancer.

D’autre part, les médecins décrivent et écrivent également les caractéristiques importantes des patients et les symptômes liés à la maladie pour presque chaque consultation médicale par le biais de notes médicales textuelles en forme libre. Ces dernières années, les progrès significatifs de la technologie multi-omique (par exemple, génomique, transcriptomique, etc.) ont également créé des opportunités sans précédent pour caractériser les processus biologiques corrélés aux maladies. Cependant, la combinaison de ces sources de données hétérogènes de manière significative pour la prédiction des maladies est un défi.

Pour une meilleure médecine de précision, les médecins doivent donc désormais prendre des décisions thérapeutiques de plus en plus complexes avec un nombre irréaliste de variables. C’est pourquoi les développements de l’intelligence artificielle (IA) sont envisagés pour créer une révolution de la science des données en médecine. En particulier, les réseaux de neurones graphiques (GNN) ont montré un immense potentiel dans l’apprentissage de représentations de données significatives et puissantes en combinant l’inférence relationnelle des modèles graphiques avec la puissance de l’apprentissage profond. Cependant, étant donné que la puissance de l’apprentissage profond est fortement associée à la taille des données et que les données médicales ne peuvent pas être facilement partagées entre les institutions médicales pour des raisons de confidentialité des patients, le développement de modèles de GNN puissants pour la prédiction des maladies dans le domaine de la santé est un défi majeur.

Mission

La mission principale du laboratoire MEDomicsUdeS est de développer un cadre pour l'apprentissage GNN distribué préservant la vie privée à partir d'un réseau de bases de données de soins de santé fédérées, ce qui constituera une étape importante pour le progrès de l'IA en médecine. Dans ce cadre d'apprentissage fédéré :
  • (i) des modèles GNN peuvent être développés à partir des bases de données de plusieurs établissements de santé, augmentant ainsi la taille des données analysées ; et
  • (ii) les données sont toujours conservées dans les limites de chaque établissement de santé, évitant ainsi le transfert de données.
Les figures ci-dessous présentent un aperçu du cadre de recherche principal du laboratoire MEDomics UdeS.

Axe de recherche 1 : Imagerie médicale

  • Les tumeurs les plus agressives ont tendance à être plus hétérogènes

  • Les réseaux de neurones permettent détecter les tumeurs les plus hétérogènes

Axe de recherche 2 : Données hétérogènes

  • Les données de différentes sources peuvent être combinées pour effectuer de meilleures prédictions

  • Par exemple, l’imagerie médicale, les notes textuelles de médecins et les données cliniques regorgent d’informations pertinentes

Axe de recherche 3 : Apprentissage fédéré

  • Pour garantir la vie privée des patients tout en s'assurant de pouvoir utiliser un maximum de données probantes

  • Apprentissage décentralisé permettant d'assurer la souveraineté des centres médicaux

MEDomicsTools


Le laboratoire MEDomics UdeS vise à promouvoir l’utilisation de bonnes pratiques en science des données.


Consultez MEDomicsTools

MEDomicsTools

Ce laboratoire est une sous-branche du consortium MEDomics.


Consultez le site de MEDomics Publication principale du consortium