Intelligence Artificielle & biologie cellulaire

Actualité
Canada | Biologie : médecine, santé, pharmacie, biotechnologie
22 juin 2017

Les chercheurs de l’Université de Toronto ont développé un algorithme deep learning permettant de tracer les protéines et d’aider ainsi à identifier ce qui rend les cellules saines ou pas.

Des voitures autonomes aux ordinateurs permettant de diagnostiquer un cancer, l’intelligence artificielle (AI) façonne notre monde de façon peu prévisible, mais pour les biologistes cellulaires ce changement n’aurait pu arriver à meilleur moment. Avec des microscopes de pointes et totalement automatisés, les scientifiques collectent actuellement des masses de données bien plus rapidement qu’ils ne peuvent les analyser.

L’algorithme de suivi des protéines, Dubbed DeepLoc , peut reconnaitre les caractéristiques qu’elles forment dans la cellule de manière plus rapide que l’œil humain ou que les approches de visions artificielles précédentes.

« Nous pouvons apprendre tellement en regardant des images de cellules. A quoi les protéines ressemblent sous des conditions normales ? Ont-elles l’air différentes dans des cellules qui portent des mutations génétiques ou quand nous les exposons à des médicaments ou d’autres réactifs chimiques ? » demande Benjamin Grys, diplômé en génétique moléculaire, qui a récemment co-écrit un article sur le sujet. « Les gens ont essayé d’évaluer manuellement leurs données, mais cela prend un temps fou. »

En couverture du dernier numéro de Molecular Systems Biology , les équipes dirigées par Brenda Andrews et Charles Boone du Centre Donnelly (tous deux professeurs de génétique moléculaire à l’université de Toronto) ont aussi décrit les capacités de DeepLoc à analyser les images d’autres laboratoires, illustrant son potentiel pour une utilisation plus large.

« Actuellement, cela prend seulement quelques jours ou semaines pour obtenir des images de cellules mais des mois, voire des années, pour les analyser. Le Deep Learning permettra en fin de compte d’aligner l’échelle de temps des analyses avec celle des expériences » explique Oren Kraus, l’un des co-auteurs principaux, co-supervisé par Andrews et Brendan Frey du Centre Donnelly, professeur en génie électrique et génie informatique.

Kraus travaille maintenant avec Jimmy Ba, un étudiant diplômé du programme dispensé par le pionnier de L’IA Geoffrey Hinton, professeur émérite de l’Université de Toronto en informatique. Geoffrey Hinton est aussi Conseiller Scientifique en chef de l’Instut Vector tout récemment crée. Kraus et Ba cherche à commercialiser la méthode grâce à la création d’une nouvelle startup. Le but de la startup, nommé Phenomic AI , est d’analyser les données issues de l’analyse d’images de cellules pour des compagnies pharmaceutiques.

« Lors de l’analyse des images sur l’influence d’un médicament, vous pouvez réellement voir comment ce médicament affecte les différentes cellules en se fiant à leur images plutôt qu’a des paramètres plus simplistes comme le ratio cellules vivantes/mortes ou leur taille », explique Kraus. « De cette façon, vous pouvez extraire davantage d’informations sur l’état des cellules. Nous espérons rendre le processus de découverte de nouveaux médicaments beaucoup plus efficace en démontrant les effets les plus subtils des composés chimiques. »

Similaire à d’autres types d’IA, dans lesquels des ordinateurs apprennent à reconnaitre des motifs dans les données, DeepLoc est entrainé à reconnaitre dans la cellule les différentes formes produites par les protéines luminescentes (grâce à une étiquette fluorescente qui les rend visibles). Mais contrairement à la vision artificielle qui nécessite des instructions détaillées, DeepLoc apprend directement des données fournit par les pixels des images, le rendant plus précis et plus rapide.

Grys et Kraus ont entrainé DeepLoc sur des données déjà publiées portant sur une partie de la cellule occupée par plus de 4000 protéines de levure - ce qui représente les trois quarts des protéines présentes dans les levures. Ce jeu de données reste le plus complet et montre l’exacte position pour une majorité des protéines dans n’importe quelle cellule. Lorsque ces données ont été publiées en 2015, l’analyse avait été réalisée par vision artificielle complexe et machine learning, ce qui prit presque un mois pour être finalisée. DeepLoc le fit, lui, en quelques heures.

DeepLoc a été capable de repérer de subtiles différences entre des images similaires. L’analyse initiale a permis d’identifier 15 différentes catégories de protéines, correspondant chacune à des voisinages distincts dans la cellule. DeepLoc quant à lui a pu identifier 22 catégories. Il a été capable aussi de repérer les cellules dont la forme avait changé en raison d’un traitement hormonal, tâche que l’analyse précédente n’avait pu accomplir.

Grys et Kraus ont pu « entrainer » rapidement DeepLoc avec des images qui différaient du set d’entrainement originel, montrant ainsi qu’il pouvait être utilisé pour étudier des données d’autres laboratoires. Ils espèrent ainsi que d’autre domaines – ou analyser des images visuellement est encore la norme – adopteront leur méthode.

« Quelqu’un avec de l’expérience en codage pourrait utiliser notre méthode, » explique Grys. « Tout ce qu’il y aurait à prévoir serait d’alimenter le set d’images d’entrainement que nous avons utilisé avec leurs propres données. Cela prend seulement une heure (voire moins) pour reconfigurer DeepLoc et commencer l’analyse. »

En savoir plus :
Molecular Systems Biology : Automated analysis of high-content microscopy data with deep learning
Molecular Systems Biology, 2017 ; 13, 924, doi : 10.15252/msb.20177551

Source :
Nouvelles de l’Université de Toronto– 03 Mai 2017

Rédacteur :
Morgane SEITÉ - Chargée de Mission pour la Science et la Technologie à Toronto – morgane.seite[a]diplomatie.gouv.fr