01avril
L'IA française part à la chasse au coronavirus
L'intelligence artificielle s'invite dans la recherche médicale sur le Covid-19.
L'intelligence artificielle s'invite dans la recherche médicale sur le Covid-19. Premier pays touché par l'épidémie, la Chine a été l'un des tout premiers, aux côtés des Etats-Unis, à recourir à l'IA pour répondre à l'urgence scientifique (lire l'article Robots, drones, cartos, scanners… L'IA fait carburer l'armée anti-coronavirus). Avec plus de 30 études visant à développer des traitements contre le Covid-19 sur un total de 860 à travers le monde, la France est loin de faire pale figure dans cette guerre de position. Certaines structures de recherche françaises impliquées dans cette lutte font d'ailleurs elles-aussi appel à l'IA. Sans surprise, l'Institut Pasteur est de celles-là. Mais il n'est pas le seul. Egalement engagée dans la bataille, la medetech Eden-Ash, incubée par l'ESN levalloisienne Devoteam, s'oriente également vers cette solution pour accélérer le diagnostic de la maladie.
L'Institut Pasteur s'intéresse depuis déjà plusieurs années à l'apport du deep learning dans l'imagerie médicale. "Notre projet de recherche dans ce domaine concerne historiquement la cardiologie. Suite à l'émergence du SARS-CoV-2, nous avons décidé de le basculer sur l'analyse de radiographies en vue d'accélérer le pronostic des personnes développant des symptômes après avoir contractées cette souche du coronavirus", explique Christophe Zimmer, directeur de recherche en charge de l'activité Imagerie et Modélisation au sein de l'Institut Pasteur. Via la reconnaissance d'images, l'objectif est de traquer sur les radios les signes permettant de prédire l'évolution de la maladie. Un patient présente-t-il des risques de développer des syndromes de détresse respiratoire ? Faut-il l'intuber sans attendre pour éviter d'aboutir à un pronostic vital engagé ?
Pour répondre à ces questions, l'équipe du Christophe Zimmer s'adosse à des réseaux de neurones développés en Chine sur le sujet. Ces derniers ont été implémentés sur une infrastructure basée sur la même technologie que celle utilisée pour développer Imjoy.io, un plateforme web créée par l'Institut Pasteur pour démocratiser l'usage du deep learning au sein de la communauté biomédicale. "En matière d'imagerie médicale, le deep learning donne de bons résultats dans l'analyse de fonds rétiniens ou dans le diagnostic de fracture. Nous avons donc bon espoir d'aboutir à des résultats. Mais nous en sommes encore au début", prévient Christophe Zimmer.
Chez Eden-Ash, on s'est lancé dans la mise au point d'une caméra thermique corporelle en vue d'automatiser le diagnostic des personnes porteuses du virus. La medtech a été lancée par Aymen Chakhari, directeur IA et data science chez Devoteam. "L'enjeu est de détecter les zones cellulaires des poumons consommant plus d'énergie du fait de l'inflammation et qui engendrent une distribution hétérogène de la chaleur", pointe le data scientist qui est aussi interne en médecine. Pour relever ce défi, Eden-Ash a mis au point un réseau de neurones convolutifs. Elle s'est ensuite basée sur un premier data set pour entrainer son modèle : 800 images décrivant l'évolution de la répartition de la chaleur des poumons sur 24 heures, toutes étiquetées pour indiquer la présence d'une inflammation en fonction de seuils de chaleur. Des clichés qui proviennent des hôpitaux parisiens de Necker et de la Pitié-Salpêtrière.
"Nous avons eu recours au deep learning pour simuler un data set d'entrainement plus important en vue de gagner en robustesse", confie Aymen Chakhari. Rotation des cellules, réduction des zones touchées par une anomalie... "Cette technique nous a permis de passer de 800 à 8 000 points de données avec l'étiquetage adéquat", ajoute Aymen Chakhari.
Reste à savoir où trouver des données médicales fiables issues de patients du Covid-19 pour entraîner et éprouver les modèles. "Les Chinois ont certes publié leurs algorithmes sur GitHub. Mais ils n'ont pas partagé leurs data sets de cas réels", constate Christophe Zimmer. "A notre connaissance, il n'existe pas de bases de données ouvertes sur le sujet, en tous cas pas pour le moment. Quelques data sets circulent, mais ils sont de mauvaise qualité." Du coup, l'équipe du professeur Zimmer s'est tournée vers les hôpitaux français. La procédure a demandé du temps. L'Institut Pasteur a dû évidemment composer avec la réglementation sur les données personnelles de santé, très stricte en France. Sans compter la nécessité d'anonymiser ces informations. "Nous avons reçu il y a tout juste quelques jours des images Dicom de scanners CT en provenance du centre hospitalier de Poissy pour plus de 200 patients atteints du Covid-19. Leur analyse a commencé. Nous espérons obtenir des résultats préliminaires dans le courant de la semaine prochaine", précise Christophe Zimmer.
Même constat chez Eden-Ash. "Il est vrai que les data sets qui circulent ne sont pas exploitables, et les procédures françaises sur les données de santé ne permettent pas d'être réactif", reconnait Aymen Chakhari. Pour contourner le problème et se donner les moyens d'éprouver rapidement son modèle, Eden-Ash a noué un partenariat avec un hôpital tunisien. Un tour de passe-passe qui a permis à la start-up de récupérer les scanners thermiques de 24 patients du Covid-19, tous testés. Parmi eux, 14 avaient été diagnostiqués positifs, dont trois admis en réanimation. "Pour ces trois derniers patients, notre modèle a atteint un seuil de risque de plus de 90%. Les 11 autres testés positifs ont enregistré des seuils entre 50 et 70%. Quant aux 10 malades restant, ils se situent entre 0 et 10%", détaille Aymen Chakhari.