Du Co-fund à EELISA : les travaux très européens des doctorants PSL en intelligence artificielle
Linnea Evanson (ENS - PSL) et Alessandro Pasqui (Collège de France & ENS - PSL) sont doctorants à l’Ծé PSL. Membres du programme doctoral du co-fund IAForTheScience, ils ont brillamment représenté l’Ծé PSL en montant sur le podium lors du organisé par l’université européenne EELISA, les 10 et 11 juin dernier, à la Budapest University of Technology and Economics (BME).
Retour sur leur expérience enrichissante à Budapest et sur l’avancée de leurs travaux de recherche au sein du programme doctoral.
Hautement sélectif, le programme doctoral Cofund IAForTheScience porté par l’Ծé PSL accueille 26 doctorants internationaux pour mener leurs thèses aux interfaces de l’intelligence artificielle ou du traitement des données massives.
Pourquoi avoir rejoint le programme Cofund IAForTheScience ?
Alessandro : "Durant les six derniers mois de mon master, je me suis consacré à la rédaction de mon mémoire portant sur les algorithmes d’intelligence artificielle appliqués à la biologie du développement. J'ai travaillé en étroite collaboration avec des chercheurs de l'Institut Italien de Technologie au CLNS (Center for Life NanoScience) à Rome, ce qui a alimenté mon désir de poursuivre un doctorat. C'est également à cette période que j'ai déposé ma candidature au prestigieux programme "AI4theSciences" de l'Ծé PSL, en parfaite adéquation avec mes compétences et mes intérêts pour l'intelligence artificielle."
Linnea : "Durant mes études à l’Imperial College London, j'ai suivi des cours de Machine Learning et de traitement d’image, tout en me formant à l'analyse d'images biologiques. Cette expérience m'a introduit au domaine de l’IA et m’a conduit à prendre une année de césure pour travailler en tant qu'Analyste en Conseil Technologique chez Accenture. J'ai pu développer des compétences en IA et en Data Science appliquées à divers domaines, du transport de bagages à l'analyse du langage dans les Tweets. De retour à l’Imperial, j'ai rédigé ma thèse de maîtrise démontrant que l'intégration d'éléments d'inspiration biologique peut améliorer les performances des réseaux neuronaux artificiels. À la suite de mon master, j’ai découvert le programme AIforTheSciences. L'idée d'utiliser l'IA pour étudier l'intelligence humaine, en particulier notre capacité de langage, m'a particulièrement enthousiasmée. La perspective de travailler sur un projet stimulant, tout en profitant de la richesse culturelle qu’offre Paris était irrésistible."
Pouvez-vous expliquer en quoi consistent vos travaux de recherche à PSL ?
Alessandro : "Ma recherche se concentre sur l'intégration de l'IA et de la physique pour développer de nouveaux algorithmes capables d'étudier des systèmes cellulaires complexes. Les tissus biologiques sont des ensembles délicats composés de nombreuses cellules en interaction, arborant des comportements collectifs sophistiqués. Ces cellules sont dynamiques : elles peuvent se déplacer, changer de voisinage, se diviser, mourir. Grâce à l'IA, j'extrais des informations physiques à partir d'images fournies par des biologistes, afin de formuler des équations pertinentes. Ces dernières permettent d'expliquer les phénomènes émergents observés lorsque les cellules interagissent pour former des tissus. La compréhension de ces interactions est cruciale pour faire avancer le domaine de la biologie du développement et la recherche médicale, notamment la médecine régénérative."
Linnea : "Mon projet de doctorat, intitulé "Language Acquisition in Brains and Algorithms", explore la représentation du langage dans le cerveau des enfants ainsi que dans les réseaux neuronaux artificiels pendant l'apprentissage. En collaboration avec un hôpital parisien, j’enregistre les réactions cérébrales d'enfants de différents âges lorsqu'ils écoutent un livre audio. Je soumets ensuite le même livre audio à un modèle d'IA pour observer si ses activations peuvent prédire celles du cerveau. À ce jour, j'ai recueilli des données auprès de plus de 50 participants, ce qui en fait la première et la plus grande étude sur le langage naturel utilisant cette méthode d'enregistrement chez les enfants.
Au cours d’un stage à Meta AI, j'ai entraîné cinquante modèles GPT-2 et examiné leur processus d'apprentissage. La comparaison entre les véritables neurones cérébraux et les neurones artificiels des modèles d'IA ouvre des perspectives nouvelles pour la communauté des neurosciences et pour celle de l'IA. Je cherche ainsi à répondre à des questions telles que : "Dans quelles zones du cerveau les enfants traitent-ils le langage ?", "Ce traitement est-il plus rapide ou plus lent que chez les adultes ?" ou encore "Les modèles d'IA apprennent-ils les structures grammaticales dans le même ordre que les enfants ?"."
Quels sont les grands défis/enjeux actuels de l’IA dans votre domaine de recherche ?
Alessandro : "L'application des algorithmes de vision artificielle à l'étude des systèmes cellulaires biologiques présente plusieurs défis, notamment l'obtention d'ensembles de données vastes et de haute qualité nécessaires pour l'apprentissage des modèles. Les contraintes économiques et temporelles, ainsi que les limitations techniques liées à l'instrumentation et à la fragilité des échantillons, limitent souvent la disponibilité de données étendues. Cela rend particulièrement difficile le développement de techniques efficaces de vision par ordinateur basées sur l'IA. Le principal défi serait ainsi de concevoir des modèles auto-supervisés qui soient suffisamment sophistiqués pour saisir les structures complexes des images, sans pour autant nécessiter de grands ensembles de données pour l'apprentissage. Il est essentiel de trouver cet équilibre pour faire avancer la recherche dans ce domaine.
Linnea : "Comparer les représentations du langage dans l'IA à celles du cerveau présente des défis importants, en raison de la différence de quantité de données d'entrée nécessaires à l’apprentissage. Alors que les humains peuvent apprendre à partir de milliers d'exemples, les systèmes d'IA nécessitent des millions de mots écrits pour atteindre une capacité similaire. De plus, la plupart des modèles de langage utilisent des données textuelles, tandis que les enfants apprennent le langage à partir de la parole, ce qui rend leurs représentations difficilement comparables. Une solution consiste à utiliser des modèles d'entrée audio auto-supervisés. Le modèle wav2vec 2.0 par exemple, peut prédire de manière impressionnante les segments manquants après seulement 53 000 heures d'entrée audio, ce qui est comparable à la quantité d'entrée qu'un enfant reçoit. Pour développer des modèles capables d'apprendre de manière aussi efficace que les humains, il est nécessaire d’explorer en profondeur les similitudes et différences entre nos modèles actuels et le cerveau humain."
Ce concours m’a offert une excellente occasion de recevoir des retours de mes pairs et d'experts sur mon travail, ainsi que de nouer des contacts avec d'autres jeunes scientifiques.
Vous avez participé le 10 et 11 juin à la compétition scientifique EELISA pour les étudiants à Budapest, en Hongrie. En quoi consiste-t-elle ? Pourquoi y avoir participé ?
Les deux doctorants décrivent le concours comme une opportunité pour les étudiants de licence, de master et de doctorat de présenter leurs projets de recherche et leurs solutions innovantes à des défis scientifiques et technologiques. Chaque participant devait soumettre un résumé de sa recherche, puis les étudiants sélectionnés fournissaient un rapport détaillé de 20 pages. La note finale reposait sur une présentation de 15 minutes et une session de questions-réponses de 5 minutes devant le jury et l’auditoire.
Alessandro : "Ce concours a été une expérience très importante au cours de la phase finale de mon doctorat. Il m’a offert une excellente occasion de recevoir des retours de mes pairs et d'experts sur mon travail, ainsi que de nouer des contacts avec d'autres jeunes scientifiques."
Linnea : "Étant donné que je vais soumettre un article sur mon projet à une revue prestigieuse, le concours était l'occasion idéale d'obtenir des retours de la part d'un panel de juges externes. Ce fut une excellente occasion de peaufiner ma présentation du projet et de réfléchir à la manière dont je pourrais présenter les détails de mon étude à un public plus large, qui n'est peut-être pas familier avec les techniques utilisées dans mon domaine."
Comment s’est déroulée la conférence ? Avez-vous une anecdote marquante à raconter ? Quelle expérience en retirez-vous ?
Alessandro : "Ce fut un honneur de gagner le premier prix dans la catégorie "Chemical and Bioengineering" lors de cette expérience professionnelle mémorable et enrichissante. Après la présentation, un collègue et moi avons relâché la pression au marché central de Budapest, où nous avons dégusté un déjeuner hongrois traditionnel. Le soir, des événements sociaux ont été organisés pour permettre aux participants de faire connaissance et d'explorer les quartiers historiques emblématiques de la ville, Buda et Pest, séparés par le Danube."
Linnea : "J’étais très heureuse de recevoir la troisième place dans la catégorie "Médecine". J'ai trouvé les étudiants internationaux sympathiques et très ouverts. Il était agréable d'apprendre des scientifiques à différents stades de leur carrière, de la première année de licence aux doctorants. Plusieurs événements sociaux ont été organisés pour aider tout le monde à se mélanger et découvrir le célèbre château de Buda, les magnifiques bâtiments du parlement et le centre ville pittoresque."
Quelle est la prochaine étape dans votre parcours professionnel ?
Alessandro : "Actuellement en troisième année de doctorat, je viens de recevoir une prolongation de mon contrat afin de finaliser tous les projets sur lesquels j'ai travaillé. Je prévois de soumettre trois articles différents à des revues, ainsi que de rédiger et de défendre ma thèse d'ici l'été prochain.”
Linnea : "Je prépare actuellement la soutenance de mon doctorat, prévue pour décembre 2024. J'ai obtenu un financement pour rester une année supplémentaire dans le même laboratoire à PSL en tant que postdoc. Il y a de nombreux projets que j'aimerais terminer et d'analyses à conclure sur l'ensemble des données que j'ai recueillies pendant mon doctorat."
Les deux doctorants confient vouloir continuer à travailler dans la recherche sur des sujets similaires, idéalement au sein du département de recherche d'une entreprise avec des accès aux ressources informatiques nécessaires à l'IA de pointe.
Mini biographie
Alessandro Pasqui -
Physicien théoricien italien spécialisé dans les algorithmes de vision par ordinateur basés sur l'IA et informés par la physique pour la biologie du développement.
2024 · Doctorant au Collège de France, CIRB (Centre pour la Recherche Interdisciplinaire en Biologie) - Ծé PSL
2021 · Master en Physique Théorique, spécialité Mécanique Statistique - Ծé Sapienza à Rome
2018 · Licence en Physique - Ծé Sapienza à Rome
Linnea Evanson -
2024 · Doctorante à l’ENS, département des Sciences Cognitives.
2022 · Césure : stage a Meta AI.
2019 · Année de césure : Technology Consulting Analyst à Accenture
2016-2021 · Licence et Master en ԲéԾ Biomédicale à l’Imperial College London
2014-2016 · Lycée en Norvège, originaire du Canada et de l’Australie