L’Université Bar-Ilan se tourne vers la science des données

Israël

Actualité
Israël | Sciences et technologies de l’information et de la communication : TIC, télécoms, micro-nanotechnologies, informatique
2 août 2019

L’Université Bar-Ilan a ouvert un institut spécialisé dans la science des données sur son campus de Ramat Gan, sous la supervision de Prof. Ido Dagan, directeur, et de Prof. Sharon Gannot, directeur adjoint.

Les avancées technologiques de ces 20 dernières années ont permis la démocratisation de nouveaux dispositifs de collecte des données, dont la résolution temporelle et spatiale n’a jamais été aussi fine. On estime que, dans le seul domaine du numérique, 90% des données existantes à ce jour ont été générées au cours des deux dernières années, avec un taux de collecte de 2,5 x 1030 bytes (2,5 quintillions) quotidiens. Ces avancées sont une véritable aubaine pour les scientifiques, qui peuvent ainsi investiguer des questions qui n’avaient jusqu’alors jamais été envisagées, faute de moyens. Mais toute révolution technologique amène son lot de défis. Les scientifiques ont vu leurs compétences analytiques dépassées par cet afflux massif de données, si bien que notre siècle est désormais marqué par l’émergence d’un nouveau domaine de recherche : la science des données.

Il s’agit d’une discipline qui s’appuie sur des outils mathématiques, statistiques, de « fouillage de données » (data mining en anglais), d’intelligence artificielle et de visualisation pour détecter des tendances statistiques dans un amas de chiffres. Les scientifiques spécialistes du secteur ont par exemple la capacité de détecter des préférences de consommation chez un usager des transports publics de l’agglomération de Tel Aviv par la seule analyse des jeux de corrélations entre les lignes qu’il emprunte, ses horaires de voyage et l’identité des individus qui partagent son bus tous les matins !

Voyant le potentiel du secteur, l’Université Bar-Ilan a ouvert, en 2016, le « Bar-Ilan Data Science Institute », spécialisé dans l’analyse des jeux de données complexes. L’Institut compte près de 70 scientifiques issus de 11 départements de l’Université. Parmi eux, une équipe pluridisciplinaire composée de 14 scientifiques analyse près de 5 x 1015 bytes de données dans les domaines de l’apprentissage automatique (machine learning en anglais) et de l’analyse du langage, des textes, des images et des réseaux sociaux. Les recherches sont menées sous la direction de Prof. Ido Dagan et de Prof. Sharon Gannot, directeur-adjoint.

Illust: Photo. Dispositifs, 34.5 ko, 760x240
Photo. Dispositifs expérimentaux du laboratoire pour le traitement des signaux et du langage à l’Université Bar-Ilan (crédits : http://www.eng.biu.ac.il/gannot/photo-gallery/)

Prof. Ido Dagan est titulaire d’une licence et d’un doctorat en sciences informatiques du Technion. Il a obtenu son doctorat en collaboration avec le centre de recherche d’IBM de Haïfa et s’est ensuite forgé une longue expérience dans le secteur privé avant de rejoindre le département de sciences informatiques de l’Université Bar-Ilan en tant que fondateur du laboratoire pour le Traitement du langage naturel (NPL lab). Ses recherches se concentrent sur l’extrapolation automatisée d’informations depuis des sources textuelles multiples. Il fait notamment appel à l’intelligence artificielle pour assurer le traitement sémantique d’ouvrages littéraires et en automatiser la lecture, la compréhension, la récapitulation et la vulgarisation, le but étant d’en extraire les informations essentielles en un temps record. Son équipe a récemment développé des méthodes d’analyse de tweets permettant de déceler en temps réel le sens des conversations par tweets interposés de milliers d’internautes.

Prof. Sharon Gannot a réalisé une licence au Technion de Haïfa en génie électrique, avant de rejoindre l’Université de Tel Aviv pour un master et un doctorat, eux aussi en ingénierie électrique. Il a ensuite réalisé un post-doctorat à l’université de K.U. Leuven, en Belgique. Depuis 2003, il est professeur à la faculté d’ingénierie électrique de Bar-Ilan, position pour laquelle il a reçu la distinction « Enseignant remarquable » entre 2010 et 2014 ainsi que le prix de la recherche innovante en 2018. Depuis lors, il partage son poste de professeur avec la faculté des Technologies de l’Information et du Design d’Aalborg, au Danemark. Directeur du laboratoire pour le Traitement des signaux et du langage de l’Université Bar-Ilan, ses recherches ont pour but le développement d’algorithmes d’analyse d’enregistrements audio, tout particulièrement leur nettoyage et l’identification des sources qui les composent. Ses récents travaux ont mené au développement d’une nouvelle méthode mathématique d’identification d’interlocuteurs multiples au travers de diverses fichiers audio.

Sous l’influence de ces deux chercheurs, l’Institut a développé de multiples applications dans le domaine de la médecine, des sciences sociales, des neurosciences, de la recherche environnementale, de la psychologie, des sciences humaines ou encore de l’analyse automatisée des textes de lois. Il propose de multiples coopérations scientifiques visant à accompagner les chercheurs de l’Université dans leurs analyses statistiques, leur donnant ainsi accès à des techniques analytiques de pointe, souvent en dehors de leur champ de compétences. L’Institut anime notamment des groupes de coopération scientifique dont le « News, Economics and AI » et le « BIU Learning Club », et organise chaque année le « Data Science Institute diner », dans les locaux de l’Université. Il supporte et encadre des programmes de licence et de mastère en coopération avec les départements scientifiques de l’Université Bar-Ilan, une interconnexion constante qui a notamment permis la publication par les membres de l’Institut de plus de 300 articles depuis 2016.

Son développement rapide lui a permis de bénéficier de plusieurs financements de la Fondation israélienne pour la Science (ISF) dont le dernier a été utilisé pour développer les serveurs informatiques de l’Institut en décembre 2018. L’équipe administrative a de plus récemment reçu la confirmation d’un financement annuel de 2,5 millions de shekels ( US$ 700 000) pour une période de 4 ans de la part du Comité de Planification et de Financement du Conseil pour l’Éducation Supérieure d’Israël (VATAT). L’équipe administrative espère accueillir de nouveaux étudiants en doctorat sur la base de ces fonds d’ici la fin de l’année 2019. D’autres financements sont de plus en cours de préparation dont celui de la fondation Pazy, ce qui laisse présager de nouvelles opportunités de recherche dans un avenir proche !

Sources :

  • https://www.lebigdata.fr/chiffres-big-data
  • Entretien avec l’équipe administrative du Data Science Institute
  • Ori Shapira, Hadar Ronen, Meni Adler, Yael Amsterdamer, Judit Bar-Ilan, Ido Dagan. Interactive Abstractive Summarization for Event News Tweets. Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing : System Demonstrations (EMNLP) | Copenhagen, Denmark, 2017. https://www.aclweb.org/anthology/D17-2019.
  • Andreas Brendel, Bracha Laufer-Goldshtein, Sharon Gannot, Ronen Talmon, Walter Kellermann, "Localization of an Unknown Number of Speakers in Adverse Acoustic Conditions Using Reliability Information and Diarization", Acoustics Speech and Signal Processing (ICASSP) ICASSP 2019 - 2019 IEEE International Conference on, pp. 7898-7902, 2019.

En savoir plus :

Rédactrice : Camille Bordes, doctorante à l’Université Bar-Ilan