Hugging Face a récemment lancé un projet de recherche en intelligence artificielle open source baptisé “Open Deep Research”, développé en seulement 24 heures après l’introduction par OpenAI de sa fonctionnalité Deep Research. Ce nouvel agent de recherche a pour but d’égaler les performances de Deep Research tout en rendant la technologie accessible gratuitement aux développeurs.
Dans son annonce, Hugging Face souligne que bien que des modèles de langage puissants soient désormais disponibles en open source, OpenAI n’a pas divulgué d’informations détaillées sur le cadre agentique sous-jacent de son projet. Pour cette raison, l’équipe de Hugging Face a décidé de mener une mission de reproduction des résultats d’OpenAI, tout en open-sourçant le cadre nécessaire.
Le projet Open Deep Research intègre un cadre “agent” à un modèle AI existant, permettant ainsi à l’IA d’accomplir des tâches en plusieurs étapes, telles que la collecte d’informations et la rédaction de rapports. En seulement un jour de développement, le projet a atteint une précision de 55,15 % sur le benchmark General AI Assistants (GAIA), qui évalue la capacité d’un modèle AI à rassembler et synthétiser des informations. En comparaison, OpenAI’s Deep Research a enregistré un score de 67,36 % sur le même benchmark.
Les questions posées dans le GAIA, comme celle qui demande d’identifier des fruits spécifiques d’une peinture tout en les classant dans un ordre précis, mettent à l’épreuve la capacité des agents AI à traiter des informations provenant de sources diverses. Ces défis sont complexes, même pour un humain, ce qui souligne l’efficacité des systèmes agentiques d’IA.
Pour le moment, Open Deep Research utilise les modèles de langage d’OpenAI via une API, mais il peut également être adapté à des modèles AI à poids ouverts. La nouveauté réside dans la structure agentique qui permet à un modèle de langage d’accomplir des tâches de recherche de manière autonome.
Aymeric Roucher, responsable du projet Open Deep Research chez Hugging Face, a précisé que bien qu’ils aient utilisé un modèle à poids fermés pour sa performance, le code et le processus de développement sont entièrement transparents. La possibilité de passer à des modèles ouverts est également envisagée pour renforcer la flexibilité du projet.
Bien que le projet ne parvienne pas encore à égaler les performances d’OpenAI, son lancement offre aux développeurs un accès gratuit pour étudier et modifier cette technologie. Cette initiative démontre la capacité de la communauté de recherche à reproduire rapidement et à partager ouvertement des compétences en IA auparavant réservées à des fournisseurs commerciaux.
Roucher a également mentionné que des améliorations futures pourraient inclure un support pour des formats de fichiers supplémentaires et des capacités de navigation web basées sur la vision. Hugging Face travaille déjà sur la reproduction d’OpenAI’s Operator, qui permet d’effectuer d’autres types de tâches, comme la visualisation d’écrans d’ordinateur ou le contrôle des entrées souris et clavier dans un environnement de navigateur.
Le code du projet a été rendu public sur GitHub, et Hugging Face a ouvert des postes pour des ingénieurs afin d’élargir les capacités du projet. Roucher a déclaré que les retours de la communauté étaient très positifs, avec de nombreux nouveaux contributeurs proposant des ajouts. “C’est comme surfer sur une vague, la communauté apporte une force incroyable !”