Nous Research Dévoile les Modèles d'IA Hermes 3
Nous Research a présenté une nouvelle famille de modèles d'IA appelés Hermes 3, qui se distinguent par leur niveau de contrôle élevé et leur neutralité, les séparant des autres modèles qui peuvent avoir des restrictions éthiques. Les modèles Hermes 3 sont disponibles en trois tailles : 8, 70 et 405 milliards de paramètres, et sont basés sur Llama 3.1 de Meta. Ces modèles sont conçus pour suivre de près les commandes des utilisateurs et peuvent s'adapter à différentes visions du monde comme spécifié par les utilisateurs.
Les modèles Hermes 3 excellent dans des tâches telles que le raisonnement, la modélisation de récompenses et la génération de sorties structurées, y compris des balises XML. De plus, ils sont capables de générer des monologues internes pour une prise de décision transparente et de créer du contenu visuel comme des diagrammes Mermaid. Les modèles ont été formés via un processus en deux étapes, impliquant un réglage supervisé et une optimisation des préférences directes, utilisant près de 400 millions de tokens lors de la première phase.
Lors des tests, les modèles Hermes 3 ont bien performé, se classant parmi les meilleurs modèles open-source dans des benchmarks tels que ARC, BoolQ, HellaSwag, IFEval et Winogrande. Les modèles ont été formés sur un mélange de tâches de raisonnement et d'applications créatives, telles que le jeu de rôle et l'écriture. Ils ont également la capacité d'utiliser des outils externes et de récupérer des informations à partir de documents grâce à la Génération Augmentée par Récupération (RAG), améliorant ainsi leur capacité à fournir des réponses précises et pertinentes.
Disponibles sur Hugging Face, les modèles Hermes 3 gagnent en reconnaissance pour leur polyvalence dans une gamme d'applications, de la prise de décision en entreprise aux tâches créatives. Les experts considèrent Hermes 3 comme un acteur important dans le paysage de l'IA, reflétant une tendance plus large de l'industrie vers des modèles d'IA open-source qui offrent flexibilité et rentabilité pour les entreprises.
Points Clés
- Nous Research lance Hermes 3, une famille de modèles de langage IA basée sur Llama 3.1 de Meta.
- Les modèles Hermes 3 existent en 8, 70 et 405 milliards de paramètres, conçus pour un haut niveau de contrôle et d’alignement neutre.
- Les modèles excellent dans des tâches comme le raisonnement et la sortie structurée, atteignant des scores élevés dans des benchmarks publics.
- La formation impliquait un réglage supervisé et une optimisation des préférences directes, utilisant près de 400 millions de tokens.
- Les modèles Hermes 3 sont disponibles sur Hugging Face, prenant en charge les outils externes et la récupération d'information basée sur des documents.
Analyse
Les modèles d'IA Hermes 3 de Nous Research, basés sur Llama 3.1 de Meta, pourraient perturber les secteurs nécessitant des interactions IA précises. Leur haut niveau de contrôle et d'alignement neutre améliore les applications dans les secteurs financier, médical et juridique. La disponibilité sur Hugging Face élargit leur accessibilité, ce qui pourrait augmenter la part de marché de Nous Research. Les concurrents pourraient accélérer les innovations pour égaler les capacités d'Hermes 3. À long terme, ces modèles pourraient standardiser le comportement de l'IA, influençant le développement éthique de l'IA à l'échelle mondiale.
Le Saviez-Vous ?
- Modèles Hermes 3 :
- Explication : Hermes 3 est une série de modèles avancés de langage IA développés par Nous Research, basés sur l'architecture open-source Llama 3.1 de Meta. Ces modèles se distinguent par leur haut niveau de contrôle et de neutralité, ce qui signifie qu'ils peuvent se conformer strictement aux commandes des utilisateurs sans contraintes éthiques qui pourraient limiter d'autres modèles d'IA. Ils sont disponibles en trois tailles : 8, 70 et 405 milliards de paramètres, chacun conçu pour traiter des tâches complexes comme le raisonnement, la modélisation de récompenses et la sortie structurée utilisant des balises XML.
- Optimisation des Préférences Directes (DPO) :
- Explication : L'optimisation des préférences directes est une technique de formation utilisée dans le développement des modèles Hermes 3. Contrairement aux méthodes traditionnelles qui reposent sur l'apprentissage supervisé suivi d'un apprentissage par renforcement basé sur les retours humains, la DPO optimise directement les réponses du modèle en fonction des préférences humaines exprimées par un modèle de récompense. Cette approche simplifie le processus de formation et renforce la capacité du modèle à s'aligner sur les intentions des utilisateurs de manière plus efficace.
- Génération Augmentée par Récupération (RAG) :
- Explication : La génération augmentée par récupération est une technique qui améliore les capacités des modèles d'IA comme Hermes 3 en leur permettant d'accéder et d'utiliser des sources d'informations externes, telles que des documents ou des bases de données, lors de la génération de réponses. Cela signifie que les modèles peuvent fournir des réponses plus précises et contextuellement pertinentes en s'appuyant sur des informations pertinentes tirées de ces sources externes, augmentant ainsi leurs capacités de génération de langage naturel.