Mistral AI Lance Large 2 : Un Nouveau Concurrent pour le Llama 3 de Meta

Mistral AI Lance Large 2 : Un Nouveau Concurrent pour le Llama 3 de Meta

Par
Adriana Montoya
4 min de lecture

Mistral AI Présente Large 2, un Modèle de Langage Révolutionnaire Bouleversant le Marché

La société française d'intelligence artificielle Mistral AI a présenté Large 2, un modèle de langage révolutionnaire qui défie directement Meta's Llama 3 en termes d'efficacité. Large 2, la version avancée du modèle de Mistral AI, excelle dans divers domaines tels que la génération de code, les mathématiques et le support multi-langage, offrant une compatibilité avec plus de 80 langages de programmation et de nombreuses langues humaines. Il propose une fenêtre de contexte de 128 000 tokens et prend en charge des langues allant du français au coréen.

En termes de bancs d'essai, Large 2 atteint un score impressionnant de 84,0 % à l'évaluation massive multi-tâche de la compréhension du langage (MMLU), établissant un nouveau record en termes de ratio performance/coût parmi les modèles open source. Il surpasse nettement les modèles tels que GPT-4o et Claude 3.5 Sonnet en tâches de codage, malgré le fait qu'il ne représente qu'un quart des paramètres par rapport à Llama 3 et ses 405 milliards.

Mistral AI a également accordé la priorité à l'amélioration des capacités de raisonnement de Large 2 et à la réduction de sa tendance à générer des informations inexactes, le rendant plus fiable et prudent dans ses réponses. Le modèle prend en charge l'appel de fonctions complexes, ce qui le rend adapté aux applications professionnelles avancées.

Large 2 est maintenant accessible via diverses plateformes, notamment Azure AI Studio et Google Vertex AI. Les poids du modèle sont disponibles au téléchargement sur HuggingFace sous une licence de recherche, tandis que l'utilisation commerciale requiert une licence distincte.

Le lancement rapide de Large 2, en réponse à Meta's Llama 3, témoigne de la concurrence croissante sur le marché des grands modèles de langage (LLM). Avec des coûts de plus en plus faibles et des dépenses de développement élevées, l'industrie subit une pression pour innover et s'étendre justifier les évaluations importantes des investisseurs.

Points Clés à Retenir

  • Mistral AI introduit Large 2, un modèle de langage plus efficace que Meta's Llama 3.
  • Large 2 prend en charge une fenêtre de contexte de 128 000 tokens et plus de 80 langages de programmation.
  • Il surpasse les concurrents comme GPT-4o et Claude 3.5 Sonnet avec moins de paramètres.
  • Large 2 améliore la raison et minimise la "prolifération" des réponses.
  • Disponible sur plusieurs plateformes, il nécessite une licence commerciale pour une utilisation commerciale.

Analyse

La sortie de Large 2 par Mistral AI intensifie la concurrence sur le marché des LLM, ayant un impact significatif sur Meta et les autres géants technologiques. Sa supériorité en termes d'efficacité et de performances pourrait potentiellement perturber les déploiements d'IA existants, en particulier dans les applications de codage et multi-langues. Les implications à court terme incluent une innovation accélérée et une fragmentation du marché, tandis qu'à long terme, une consolidation de l'industrie peut se produire, seuls les modèles les plus efficaces survivant. De plus, les instruments financiers liés aux actions d'IA peuvent connaître une volatilité. La disponibilité open source des poids de Large 2 favorise la recherche et le développement plus larges de l'IA, ce qui peut bénéficier aux start-ups et aux institutions universitaires.

Saviez-vous Que?

  • Mistral AI's Large 2:
    • Efficacité et Performance: Large 2 est un modèle de langage développé par Mistral AI qui rivalise avec Meta's Llama 3. Noté pour son efficacité supérieure, il gère plus de 80 langages de programmation avec une fenêtre de contexte de 128 000 tokens, atteint avec significativement moins de paramètres par rapport à Llama 3.
    • Résultats des Bancs d'Essai: Large 2 atteint un score de 84,0 % à l'évaluation MMLU, établissant un record en termes de ratio performance/coût pour les modèles open source. Il surpasse nettement les modèles tels que GPT-4o et Claude 3.5 Sonnet en tâches de codage.
    • Caractéristiques Améliorées: Le modèle a été affiné pour améliorer les capacités de raisonnement, réduire la génération d'informations incorrectes et prendre en charge l'appel de fonctions complexes, ce qui le rend adapté aux applications professionnelles avancées.
  • Massive Multi-task Language Understanding (MMLU):
    • Aperçu du Banc d'Essai: MMLU évalue les modèles de langage à travers une large gamme de tâches. Il est utilisé pour évaluer la capacité du modèle à comprendre et à répondre avec précision à diverses requêtes
    • Significance dans le Développement de l'IA: Atteindre un score élevé à MMLU est un jalon important, indiquant la capacité du modèle à gérer efficacement des tâches complexes et variées.
  • Fenêtre de Contexte de Tokens:
    • Définition et Importance: La fenêtre de contexte de token fait référence au nombre maximal de tokens qu'un modèle de langage peut traiter à la fois, ce qui est crucial pour les tâches nécessitant une compréhension profonde et des dépendances à long terme.
    • Impact sur les Performances du Modèle: Avec une fenêtre de contexte de token de 128 000, Large 2 peut gérer des entrées plus étendues, ce qui est essentiel pour les tâches comme la génération de code et la raison complexe.

Vous aimerez peut-être aussi

Cet article est soumis par notre utilisateur en vertu des Règles et directives de soumission de nouvelles. La photo de couverture est une œuvre d'art générée par ordinateur à des fins illustratives uniquement; ne reflète pas le contenu factuel. Si vous pensez que cet article viole les droits d'auteur, n'hésitez pas à le signaler en nous envoyant un e-mail. Votre vigilance et votre coopération sont inestimables pour nous aider à maintenir une communauté respectueuse et juridiquement conforme.

Abonnez-vous à notre bulletin d'information

Obtenez les dernières nouvelles de l'entreprise et de la technologie avec des aperçus exclusifs de nos nouvelles offres