Google Annonce des Mises à Jour de Vertex AI Cloud : Gemini 1.5 et Images 3

Google Annonce des Mises à Jour de Vertex AI Cloud : Gemini 1.5 et Images 3

Par
Zhang Wei-Lin
3 min de lecture

Google Présente de Nouvelles Fonctionnalités dans Vertex AI Cloud

Google a lancé de nouvelles fonctionnalités dans son Vertex AI Cloud, avec les modèles Gemini 1.5 Flash et Imagen 3. Le Gemini 1.5 Flash propose une fenêtre de contexte de 1 million de tokens, adaptée aux tâches telles que les chatbots de vente au détail et le traitement des documents. Parallèlement, sa version Pro prend en charge une fenêtre de contexte de 2 millions de tokens, spécifiquement conçue pour des tâches complexes impliquant de grands jeux de données, mais peut rencontrer des problèmes de « perdu au milieu »*. L'Imagen 3, le dernier modèle de génération d'images de Google, promet d'être 40 % plus rapide que son prédécesseur, avec une amélioration de l'observation des invites, malgré un léger écart de qualité par rapport aux modèles de premier plan tels qu'Ideogram et Midjourney. Google a également enrichi Vertex AI de modèles tiers supplémentaires, de capacités de mise en cache de contexte pour réduire les coûts et d'une amélioration de l'ancrage des données AI. En outre, l'introduction de Gemma 2 en tant que modèle open-source robuste fait partie des avancées de Google.

Points Clés à retenir

  • Google lance Imagen 3, un modèle de génération d'images 40 % plus rapide que son prédécesseur.
  • Gemini 1.5 Flash propose une fenêtre de contexte de 1 million de tokens pour diverses applications d'IA.
  • Gemini 1.5 Pro prend en charge jusqu'à 2 millions de tokens, idéal pour l'analyse multimodale.
  • Les images Imagen 3 sont étiquetées avec SynthID de Deepmind pour une identification.
  • Google élargit Vertex AI avec des modèles tiers et open-source, ce qui réduit les coûts et améliore la fiabilité de l'IA.

Analyse

Les récentes mises à jour de Vertex AI de Google, en particulier Gemini 1.5 et Imagen 3, ont considérablement renforcé les capacités de l'IA, touchant des secteurs tels que la vente au détail et la technologie. Les fenêtres de contexte améliorées des modèles Gemini sont sur le point de rationaliser le traitement des données, tandis que la vitesse et l'étiquetage de SynthID de Imagen 3 promettent d'améliorer la gestion des images générées par AI. Ces avancées sont susceptibles d'exercer une pression sur les concurrents tels qu'Ideogram et Midjourney pour innover. À long terme, l'intégration de Google de modèles tiers et des mesures d'économie de coûts pourrait potentiellement redéfinir les normes de service de cloud AI et influencer les dynamiques mondiales de la technologie, en changeant peut-être la donne dans le leadership du marché des technologies d'IA.

Saviez-vous que?

  • Gemini 1.5 Flash et Pro :
    • Gemini 1.5 Flash : Ce modèle propose une fenêtre de contexte de 1 million de tokens, une augmentation significative par rapport à ses prédécesseurs, le rendant idéal pour les tâches nécessitant une compréhension étendue du texte, telles que les chatbots de vente au détail et le traitement des documents.
    • Gemini 1.5 Pro : Avec une fenêtre de contexte de 2 millions de tokens, cette version est conçue pour gérer des tâches complexes impliquant de grands jeux de données, bien qu'elle puisse rencontrer des problèmes de « perdu au milieu », qui peuvent être dus à des limitations de traitement des séquences d'informations longues.
  • Imagen 3 :
    • Imagen 3 : Le dernier modèle de génération d'images de Google, qui est 40 % plus rapide que son prédécesseur et montre des améliorations dans l'observation des invites données par les utilisateurs, bien qu'il accuse un certain retard en termes de qualité par rapport aux modèles de premier plan tels qu'Ideogram et Midjourney. Ce modèle vise à améliorer les capacités de génération d'images AI efficaces et précises de Google en réponse aux entrées des utilisateurs.
  • Deepmind's SynthID :
    • SynthID : Une technologie développée par Deepmind, utilisée pour étiqueter les images générées par des modèles tels qu'Imagen 3, permettant leur identification et éventuellement leur suivi pour des raisons éthiques et juridiques.

* « Perdu au milieu » (lost in the middle) fait référence à un problème potentiel dans le traitement des séquences d'informations longues où certaines données peuvent être mal interprétées ou ignorées en raison des limitations de traitement.

Vous aimerez peut-être aussi

Cet article est soumis par notre utilisateur en vertu des Règles et directives de soumission de nouvelles. La photo de couverture est une œuvre d'art générée par ordinateur à des fins illustratives uniquement; ne reflète pas le contenu factuel. Si vous pensez que cet article viole les droits d'auteur, n'hésitez pas à le signaler en nous envoyant un e-mail. Votre vigilance et votre coopération sont inestimables pour nous aider à maintenir une communauté respectueuse et juridiquement conforme.

Abonnez-vous à notre bulletin d'information

Obtenez les dernières nouvelles de l'entreprise et de la technologie avec des aperçus exclusifs de nos nouvelles offres