Google "Projet Jarvis" : Automatisation de Chrome pour les Consommateurs
Aperçu du Projet
Le dernier projet AI de Google, surnommé "Projet Jarvis", vise à redéfinir la manière dont les consommateurs interagissent avec les navigateurs web. Spécialement conçu pour Chrome, le Projet Jarvis est destiné à contrôler de manière autonome le navigateur, lui permettant d'effectuer des tâches en ligne courantes sans l'intervention de l'utilisateur. Prévu pour être dévoilé avec le nouveau modèle de langage Gemini de Google en décembre, le Projet Jarvis représente l'engagement de Google à apporter une automatisation sophistiquée aux consommateurs du quotidien.
Comment Cela Fonctionne
La technologie derrière le Projet Jarvis s'appuie sur la reconnaissance visuelle. En analysant des captures d'écran de la fenêtre du navigateur Chrome, l'AI exécute de manière autonome des tâches comme cliquer sur des boutons, remplir des formulaires ou taper du texte. Cette automatisation cible une large gamme d'activités web, notamment :
- Effectuer des recherches en ligne
- Faire des achats
- Réserver des vols
- Gérer d'autres tâches web quotidiennes
Cependant, le système d'AI présente certaines limites. Par exemple, chaque action peut prendre plusieurs secondes à traiter car Jarvis a besoin d'un intervalle de "réflexion" pour évaluer le prochain mouvement. De plus, des préoccupations existent concernant la gestion des données sensibles, telles que les mots de passe et les détails des cartes de crédit, qui pourraient poser des risques si elles ne sont pas gérées avec précaution.
Contexte Stratégique
Il est intéressant de noter que le Projet Jarvis est vu comme une partie d'un changement plus large dans la stratégie d'AI. Alors que les modèles de langage atteignent un plateau de capacités, des entreprises majeures comme Google cherchent des moyens innovants de montrer l'utilité pratique de l'AI. Jarvis fournit une telle avenue, transformant Chrome en une plateforme assistée par AI pour le confort quotidien. Bien que le nom "Jarvis" ait circulé au sein des discussions stratégiques de Google auparavant, l'ancien stratège UX Scott Jenson l'a critiqué comme une stratégie défensive pour garder les utilisateurs au sein de l'écosystème de Google plutôt qu'un mouvement audacieux vers l'avant.
Automatisation d'Anthropic : Une Portée plus Large au-delà de Chrome
Accès et Fonctionnalités du Système Plus Large
Alors que le Projet Jarvis de Google se concentre exclusivement sur l'automatisation web, Anthropic adopte une approche plus large avec ses solutions d'automatisation. Au lieu de restreindre son système aux navigateurs web, l'automatisation d'Anthropic est conçue pour contrôler une variété d'applications. Cela inclut des outils de productivité, des logiciels de niveau système et potentiellement d'autres environnements plus avancés.
Anthropic cible les utilisateurs qui nécessitent une assistance polyvalente et multi-plateformes, tels que les développeurs, les employés de bureau et les clients d'entreprises, en soutenant une large gamme de cas d'utilisation, de la programmation à la gestion de documents. Contrairement au Projet Jarvis, qui cherche à aider les consommateurs avec des recherches en ligne et des achats, l'accent d'Anthropic est mis sur les tâches techniques et professionnelles, telles que :
- Écrire et exécuter du code directement dans des environnements de développement intégrés (EDI)
- Gérer des tableurs et interagir avec des outils de gestion de projets
- Gérer des flux de travail complexes, tels que le traitement de données ou la gestion de documents
Méthodologie et Sécurité
Le système d'Anthropic combine diverses méthodes, y compris l'automatisation par ligne de commande, des intégrations API, et de l'automatisation par interface utilisateur graphique (IUG), lui permettant d'interagir en profondeur avec différents environnements logiciels. Il prend la vie privée et la sécurité au sérieux, surtout compte tenu de son niveau d'accès au système, qui pourrait exposer des données sensibles. Cela rend essentiel le traitement sécurisé d'informations comme les mots de passe et les détails financiers.
Limitations Actuelles
Malgré ses forces, le système d'Anthropic fait toujours face à des problèmes de latence, en particulier lors du traitement de commandes complexes entre plusieurs applications. Plus la gamme de tâches est large, plus la variabilité dans la réactivité est présente, rendant certains flux de travail plus lents selon le niveau d'interaction requis. Néanmoins, Anthropic vise à tirer parti de ces capacités pour montrer l'utilité réelle de l'AI au-delà des interfaces conversationnelles.
Lutte des Startups alors que les Grandes Entreprises Entrent dans l'Arène
L'entrée de Google et d'Anthropic dans le domaine de l'automatisation des bureaux et des navigateurs met une pression immense sur les startups émergentes qui avaient pionnier des outils d'automatisation agentique alimentés par l'AI. Ci-dessous, nous examinons certaines des startups les plus notables de 2024 qui se sont concentrées sur l'automatisation de bureaux et agentique avec des MLA.
1. Adept AI
Adept AI a fait sensation dans le domaine de l'AI en assurant 350 millions de dollars de financement et en démontrant son agent AI phare, ACT-1, qui contrôle de manière autonome diverses applications logicielles. Malgré la hype, Adept n'a pas encore lancé de produit fonctionnel pour le public. Son objectif reste de perfectionner des technologies comme le modèle Fuyu-Heavy et le langage de flux de travail Adept (AWL), mais ces efforts n'ont pas encore abouti à un produit concret pour les consommateurs ou les entreprises.
2. SuperAGI
SuperAGI propose un cadre open-source pour construire des agents autonomes capables d'exécuter une variété d'interactions logicielles, y compris le raisonnement et l'engagement visuel. La nature open-source de SuperAGI permet aux entreprises d'adapter ces agents à leurs besoins spécifiques, mais l'évolutivité et la concurrence des plateformes plus grandes présentent des défis significatifs.
3. Lindy.ai
Se positionnant comme une plateforme pour des "employés AI", Lindy.ai vise à gérer de manière autonome des tâches de bureau déclenchées par des e-mails ou des événements de calendrier. Les agents de Lindy, appelés "Lindies", peuvent travailler ensemble pour gérer des flux de travail complexes, mais la plateforme fait face à des défis pour faire évoluer ces agents afin de répondre aux normes établies par les offres de Google et d'Anthropic.
Le Changement : Les Startups Trouvent Peu d'Espace dans un Marché Dominé par les Géants Technologiques
Le marché de l'automatisation alimentée par l'AI a changé de manière spectaculaire avec l'entrée de Google et d'Anthropic. Voici les principaux défis auxquels les startups font face alors qu'elles essaient de rivaliser :
1. Domination du Marché et Lacunes de Financement
Google et Anthropic, dotés de financement massive et de ressources, peuvent développer et déployer des capacités d'automatisation complexes et lourdes en infrastructures à une échelle que les startups ne peuvent égaler. L'accent mis sur les cycles de développement rapides et le soutien à l'infrastructure rend presque impossible pour les startups de rivaliser en termes d'évolutivité, de sécurité et de rapidité.
2. Supériorité Technique et Sécuritaire
Les grandes entreprises respectent déjà des protocoles stricts de sécurité et de confidentialité — un avantage significatif lors de la manipulation de données sensibles par le biais de l'automatisation AI. Leurs solutions sont intrinsèquement plus attrayantes pour les entreprises qui nécessitent conformité et sécurité robuste, fixant une barre haute que les petites startups peinent à atteindre.
3. Vitesse de Développement de Produit
Les startups ont traditionnellement revendiqué l'agilité comme un atout concurrent, mais cela s'est largement érodé. Les grandes entreprises technologiques accélèrent leurs cycles de publication d'AI, tirant parti de partenariats stratégiques et d'acquisitions pour rapidement mettre de nouvelles fonctionnalités sur le marché. Alors que les startups peinent à passer les phases de prototypage, des entreprises comme Google et Anthropic livrent des solutions matures et prêtes à l'emploi.
4. Défis de Confiance et de Différenciation
Pour les startups, gagner la confiance des utilisateurs est un obstacle majeur, particulièrement dans un climat où les grands acteurs livrent des solutions fiables. Les investisseurs et les consommateurs sont de plus en plus sceptiques à l'égard des petites entreprises perçues comme ayant une valeur spéculative sans un produit clair et réalisable. Beaucoup de startups n'ont pas encore su définir une proposition de valeur unique qui ne soit pas déjà couverte par les offres plus larges et plus capables de sociétés comme Google et Anthropic.
L'Avenir de l'Automatisation Alimentée par l'AI : Géants contre Startups
L'arrivée de Google et d'Anthropic dans l'espace d'automatisation des navigateurs et des bureaux AI signale un nouveau chapitre—celui où les grandes entreprises technologiques dominent de plus en plus, laissant peu de place pour les petites startups. À moins que ces startups ne parviennent à pivoter pour répondre à des besoins très spécialisés ou à établir des partenariats uniques et défendables, leur chemin vers la survie sur ce marché saturé semble étroit. Le Projet Jarvis de Google, ciblant des tâches de consommation, et la solution d'automatisation expansive et conviviale pour les entreprises d'Anthropic montrent ensemble l'évolution rapide de l'AI, passant des capacités conversationnelles à des capacités intégrées et systémiques. L'avenir semble clairement favoriser les grandes entreprises dans le domaine de l'automatisation, redéfinissant potentiellement la manière dont les utilisateurs interagissent avec les outils numériques pour les années à venir.