Sarvam lance un bot IA activé par la voix pour les langues indiennes

Sarvam lance un bot IA activé par la voix pour les langues indiennes

Par
Rajesh Kumar Nayak
3 min de lecture

La startup indienne d'intelligence artificielle Sarvam lance un bot AI vocal multilingue supportant plus de 10 langues indiennes

La startup indienne d'intelligence artificielle Sarvam a lancé un bot AI vocal supportant plus de 10 langues indiennes, destiné à répondre à la diversité linguistique du pays. Basée à Bengaluru, l’entreprise qui sert principalement des entreprises, a compris la préférence pour l'interaction par la voix plutôt que par le texte. Le co-fondateur Vivek Raghavan a souligné les défis liés à la saisie dans les langues indiennes et a mis en avant la commodité de l'interaction vocale.

Les agents AI proposés par Sarvam peuvent être intégrés à des plateformes comme WhatsApp et peuvent gérer des appels vocaux traditionnels, avec un tarif à partir de 1 ₹ par minute. L’entreprise a développé ses agents vocaux en utilisant un petit modèle linguistique fondamental appelé Sarvam 2B, formé sur un ensemble de données de 4 billions de jetons, tous générés de manière synthétique. Raghavan a expliqué la nécessité d'utiliser des données synthétiques en raison de la disponibilité limitée de contenu en langues indiennes sur le web.

De plus, Sarvam lance un modèle audio-linguistique nommé Shuka, basé sur son décodeur audio Saaras v1 et Meta’s Llama3-8B Instruct, qui sera en open source. En outre, la société introduit un banc d’essai AI génératif, A1, conçu pour aider les avocats dans leurs recherches réglementaires, la rédaction de documents, le masquage et l'extraction de données.

Sarvam fait partie d'un groupe restreint de startups indiennes promouvant des cas d’utilisation de l'AI en adéquation avec les intérêts du pays et soutenant les efforts du gouvernement pour développer une infrastructure AI sur mesure. Le programme IndiaAI du gouvernement inclut des initiatives comme IndiaAI Compute Capacity, visant à établir un supercalculette alimentée par au moins 10 000 GPU, et Bhashini, qui vise à démocratiser l'accès aux services numériques dans différentes langues indiennes. Raghavan a exprimé la volonté de l'entreprise de collaborer avec le gouvernement sur ces initiatives.

Points Clés

  • Sarvam AI lance un bot vocal supportant plus de 10 langues indiennes.
  • Les agents AI sont tarifés à 1 ₹ par minute, utilisables sur WhatsApp et pour des appels traditionnels.
  • Le modèle Sarvam 2B, formé sur des données synthétiques, coûte un dixième des standards de l’industrie.
  • Le modèle audio-linguistique Shuka et le banc d’essai légal A1 sont également introduits.
  • Sarvam soutient les efforts souverains de l'AI en Inde, contribuant au programme IndiaAI.

Analyse

L'introduction par Sarvam d'un bot AI vocal multilingue est prête à répondre à la diversité linguistique de l'Inde, offrant une accessibilité accrue pour les entreprises. Cette initiative pourrait potentiellement perturber le marché en proposant des solutions AI rentables à 1 ₹ par minute, impactant les concurrents et les opérateurs télécoms. L'utilisation de données synthétiques pour former les modèles réduit la dépendance à un contenu web rare, établissant un précédent pour le développement futur de l'AI dans des régions où les données sont limitées. À long terme, l'alignement de Sarvam avec les initiatives IndiaAI positionne l'entreprise pour bénéficier du soutien gouvernemental dans la construction d'une infrastructure nationale d'AI, conduisant potentiellement à une adoption plus large des technologies AI adaptées aux besoins indiens.

Le Saviez-Vous ?

  • Modèle Sarvam 2B :
    • Le Sarvam 2B, un petit modèle linguistique fondamental développé par Sarvam AI, a été spécifiquement formé sur un ensemble de 4 billions de jetons. Ces jetons sont générés synthétiquement pour répondre à la rareté du contenu en langues indiennes disponible sur le web. Ce modèle sert de base aux agents AI vocaux de Sarvam, leur permettant de comprendre et de traiter efficacement plusieurs langues indiennes.
  • Modèle Audio-Linguistique Shuka :
    • Le modèle Shuka, introduit par Sarvam AI, est conçu pour traiter et comprendre les entrées de langage parlé. Il est basé sur le décodeur audio Saaras v1 et le Llama3-8B Instruct de Meta, améliorant les capacités des agents AI de Sarvam dans le traitement des interactions vocales. L'intégration de Shuka avec le Llama3-8B Instruct de Meta, qui sera en open source, montre une approche collaborative pour faire avancer la technologie AI dans le traitement du langage.
  • Banc d'Essai AI Génératif A1 :
    • Le banc d’essai A1, un outil AI génératif spécialisé introduit par Sarvam AI, est conçu pour les professionnels du droit. Il aide avec diverses tâches telles que les recherches réglementaires, la rédaction de documents, le masquage et l'extraction de données, utilisant l'AI pour rationaliser les flux de travail juridiques. Cet outil facilite la gestion et le traitement de grandes quantités de documents et de données juridiques pour les avocats.

Vous aimerez peut-être aussi

Cet article est soumis par notre utilisateur en vertu des Règles et directives de soumission de nouvelles. La photo de couverture est une œuvre d'art générée par ordinateur à des fins illustratives uniquement; ne reflète pas le contenu factuel. Si vous pensez que cet article viole les droits d'auteur, n'hésitez pas à le signaler en nous envoyant un e-mail. Votre vigilance et votre coopération sont inestimables pour nous aider à maintenir une communauté respectueuse et juridiquement conforme.

Abonnez-vous à notre bulletin d'information

Obtenez les dernières nouvelles de l'entreprise et de la technologie avec des aperçus exclusifs de nos nouvelles offres