Utilisateurs du TRPlane Club
Dans le secteur en pleine effervescence de l’intelligence artificielle, un domaine s’est clairement distingué : IA vocaleAu cours des 12 à 18 derniers mois, les startups de ce secteur ont attiré des niveaux d'investissement sans précédent, leurs valorisations ayant triplé en un an. Ce phénomène témoigne d'une accélération de la demande du marché et d'une forte confiance dans la valeur à long terme de la voix comme prochaine interface utilisateur majeure.
Un exemple paradigmatique est OnzeLabsLa startup, qui permet de reproduire des voix dans des dizaines de langues, est passée d'une valorisation de licorne en janvier 2024 à une valorisation de Milliards de 3.3 Un an plus tard, elle a récemment annoncé une offre secondaire d'actions qui doublerait sa valorisation à Milliards de 6.6, ayant dépassé les 200 millions de dollars de revenus annuels récurrents (ARR) en seulement 2.5 ans.
Contexte : Pourquoi l’IA vocale explose-t-elle actuellement ?
Selon Tom Hulme, associé directeur de GV (anciennement Google Ventures), le boom actuel est dû à la confluence de trois technologies qui ont atteint un point de basculement :
- Reconnaissance vocale précise : La technologie de transcription de la parole en texte atteint enfin des niveaux de précision comparables à ceux des humains.
- LLM contextuels : Les grands modèles linguistiques (LLM) sont désormais bien plus efficaces pour comprendre le contexte et l’intention derrière les mots.
- Microphones omniprésents : Pratiquement tous les appareils que nous utilisons, des téléphones aux voitures, sont équipés de microphones, créant ainsi une base matérielle universelle.
« Après des décennies d’adaptation à la technologie, la technologie s’adapte enfin à nous », déclare Hulme.
L'écosystème de l'IA vocale et ses acteurs clés
Le marché de l’IA vocale évolue vers différentes couches, des fournisseurs de modèles de base aux applications et matériels de niche.
L'écosystème de l'IA vocale : entreprises sélectionnées par couche
| Couche de l'écosystème | Société | Cas d'utilisation / Spécialité |
|---|---|---|
| Modèles et plateformes (Technologie fondamentale) | OnzeLabs AssembléeAI | Génération de parole synthétique (TTS) Transcription et analyse audio (STT) |
| Applications et agents (Solutions verticales) | Loman AI Maven AGI | Agent téléphonique pour restaurants Agents vocaux pour le support client professionnel |
| du granola Lucioles.ai | Assistant de réunion pour la prise de notes Assistant de réunion et transcription | |
| Matériel et interface (La voix comme interface utilisateur) | le Rien Neuralink | Intégration vocale dans l'électronique grand public Interfaces cerveau-ordinateur |
Cas d'utilisation : du support client à la création de contenu
L'appétit pour les acquisitions dans ce secteur est élevé. L'achat de Jouer à AI par Meta L'arrivée de juillet témoigne de l'intérêt des géants de la tech pour l'intégration des voix naturelles à leurs écosystèmes. Pour les entreprises, acquérir cette technologie est souvent plus rapide et moins coûteux que de la développer en interne.
Le support client est l'un des champs de bataille les plus actifs. Des startups comme Loman AI (avec un tour de table de 3.5 millions de dollars) et Maven AGI (avec une série B de 50 millions de dollars) créent des agents vocaux capables de gérer des commandes, des réservations et des demandes complexes, libérant ainsi du personnel humain et récupérant les revenus des appels perdus.
« La voix et le langage naturel représentent l’ultime astuce d’accessibilité, démocratisant l’accès à la puissance de calcul pour quiconque peut penser et communiquer… La voix devient une sorte de télécommande universelle pour le monde numérique », conclut Hulme.
Au niveau de l'infrastructure, AssembléeAI fournit des API avancées qui permettent aux développeurs d'autres applications, telles que Granola ou Zoom, ajoutant facilement des fonctionnalités de transcription et d'analyse audio. Avec une utilisation des API en croissance de plus de 250 % d'une année sur l'autre et plus d'un demi-million de développeurs sur sa plateforme, l'entreprise démontre l'énorme demande pour ces fonctionnalités fondamentales.
