TRPlane Clubi kasutajad
Tehisintellekti kuumas sektoris on üks valdkond selgelt silma paistnud: Hääle tehisintellektViimase 12–18 kuu jooksul on selle valdkonna idufirmad meelitanud enneolematul hulgal investeeringuid, kusjuures väärtused on ühe aastaga kolmekordistunud. See nähtus annab märku turunõudluse kiirenemisest ja tugevast usaldusest hääle kui järgmise suure kasutajaliidese pikaajalise väärtuse suhtes.
Paradigmaatiline näide on ElevenLabsIdufirma, mis võimaldab hääli kümnetes keeltes reprodutseerida, tõusis 2024. aasta jaanuari ükssarvikupõhiselt väärtuselt väärtusele 3.3 miljardit dollarit Aasta hiljem teatas ettevõte hiljuti teisesest aktsiaemissioonist, mis kahekordistas ettevõtte väärtust 6.6 miljardit dollarit, ületades 200 miljoni dollari suuruse aastase korduva tulu (ARR) vaid 2.5 aastaga.
Kontekst: Miks häältehnoloogia praegu plahvatuslikult levib?
Tom Hulme'i, ettevõtte juhtivpartneri, sõnul GV (endine Google Ventures) praegune buum on tingitud kolme tehnoloogia ühinemisest, mis on jõudnud murdepunkti:
- Täpne hääletuvastus: Kõnest tekstiks transkriptsiooni tehnoloogia on lõpuks saavutamas inimliku täpsuse taset.
- Kontekstuaalsed õigusteaduse kraadid: Suured keelemudelid (LLM-id) mõistavad nüüd palju paremini sõnade taga olevat konteksti ja kavatsust.
- Kõikjal levinud mikrofonid: Peaaegu iga seade, mida me kasutame, telefonidest autodeni, on varustatud mikrofonidega, luues universaalse riistvaralise aluse.
„Pärast aastakümneid kestnud tehnoloogiaga kohanemist kohandub tehnoloogia lõpuks ka meiega,“ ütleb Hulme.
Hääle tehisintellekti ökosüsteem ja selle võtmeisikud
Voice AI turg areneb erinevateks tasanditeks, alates põhimudelite pakkujatest kuni niširakenduste ja riistvarani.
Hääle tehisintellekti ökosüsteem: esiletõstetud ettevõtted kihiti
| Ökosüsteemi kiht | ettevõte | Kasutusjuhtum / Eriala |
|---|---|---|
| Mudelid ja platvormid (Põhitehnoloogia) | ElevenLabs AssambleeAI | Sünteetiline kõne genereerimine (TTS) Heli transkriptsioon ja analüüs (STT) |
| Rakendused ja agendid (Vertikaalsed lahendused) | Lomani tehisintellekt Maven AGI | Restoranide telefoniagent Äriklienditoe häälagendid |
| Granola Fireflies.ai | Koosoleku assistent märkmete tegemiseks Koosoleku assistent ja transkriptsioon | |
| Riistvara ja liides (Hääl kasutajaliidesena) | Mitte midagi Neuralink | Hääle integreerimine tarbeelektroonikas Aju-arvuti liidesed |
Kasutusjuhud: klienditoest sisu loomiseni
Selles sektoris on omandamiste isu suur. Ost PlayAI osaliselt Meta juulis näitab tehnoloogiahiiglaste huvi loomulike häälte integreerimise vastu oma ökosüsteemidesse. Ettevõtete jaoks on selle tehnoloogia hankimine sageli kiirem ja odavam kui selle ettevõttes arendamine.
Klienditugi on üks aktiivsemaid lahinguvälju. Startupid nagu Lomani tehisintellekt (3.5 miljoni dollari suuruse seemnevooruga) ja Maven AGI (50 miljoni dollari suuruse B-seeriaga) loovad häälagente, mis on võimelised tegelema keerukate tellimuste, broneeringute ja päringutega, vabastades inimressurssi ja teenides tulu kaotatud kõnedest.
„Hääl ja loomulik keel kujutavad endast ülimat ligipääsetavuse häkki, demokratiseerides juurdepääsu arvutusvõimsusele kõigile, kes suudavad mõelda ja suhelda ... Häälest on saamas omamoodi universaalne kaugjuhtimispult digimaailmas,“ järeldab Hulme.
Infrastruktuuri kihil AssambleeAI pakub täiustatud API-sid, mis võimaldavad teiste rakenduste, näiteks Granola või Zoom, lisades hõlpsalt heli transkriptsiooni ja analüüsi võimalusi. API kasutamise kasv üle 250% võrreldes eelmise aastaga ja ettevõtte platvormil on üle poole miljoni arendaja, näitab see tohutut nõudlust nende põhiliste võimaluste järele.
