Tehnoloogiline:

Tellima

Häälega tehisintellekti plahvatus: idufirmad meelitavad miljardeid investeeringuid

Tehisintellekti kuumas sektoris on üks valdkond selgelt silma paistnud: Hääle tehisintellektViimase 12–18 kuu jooksul on selle valdkonna idufirmad meelitanud enneolematul hulgal investeeringuid, kusjuures väärtused on ühe aastaga kolmekordistunud. See nähtus annab märku turunõudluse kiirenemisest ja tugevast usaldusest hääle kui järgmise suure kasutajaliidese pikaajalise väärtuse suhtes.

Paradigmaatiline näide on ElevenLabsIdufirma, mis võimaldab hääli kümnetes keeltes reprodutseerida, tõusis 2024. aasta jaanuari ükssarvikupõhiselt väärtuselt väärtusele 3.3 miljardit dollarit Aasta hiljem teatas ettevõte hiljuti teisesest aktsiaemissioonist, mis kahekordistas ettevõtte väärtust 6.6 miljardit dollarit, ületades 200 miljoni dollari suuruse aastase korduva tulu (ARR) vaid 2.5 aastaga.

Kontekst: Miks häältehnoloogia praegu plahvatuslikult levib?

Tom Hulme'i, ettevõtte juhtivpartneri, sõnul GV (endine Google Ventures) praegune buum on tingitud kolme tehnoloogia ühinemisest, mis on jõudnud murdepunkti:

  • Täpne hääletuvastus: Transkriptsioonitehnoloogia (STT – kõnest tekstiks) on lõpuks saavutamas inimliku täpsuse taset.
  • Kontekstuaalsed õigusteaduse kraadid: Suured keelemudelid (LLM-id) mõistavad nüüd palju paremini sõnade taga olevat konteksti ja kavatsust.
  • Kõikjal levinud mikrofonid: Peaaegu iga seade, mida me kasutame, telefonidest autodeni, on varustatud mikrofonidega, luues universaalse riistvaralise aluse.

„Pärast aastakümneid kestnud tehnoloogiaga kohanemist kohandub tehnoloogia lõpuks ka meiega,“ ütleb Hulme.

Hääle tehisintellekti ökosüsteem ja selle võtmeisikud

Selles sektoris on omandamiste isu suur. Ost PlayAI osaliselt Meta Juulis toimunud kampaania näitab tehnoloogiahiiglaste huvi loomulike häälte integreerimise vastu oma ökosüsteemidesse. Ettevõtete jaoks on selle tehnoloogia omandamine sageli kiirem ja odavam kui selle ettevõttes arendamine. Turg on struktureerumas erinevateks kihtideks, alates põhimudelite pakkujatest kuni niširakendusteni.

Hääle tehisintellekti ökosüsteem: esiletõstetud ettevõtted kihiti

Ökosüsteemi kiht ettevõte Kasutusjuhtum / Eriala
Mudelid ja platvormid
(Põhitehnoloogia)
ElevenLabs
AssambleeAI
Sünteetiline kõne genereerimine (TTS)
Heli transkriptsioon ja analüüs (STT)
Rakendused ja agendid
(Vertikaalsed lahendused)
Lomani tehisintellekt
Maven AGI
Restoranide telefoniagent
Äriklienditoe häälagendid
Granola
Fireflies.ai
Koosoleku assistent märkmete tegemiseks
Koosoleku assistent ja transkriptsioon
Riistvara ja liides
(Hääl kasutajaliidesena)
Mitte midagi
Neuralink
Hääle integreerimine tarbeelektroonikas
Aju-arvuti liidesed

Kasutusjuhud: klienditoest sisu loomiseni

Klienditugi on üks aktiivsemaid lahinguvälju. Startupid nagu Lomani tehisintellekt (3.5 miljoni dollari suuruse seemnevooruga) ja Maven AGI (50 miljoni dollari suuruse B-seeriaga) loovad häälagente, mis on võimelised tegelema keerukate tellimuste, broneeringute ja päringutega, vabastades inimressurssi ja teenides tulu kaotatud kõnedest.

„Hääl ja loomulik keel kujutavad endast ülimat ligipääsetavuse häkki, demokratiseerides juurdepääsu arvutusvõimsusele kõigile, kes suudavad mõelda ja suhelda ... Häälest on saamas omamoodi universaalne kaugjuhtimispult digimaailmas,“ järeldab Hulme.

Infrastruktuuri kihil AssambleeAI pakub täiustatud API-sid, mis võimaldavad teiste rakenduste, näiteks Granola või Zoom, lisades hõlpsalt heli transkriptsiooni ja analüüsi võimalusi. API kasutamise kasv üle 250% võrreldes eelmise aastaga ja ettevõtte platvormil on üle poole miljoni arendaja, näitab see tohutut nõudlust nende põhiliste võimaluste järele.

spot_img

Tere tulemast saidile TRPlane.com

paigaldama
×
Luba märguanded OK Ei aitäh