Tehisintellekt
deepl on teinud endale nime veebipõhise tekstitõlkega, mis on väidetavalt täpsem kui selliste ettevõtete nagu Google'i teenused. See ettepanek on toonud Saksa idufirma hinnangu 2.000 miljardile dollarile ja rohkem kui 100.000 XNUMX maksvale kliendile.
Kuna entusiasm AI-teenuste vastu kasvab, lisab DeepL platvormile veel ühe režiimi: heli. Kasutajad saavad kasutada DeepL Voice'i, et kuulata kellegi kõnet ühes keeles ja tõlkida see automaatselt teise keelde reaalajas.
Inglise, saksa, jaapani, korea, rootsi, hollandi, prantsuse, türgi, poola, portugali, vene, hispaania ja itaalia keel on keeled, mida DeepL saab tänapäeval "kuulata". Tõlgitud subtiitrid on saadaval kõigis 33 keeles, mida praegu toetab DeepL Translator.
Praegu ei paku DeepL Voice väljundit heli- või videofailina: teenus on suunatud otsevestlustele ja reaalajas videokonverentsidele ning seda esitatakse tekstina, mitte helina.
Esimeses neist saab teie tõlkeid seadistada nii, et need ilmuksid nutitelefonis peeglitena: näiteks asetatakse telefon koosolekulauas inimeste vahele, nii et igaüks näeb tõlgitud sõnu või järgmisena jagatud transkriptsioonina. kellelegi. Videokonverentsiteenus näeb tõlkeid subtiitritena.
See võib olla midagi, mis aja jooksul muutub, vihjas ettevõtte asutaja ja tegevjuht Jarek Kutylowski. See on DeepLi esimene häältoode, kuid tõenäoliselt ei jää see viimaseks. "Seal toimub tõlge järgmisel aastal," lisas ta.
Selle väite toetuseks on ka teisi tõendeid. Google, üks DeepLi suurimaid konkurente, on alustanud ka reaalajas tõlgitud subtiitrite lisamist oma videokonverentsiteenusesse Meet. Ja häältõlketeenuseid loovad paljud AI idufirmad, näiteks AI häälespetsialist Eleven Labs (Üksteist laborit) ja Panjaya, mis loob tõlkeid sügavate võltshäälte ja heliga sobivate videote abil.
Viimane kasutab Eleven Labsi API-d ja Kutylowski sõnul kasutab Eleven Labs oma tõlketeenuse toiteks DeepL-i tehnoloogiat.
Heliväljund ei ole ainus funktsioon, mida veel välja tuleb.
Kõnetoote jaoks pole praegu ka API-d. DeepLi põhitegevus on keskendunud B2B-le ja Kutylowski sõnul teeb ettevõte koostööd partnerite ja klientidega.
Samuti ei ole palju erinevaid integratsioone: ainus videokõnede teenus, mis toetab DeepL-i subtiitreid, on praegu Teams, mis "katab enamiku meie klientidest", ütles Kutylowski. Pole ühtegi sõna selle kohta, millal ja kas Zoom või Google Meet tulevikus DeepL Voice'i kaasavad.
DeepL-i kasutajad võivad arvata, et toode on veel kaua saadaval, muu hulgas seetõttu, et oleme üle ujutatud paljude muude tõlkimisele suunatud tehisintellekti kõneteenustega. Kutylowski ütles, et see on olnud klientide taotlus number üks alates 2017. aastast, aastast, mil DeepL käivitati.
Osa ootamise põhjusest on see, et DeepL on võtnud oma toote arendamisel üsna selge lähenemisviisi. Erinevalt paljudest teistest AI-rakenduste maailmas, mis toetuvad ja muudavad teiste ettevõtete suurte keelemudelite (LLM) mudelit, on DeepLi eesmärk luua oma teenus nullist. Juulis firma vabastatud uus tõlkimiseks optimeeritud LLM, mis tema sõnul ületab GPT-4, Google'i ja Microsofti, eriti kuna selle põhirõhk on tõlkimisel. Ettevõte on jätkanud ka oma kirjaliku toodangu ja sõnastiku kvaliteedi parandamist.
Samuti on DeepL Voice'i üks unikaalseid väärtuspakkumisi see, et see töötab reaalajas, mis on oluline, kuna paljud turul olevad tehisintellekti tõlketeenused töötavad tegelikult viivitusega, muutes nende kasutamise reaalajas kasutamise keerulisemaks või võimatuks olukordades, mida DeepL käsitleb.
Kutylowski vihjas, et see oli veel üks põhjus, miks uus kõnetöötlustoode keskendub tekstipõhistele tõlgetele, on see, et neid saab väga kiiresti arvutada ja toota, samas kui tehisintellekti töötlemisel ja arhitektuuril on veel vaja minna, enne kui nad suudavad heli toota video nii kiiresti.
Videokonverentsid ja koosolekud on tõenäoliselt DeepL Voice'i kasutusjuhtumid, kuid Kutylowski märkis, et teine suur turg, mida nad näevad, on teenindussektor, kus näiteks restoranide eesliinitöötajad saaksid teenust klientidega hõlpsamaks suhelda.
See võib olla abiks, kuid toob esile ka selle teenuse ühe raskeima punkti. Maailmas, kus me kõik oleme andmekaitsest äkitselt palju teadlikumad ja oleme mures selle pärast, kuidas uued teenused ja platvormid kasutavad privaatset või omandiõigusega kaitstud teavet, on alles näha, mil määral on inimesed huvitatud oma häälte kogumisest ja kasutamisest sel viisil.
Kutylowski nõudis, et kuigi hääled liiguvad nende serveritesse tõlkimiseks (töötlemist seadmes ei tehta), ei säilita nende süsteemid midagi ega kasuta seda oma LLM-ide koolitamiseks. Lõppkokkuvõttes teeb DeepL oma klientidega koostööd tagamaks, et nad ei riku GPRD-d ega muid andmekaitseeeskirju.
