Spanish English French German Italian Portuguese
Marketing social
AccueilGrandes technologiesAlphabetOpenAI donne à ChatGPT une voix pour discuter

OpenAI donne à ChatGPT une voix pour discuter

ChatGPT évolue vers bien plus qu'un moteur de recherche textuel, avec OpenAI annoncer qui ajoute une nouvelle intelligence basée sur la voix et l’image.

Le populaire assistant d'IA générative a été l'une des plus grandes réussites technologiques de ces derniers temps depuis ses débuts il y a environ neuf mois, permettant à quiconque de générer des essais, des poèmes et des résumés à partir de simples invites textuelles. Mais désormais, ChatGPT est sur le point de devenir beaucoup plus interactif et les utilisateurs pourront également avoir une conversation vocale avec le chatbot.

Cette annonce intervient alors qu'Amazon s'est engagé à investir jusqu'à 4 milliards de dollars dans son rival d'OpenAI, Anthropic, une décision qui s'inscrit dans le cadre d'une bataille autour de l'IA générative entre les géants mondiaux de la technologie, dont Google, qui tente de rattraper son retard grâce à son chatbot Bard. , Meta adopte une forte philosophie open source pour vous aider à aller de l'avant, et Microsoft s'aligne étroitement sur OpenAI.

Phrase d'accroche

Aujourd’hui marque une évolution notable pour le mouvement de l’IA générative, avec OpenAI combinant le monde familier de assistants basés voix avec ses puissants grands modèles de langage (LLM).

Par exemple, un utilisateur vous pouvez demander verbalement à ChatGPT Inventez sur place une histoire au coucher, avec quelques signaux vocaux pour guider le récit. Ou l'utilisateur peut simplement vous poser une question et ChatGPT vous donnera la réponse sous forme orale.

Ailleurs, les utilisateurs de ChatGPT pourront également rechercher des réponses à l'aide d'images, par exemple en téléchargeant une image de quelque chose et en demandant à ChatGPT d'expliquer de quoi il s'agit ou de fournir des instructions pour atteindre un objectif.

Recherche d'images ChatGPT

Recherche d'images ChatGPT

La fonction vocale est activée par une combinaison d'un nouveau modèle de texte un discours qui peut générer des voix humaines à partir de texte et de quelques secondes d'échantillon de voix. OpenAI a déclaré s'être associé à des acteurs de la voix établis pour créer cinq voix différentes, avec son système de reconnaissance vocale Whisper de open source utilisé pour transcrire des expressions verbales en texte.

Spotify a également été présenté comme partenaire lors du lancement, le géant du streaming musical introduisant une nouvelle fonctionnalité plutôt intéressante pour les podcasteurs qui leur permet de tester leur voix et de traduire leurs émissions de l'anglais vers l'espagnol, le français ou l'allemand, tout en conservant leur propre voix originale. Cependant, il semble qu’OpenAI se garde bien de susciter des critiques, car elle ne met cette technologie à la disposition de personne ; a spécifiquement travaillé avec des podcasteurs tels que Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons et Steven Bartlett pour le lancement.

"La nouvelle technologie vocale, capable de créer des voix synthétiques réalistes à partir de quelques secondes seulement de parole réelle, ouvre les portes à de nombreuses applications créatives et axées sur l'accessibilité", a écrit la société dans un article de blog. "Cependant, ces capacités présentent également de nouveaux risques, tels que la possibilité que des acteurs malveillants se fassent passer pour des personnalités publiques ou commettent des fraudes."

Les nouvelles fonctionnalités seront bientôt déployées auprès des abonnés payants Plus et Enterprise. Pour activer les fonctionnalités vocales, les utilisateurs doivent se rendre dans le menu « paramètres » de l'application, puis « nouvelles fonctionnalités » et opter pour les conversations vocales. Ils doivent ensuite appuyer sur le bouton du casque dans le coin supérieur droit et sélectionner la voix souhaitée.

La voix sera initialement limitée aux applications ChatGPT Android et iOS dans une version bêta facultative, tandis que la recherche d'images sera disponible par défaut sur toutes les plates-formes.

 

Lien Source

S'INSCRIT

ABONNEZ-VOUS SUR TRPLANE.COM

Publier sur TRPlane.com

Si vous avez une histoire intéressante sur la transformation, l'informatique, le numérique, etc. qui peut être trouvée sur TRPlane.com, veuillez nous l'envoyer et nous la partagerons avec toute la communauté.

PLUS DE PUBLICATIONS

Activer les notifications OK Non merci