Spanish English French German Italian Portuguese
marketing social
Iníciograndes tecnologiasAlfabetoOpenAI dá ao ChatGPT uma voz para conversar

OpenAI dá ao ChatGPT uma voz para conversar

ChatGPT está evoluindo para muito mais do que um mecanismo de busca baseado em texto, com OpenAI anunciando que está adicionando nova inteligência baseada em voz e imagem.

O popular assistente generativo de IA tem sido uma das maiores histórias de sucesso tecnológico dos últimos tempos desde a sua estreia, há cerca de nove meses, permitindo a qualquer pessoa gerar ensaios, poemas e resumos a partir de simples instruções baseadas em texto. Mas agora, o ChatGPT está prestes a se tornar muito mais interativo e os usuários também poderão conversar por voz com o chatbot.

O anúncio ocorre no momento em que a Amazon se compromete a investir até US$ 4 bilhões na rival OpenAI, Anthropic, um movimento que faz parte de uma batalha pela IA generativa entre os gigantes da tecnologia mundiais, que inclui o Google, que está tentando recuperar o atraso por meio de seu chatbot Bard. , Meta adota um forte espírito de código aberto para ajudá-lo a progredir, e a Microsoft se alinha estreitamente com OpenAI.

Iniciador de conversa

Hoje marca uma evolução notável para o movimento de IA generativa, com OpenAI combinando o mundo familiar de assistentes baseados voz com seus poderosos modelos de linguagem grande (LLM).

Por exemplo, um usuário você pode perguntar verbalmente ao ChatGPT Invente uma história para dormir na hora, com algumas dicas vocais para orientar a narrativa. Ou o usuário pode simplesmente fazer uma pergunta e o ChatGPT lhe dará a resposta falada.

Em outros lugares, os usuários do ChatGPT também poderão buscar respostas usando imagens, por exemplo, enviando uma imagem de algo e pedindo ao ChatGPT que explique o que é ou forneça instruções para completar um objetivo.

Pesquisa de imagens ChatGPT

Pesquisa de imagens ChatGPT

A função de voz é habilitada por uma combinação de um novo modelo de texto um discurso que pode gerar vozes humanas a partir de texto e alguns segundos de amostra de voz. A OpenAI disse que fez parceria com dubladores consagrados para criar cinco vozes diferentes, com seu sistema de reconhecimento de voz Whisper da de código aberto usado para transcrever expressões verbais em texto.

Spotify também foi apresentado como parceiro no lançamento, com a gigante do streaming de música introduzindo um novo recurso bastante interessante para podcasters que lhes permite testar sua voz e traduzir seus programas do inglês para o espanhol, francês ou alemão, mantendo sua voz original. Porém, parece que a OpenAI está tomando cuidado para não atrair críticas, pois não disponibiliza essa tecnologia para ninguém; trabalhou especificamente com podcasters como Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons e Steven Bartlett para o lançamento.

“A nova tecnologia de voz, capaz de criar vozes sintéticas realistas a partir de apenas alguns segundos de fala real, abre as portas para muitas aplicações criativas e focadas na acessibilidade”, escreveu a empresa em um blog. “No entanto, estas capacidades também apresentam novos riscos, tais como a possibilidade de agentes maliciosos se passarem por figuras públicas ou cometerem fraude”.

Os novos recursos começarão a ser implementados para assinantes Plus e Enterprise em breve. Para ativar os recursos de voz, os usuários devem acessar o menu “configurações” do aplicativo, depois “novos recursos” e optar por conversas por voz. Eles devem então tocar no botão do fone de ouvido no canto superior direito e selecionar a voz desejada.

A voz será inicialmente limitada aos aplicativos ChatGPT para Android e iOS em uma versão beta opcional, enquanto a pesquisa de imagens chegará a todas as plataformas por padrão.

 

Link Fonte

RELACIONADO

INSCREVA-SE NO TRPLANE.COM

Publicar no TRPlane.com

Se você tiver alguma história interessante sobre transformação, TI, digital, etc. com um lugar no TRPlane.com, envie para nós e compartilharemos com toda a Comunidade.

MAIS PUBLICAÇÕES

Ativar notificações OK Sem gracias