OpenAI lanza versión alfa del nuevo modo de voz avanzado para ChatGPT

𝕏

Martes, 30 de Julio, 2024

Por Angel Di Matteo @shadowargel

De momento, solo tendrán acceso al nuevo modo de voz un grupo selecto de usuarios de ChatGPT Plus, y se espera que esté disponible para todos los de la suscripción en los próximos meses. El reconocimiento de imágenes y otras funciones de GPT-4o se lanzarán más adelante.

***

Usuarios de ChatGPT Plus podrán probar la versión alfa del modo de voz
De momento estará disponible para un pequeño grupo de usuarios
La idea es que llegue a los usuarios Plus en los próximos meses
Funciones adicionales como reconocimiento de imágenes y otras propiedades vendrán más adelante

OpenAI, la empresa desarrolladora del popular bot de inteligencia artificial ChatGPT, anunció que un grupo selecto de usuarios ya están poniendo a prueba el nuevo modo de voz avanzado integrado al chatbot, con el cual pueden mantener conversaciones fluidas y hacer solicitudes según sus necesidades.

La información vino a lugar en un conjunto de tweets publicados por OpenAI en su cuenta oficial de X, donde informó que esta nueva función está disponible de momento para un selecto grupo de usuarios de ChatGPT Plus, y detalla:

El modo de voz avanzado ofrece conversaciones más naturales en tiempo real, le permite interrumpir en cualquier momento y detecta y responde a sus emociones.

We’re starting to roll out advanced Voice Mode to a small group of ChatGPT Plus users. Advanced Voice Mode offers more natural, real-time conversations, allows you to interrupt anytime, and senses and responds to your emotions. pic.twitter.com/64O94EhhXK

— OpenAI (@OpenAI) July 30, 2024

En otro mensaje, el equipo de OpenAI informó que notificarán a los participantes de esta versión alfa enviándoles un correo electrónico con instrucciones. También indicaron que próximamente esta propiedad llegará a más usuarios, hasta abarcar a todas las personas que tengan la versión Plus a más tardar en los próximos meses.

Sobre la función de voz, indican que esta ha mejorado mucho tras el trabajo realizado en los últimos meses, y agregan:

Probamos las capacidades de voz de GPT-4o con más de 100 miembros externos del equipo rojo en 45 idiomas. Para proteger la privacidad de las personas, hemos entrenado al modelo para que solo hable con las cuatro voces preestablecidas y hemos creado sistemas para bloquear las salidas que difieren de esas voces. También hemos implementado barreras de protección para bloquear solicitudes de contenido violento o protegido por derechos de autor.

Nuevas funciones con GPT-4o

La nueva función de voz para ChatGPT se mostró oficialmente por primera vez a mediados de mayo, esto en una presentación en vivo realizada por los miembros de OpenAI. Allí conversaron directamente por voz con el chatbot, el cual respondió a todas las solicitudes, sirviendo incluso de intérprete para traducir conversaciones entre personas en distintos idiomas.

Además de mostrar las funciones de voz, OpenAI también informó en ese momento que ChatGPT incorporaría la posibilidad de interpretar imágenes mostradas en cámara y/o archivos, así como otras propiedades vinculadas a su nuevo modelo GPT-4o.

Con respecto a las propiedades antes mencionadas, el equipo detalló que de momento solo se habilitarán las funciones de voz, pero que las otras restantes se lanzarán más adelante.

Volviendo con la versión alfa de las funciones de voz, el equipo detalló que emplearán los datos derivados de las pruebas para mejorar la experiencia y pulir más detalles. en los próximos días compartirán un informe detallado “sobre las capacidades, limitaciones y evaluaciones de seguridad de GPT-4o”.

Artículo de Angel Di Matteo / DiarioBitcoin

Imagen de DiarioBitcoin, de libre uso, bajo licencia de dominio público

ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

𝕏

USDT	Tether USDt	-0,0%	$100,61 mmd
BTC	Bitcoin	-0,85%	$53,25 mmd
ETH	Ethereum	-1,86%	$23,43 mmd
USDC	USDC	-0,01%	$16,89 mmd
FDUSD	First Digital USD	-0,65%	$7,7 mmd
XRP	XRP	-0,88%	$6,85 mmd
SOL	Solana	-3,88%	$6,21 mmd
BNB	BNB	1,86%	$2,0 mmd
DOGE	Dogecoin	-1,53%	$1,8 mmd
SUI	Sui	1,81%	$1,55 mmd

IP	Story	7,0%	$4,44
EOS	EOS	4,92%	$0,811 585
KAIA	Kaia	4,0%	$0,106 471
ATOM	Cosmos	3,71%	$4,45
LTC	Litecoin	2,51%	$83,67
OM	MANTRA	2,34%	$6,31
ONDO	Ondo	2,11%	$0,810 986
RAY	Raydium	2,07%	$1,82
CRV	Curve DAO Token	2,04%	$0,526 675
BNB	BNB	1,86%	$608,84

CRO	Cronos	-9,23%	$0,096 54
JTO	Jito	-7,43%	$2,06
TRUMP	OFFICIAL TRUMP	-7,41%	$9,37
BONK	Bonk	-6,5%	$0,000 011
PI	Pi	-6,47%	$0,647 798
ENA	Ethena	-6,03%	$0,331 775
IMX	Immutable	-5,44%	$0,477 597
HYPE	Hyperliquid	-5,29%	$12,33
ZEC	Zcash	-4,67%	$38,84
TON	Toncoin	-4,53%	$3,79

OpenAI lanza versión alfa del nuevo modo de voz avanzado para ChatGPT

Nuevas funciones con GPT-4o

Artículos Relacionados

ChatGPT imagina su cuerpo real: estética, ética y colaboración con humanos

OpenAI logra mayor recaudación privada en tecnología con USD $40.000 millones

Las memecoins de Studio Ghibli flotan a la superficie replicando la última moda de Internet

DTCC lanzará plataforma para gestión de colaterales tokenizados en tiempo real