La caja negra de la IA: OpenAI trabaja en una herramienta para descifrar sus modelos de lenguaje

𝕏

Martes, 09 de Mayo, 2023

Por DiarioBitcoin @diariobitcoin

OpenAI, la organización de inteligencia artificial, ha desarrollado una herramienta que busca entender el funcionamiento de los modelos de lenguaje. A pesar de que el proyecto está en sus primeras etapas, ya se encuentra disponible en GitHub para que los desarrolladores puedan experimentar con él.

***

OpenAI ha lanzado nueva herramienta que busca explicar el comportamiento de sus modelos de lenguaje
La herramienta en cuestión aún está en fase de desarrollo
Esta descompone los modelos en sus “neuronas” y genera explicaciones de su funcionamiento
Pese a que aún no es completamente efectiva, investigadores creen que podría mejorar el rendimiento de los modelos

Desvelando los misterios de la IA: La nueva herramienta de OpenAI

Se suele decir que los modelos de lenguaje de gran tamaño (LLM) como ChatGPT de OpenAI son una caja negra. Incluso para los científicos de datos, a menudo resulta difícil entender por qué estos responden de la manera que lo hacen, como inventar datos de la nada.

Con el objetivo de desentrañar los misterios de los LLM, OpenAI está desarrollando una herramienta para identificar automáticamente qué partes de estos son responsables de sus diferentes comportamientos. Los ingenieros detrás de este proyecto recalcan que aún se encuentra en sus primeras etapas, pero el código para ejecutarlo ya está disponible en GitHub.

Analizando la mente de la IA: ¿Cómo funciona?

Los LLM, al igual que el cerebro, están compuestos por “neuronas”, que observan ciertos patrones en el texto para influir en lo que el modelo “dice” a continuación. La herramienta de OpenAI explota esta configuración para descomponer los modelos en sus partes individuales.

Primero, la herramienta ejecuta secuencias de texto a través del modelo que se está evaluando y espera a que una neurona específica se “active” con frecuencia. Luego, “muestra” estas neuronas altamente activas a GPT-4, el último modelo de IA de generación de texto de OpenAI, y le pide que genere una explicación.

Comprobando la precisión: ¿Son fiables las explicaciones?

Para determinar cuán precisa es la explicación, la herramienta proporciona a GPT-4 secuencias de texto y le pide que prediga, o simule, cómo se comportaría la neurona. Luego compara el comportamiento de la neurona simulada con el comportamiento de la neurona real.

“Con este método, podemos, básicamente, generar una explicación preliminar en lenguaje natural de lo que hace cada neurona y también obtener una puntuación de cuánto coincide esa explicación con el comportamiento real”, dice Jeff Wu, líder del equipo de alineamiento escalable en OpenAI.

Los investigadores lograron generar explicaciones para las 307,200 neuronas en GPT-2, las cuales han sido recopiladas en un conjunto de datos que se ha publicado junto con el código de la herramienta.

Mejorando la IA: Posibles usos futuros

Herramientas como esta podrían usarse algún día para mejorar el rendimiento de los LLM, dicen los investigadores, por ejemplo, para reducir sesgos o toxicidad. Sin embargo, reconocen que aún falta mucho para que la herramienta sea verdaderamente útil. La herramienta mostró confianza en sus explicaciones para alrededor de 1.000 de esas neuronas, una fracción pequeña del total.

Jeff Wu aclaró que el hecho de que la herramienta utilice GPT-4 es meramente “incidental” y, por el contrario, evidencia las debilidades de GPT-4 en esta área. También dijo que no fue creada con aplicaciones comerciales en mente y, en teoría, podría adaptarse para utilizar LLMs además de GPT-4.

“La mayoría de las explicaciones tienen puntuaciones bastante bajas o no explican mucho del comportamiento de la neurona real”, dice Wu. “Muchas de las neuronas, por ejemplo, se activan de una manera en la que es muy difícil decir qué está pasando, como si se activaran en cinco o seis cosas diferentes, pero no hay un patrón discernible. A veces hay un patrón discernible, pero GPT-4 no puede encontrarlo.”

Artículo de DiarioBitcoin

Imagen original de DiarioBitcoin, de uso libre, licenciada bajo Dominio Público

ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

𝕏

USDT	Tether USDt	-0,0%	$75,85 mmd
BTC	Bitcoin	1,32%	$43,29 mmd
ETH	Ethereum	1,56%	$16,63 mmd
USDC	USDC	0,0%	$13,9 mmd
XRP	XRP	3,77%	$5,2 mmd
SOL	Solana	5,26%	$4,98 mmd
FDUSD	First Digital USD	-0,09%	$3,72 mmd
DOGE	Dogecoin	4,61%	$1,59 mmd
BNB	BNB	0,73%	$1,49 mmd
SUI	Sui	3,23%	$1,2 mmd

FARTCOIN	Fartcoin	22,18%	$0,512 039
OKB	OKB	8,74%	$50,76
PEPE	Pepe	8,0%	$0,000 007
S	Sonic (prev. FTM)	6,22%	$0,504 853
PENDLE	Pendle	5,81%	$3,24
RAY	Raydium	5,54%	$1,84
STX	Stacks	5,52%	$0,608 267
SOL	Solana	5,26%	$121,01
DOGE	Dogecoin	4,61%	$0,169 715
JASMY	JasmyCoin	4,58%	$0,010 505

PI	Pi	-20,4%	$0,448 598
JTO	Jito	-6,68%	$1,83
TON	Toncoin	-5,73%	$3,31
IMX	Immutable	-4,37%	$0,438 832
CRV	Curve DAO Token	-3,69%	$0,496 111
DEXE	DeXe	-3,35%	$14,47
TIA	Celestia	-3,29%	$2,72
EOS	EOS	-3,2%	$0,806 872
IP	Story	-2,63%	$4,12
APT	Aptos	-2,45%	$4,84

La caja negra de la IA: OpenAI trabaja en una herramienta para descifrar sus modelos de lenguaje

Desvelando los misterios de la IA: La nueva herramienta de OpenAI

Analizando la mente de la IA: ¿Cómo funciona?

Comprobando la precisión: ¿Son fiables las explicaciones?

Mejorando la IA: Posibles usos futuros

Artículos Relacionados

Midjourney presenta su último modelo de IA para generar imágenes: V7

ChatGPT genera 700 millones de imágenes en una semana

OpenAI logra mayor recaudación privada en tecnología con USD $40.000 millones

Las memecoins de Studio Ghibli flotan a la superficie replicando la última moda de Internet