
Llama 4: la nueva generación de modelos multimodales con peso abierto redefine la inteligencia artificial. Meta presenta Scout, Maverick y Behemoth, tres modelos Llama 4 que superan a GPT-4o y Gemini 2.0 en benchmarks clave.
***
• Llama 4 Scout ofrece una ventana de contexto sin precedentes de 10 millones de tokens.
• Llama 4 Maverick destaca en razonamiento y codificación con un rendimiento sobresaliente y costo accesible.
• El modelo docente Behemoth introduce 2 billones de parámetros totales y lidera benchmarks en STEM.
Meta ha dado un paso significativo en la evolución de la inteligencia artificial con el lanzamiento de su nueva línea de modelos Llama 4, una familia diseñada desde cero para ser multimodal, abierta y altamente eficiente.
Con la presentación de Llama 4 Scout y Llama 4 Maverick, la compañía fortalece su compromiso con la innovación accesible, y anticipa una era de asistentes conversacionales más inteligentes, personalizados y escalables.
Los modelos ya se encuentran disponibles para descarga en llama.com/4 y Hugging Face, y también pueden utilizarse a través de Meta AI en WhatsApp, Messenger, Instagram Direct y en la web.
Llama 4 Scout: el caballo veloz del procesamiento a gran escala
Llama 4 Scout es un modelo con 17.000 millones de parámetros activos y 16 expertos, capaz de ejecutarse en una sola GPU NVIDIA H100 con cuantización Int4.
Su característica más revolucionaria es su ventana de contexto de 10 millones de tokens, lo que marca un récord en la industria.
Este salto permite nuevas posibilidades, como la comprensión de múltiples documentos, análisis profundos de actividad del usuario o interpretación de vastos repositorios de código fuente.
Además, gracias a su arquitectura iRoPE con capas de atención intercaladas y sin embeddings posicionales tradicionales, el modelo logra una generalización de contexto de largo alcance sin precedentes.
La capacidad de grounding visual de Scout también es destacable.
Puede alinear conceptos textuales con regiones específicas de imágenes, lo que mejora tareas como la respuesta visual precisa y el entendimiento de intenciones del usuario.
Llama 4 Maverick: rendimiento premium con eficiencia optimizada
Con la misma cantidad de parámetros activos que Scout pero una estructura interna con 128 expertos y 400.000 millones de parámetros totales, Maverick lleva el rendimiento a otro nivel.
Según Meta, supera a GPT-4o y Gemini 2.0 Flash en tareas de razonamiento, codificación e imagen, todo con una relación costo-calidad superior.
El modelo ha sido entrenado con una arquitectura Mixture-of-Experts (MoE) que alterna capas densas y especialistas, lo que reduce la latencia y el costo de inferencia al activar solo una fracción de los parámetros por token.
Su diseño permite desplegarlo eficientemente en un host con GPU H100 o utilizarlo en entornos distribuidos para mayor escalabilidad.
La postentrenamiento de Maverick incluyó una estrategia compleja: fine-tuning supervisado ligero, aprendizaje por refuerzo continuo con selección de prompts difíciles, y optimización directa de preferencias (DPO) para afinar la calidad conversacional.
Este pipeline permitió lograr un equilibrio entre capacidades multimodales, razonamiento complejo y fluidez en conversaciones.
Behemoth: la criatura titánica que enseña a los nuevos Llama
Aunque aún en fase de entrenamiento, Llama 4 Behemoth se perfila como uno de los modelos más potentes del mundo.
Se trata de un modelo con 288.000 millones de parámetros activos, 16 expertos y un total cercano a los 2 billones.
Ha sido empleado como modelo docente para entrenar Scout y Maverick, usando una técnica de codistilación que amortiza costos y maximiza la eficiencia del aprendizaje.
En pruebas con benchmarks como MATH-500 y GPQA Diamond, Behemoth supera a GPT-4.5, Claude Sonnet 3.7 y Gemini 2.0 Pro.
Meta también desarrolló nuevas infraestructuras de RL asíncrono para escalar el entrenamiento a esta magnitud, logrando una mejora de 10x en eficiencia frente a generaciones anteriores.
Transparencia, seguridad y reducción de sesgos
Meta ha subrayado su compromiso con el desarrollo responsable.
Los modelos Llama 4 integran mitigaciones en todas las fases: desde filtrado de datos en el preentrenamiento, hasta herramientas como Llama Guard y Prompt Guard para evitar salidas dañinas o manipulaciones.
Uno de los avances clave es la reducción del sesgo político.
Llama 4 rechaza menos responder a temas sociales y políticos controvertidos (pasó del 7 % en Llama 3.3 a menos del 2 %) y presenta una respuesta más equilibrada en cuanto a diferentes posturas ideológicas.
Meta también ha desarrollado GOAT, un nuevo método de red-teaming automatizado que simula ataques adversariales en conversaciones de múltiples turnos, mejorando la detección de vulnerabilidades y optimizando la seguridad del modelo.
Ecosistema Llama y visión a futuro
Este nuevo conjunto de modelos representa solo el comienzo. La compañía anunció que revelará más detalles sobre la evolución de Llama en el evento LlamaCon, el próximo 29 de abril.
Además de estar disponibles en las plataformas de Meta, Scout y Maverick podrán ser integrados por desarrolladores, empresas y organizaciones que busquen construir experiencias personalizadas con tecnología de punta.
Meta continúa apostando por el código abierto y la colaboración con actores clave del ecosistema de IA. Su lista de aliados incluye a NVIDIA, AMD, AWS, Hugging Face, Google Cloud, Microsoft Azure y muchas más.
Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.
Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.
ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.
Artículos Relacionados

Nuevos modelos de inteligencia artificial Llama 4 ya disponibles en Amazon Web Services

ChatGPT genera 700 millones de imágenes en una semana

OpenAI logra mayor recaudación privada en tecnología con USD $40.000 millones
