Por Hannah Pérez  

Gemini, que viene en tres tamaños Nano, Pro y Ultra, se promociona como el modelo de inteligencia artificial “más capaz”, por encima que ChatGPT en varios aspectos. 

***

  • Gemini: El último modelo de IA de Google ya está aquí, listo para destronar a ChatGPT
  • Google lo promociona como su “modelo de IA más capaz” que afectará a todos sus productos
  • Gemini viene en tres tamaños o versiones: Nano, Pro y Ultra, siendo este el más avanzado

La competencia en torno a la inteligencia artificial (IA) se está intensificando ahora que la gigante de búsquedas Google ha lanzado oficialmente su muy esperado modelo, Gemini.

Gemini, el último gran modelo de lenguaje grande (LLM) de Google que la compañía describe como “nuestro modelo de IA más capaz“,  ya está oficialmente aquí. Se pone en marcha en tres formatos: Nano, para tareas específicas y dispositivos móviles; Pro, que se adapta a un rango amplio de tareas y usos; y Ultra, la versión más grande y capaz.

Similar a otros de su tipo, el nuevo modelo de IA de Google puede trabajar con texto, imágenes y video. Pero promete ser mucho más que eso. La gigante de tecnología ha asegurado que Gemini presenta un enorme salto en materia de IA que, en última instancia, afectará a prácticamente todos los productos de Google, como señaló The Verge.

De hecho, el avance ha sido descrito como potencialmente el algoritmo más importante en la historia de Google. Gemini, que se incorporará al motor de búsqueda de Google, se está lanzando inicialmente en más de 170 países, incluido Estados Unidos, este miércoles en forma de una actualización del chatbot Bard de Google.

Google presenta Gemini Nano, Pro y Ultra 

Anunciado por primera vez durante la Conferencia de desarrolladores de Google I/O, Gemini es la respuesta oficial a ChatGPT, el modelo de IA desarrollado por OpenAI que se lanzó hace poco más de un año generando revuelo a nivel mundial.

Una de sus características diferenciales es que esmultimodal”, lo que significa que puede comprender texto, audio, imágenes, vídeo y código informático simultáneamente. También viene en tres versiones.

Gemini Nano, que está diseñada para ejecutarse de forma nativa y sin conexión en dispositivos Android. Gemini Pro, una versión más robusta que será la que próximamente impulse muchos de los servicios de IA de Google y que ahora se integra como la columna vertebral de Bard. Los desarrolladores y clientes empresariales podrán acceder a Gemini Pro a través de Google Generative AI Studio o Vertex AI en Google Cloud a partir del 13 de diciembre.

Finalmente está Gemini Ultra, un modelo aún más capaz que se promociona como el LLM más poderoso que Google ha creado hasta ahora y parece estar diseñado principalmente para centros de datos y aplicaciones empresariales. La empresa dijo que esta versión es el primer modelo que supera a los expertos humanos en MMLU (comprensión masiva de lenguajes multitarea).

Gemini Ultra, que utiliza una combinación de 57 temas como como matemáticas, física, historia, derecho, medicina y ética, supuestamente puede comprender matices y razonamientos en temas complejos. Esta versión se lanzará en 2024.

Más eficiente y útil para la programación

Además de su enorme capacidad, Google asegura que su nuevo y más avanzado modelo de IA es también más eficiente. Fue entrenado en las propias Unidades de Procesamiento Tensoriales de Google y es más rápido y económico de ejecutar que los modelos anteriores de la compañía como PaLM, según las declaraciones.

Todavía necesitamos mucha computación para entrenar a Gemini, pero nos estamos volviendo mucho más eficientes en términos de nuestra capacidad para entrenar estos modelos“, explicó Eli Collins, vicepresidente de producto de Google DeepMind.

El nuevo modelo de IA de Google también se diferencia por su alta capacidad en tareas de programación. Gemini utiliza un nuevo sistema de generación de código llamado AlphaCode 2, que se destaca en codificación, según el informe.

Gemini Ultra: ¿Mejor que GPT-4?

En cuanto a la pregunta concreta sobre si Gemini es superior a GPT-4, la versión más actualizada de ChatGPT, el CEO de Google DeepMind, Demis Hassabis, reveló a The Verge que, comparativamente, el nuevo modelo es superior a su competidor de OpenAI en al menos 30 de 32 aspectos de referencia, siendo una de sus principales ventajas su capacidad para comprender e interactuar con video y audio.

Esta capacidad “multimodal” que diferencia a Gemini se volverá “aún más general“, aseguró Hassabis, insinuando avances a futuro. El CEO aseguró que con el tiempo Gemini tendrá “más sentidos, se volverá más consciente y será más preciso y arraigado en el proceso“, según la publicación. “Estos modelos simplemente entienden mejor el mundo que los rodea“, dijo Hassabis.

Aunque más allá de estos planes y ambiciones, que incluyen el sueño más amplio de crear un inteligencia artificial general (AGI), la gigante de tecnología está trabajando para garantizar la seguridad y la responsabilidad de Gemini, por lo que no teme mantener un ritmo pausado, permitiendo un proceso adecuado de “observación y aprendizaje“.

A medida que nos acerquemos a AGI, las cosas serán diferentes”, afirmó Hassabis. “Es una especie de tecnología activa, por lo que creo que debemos abordarla con cautela. Con cautela, pero con optimismo”.

El invento más revolucionario desde el fuego

Los ejecutivos de Google parecen estar convencidos de que este es el comienzo de algo verdaderamente enorme, no solo en el ámbito de IA y la tecnología en general, sino para la humanidad.

Esta nueva era de modelos representa uno de los mayores esfuerzos de ciencia e ingeniería que hemos emprendido como empresa, dijo el CEO de Google, Sundar Pichai, en la publicación del blog del miércoles. “Estoy realmente emocionado por lo que está por venir y por las oportunidades que Gemini desbloqueará para personas de todo el mundo“.

Pichai ya ha dicho más de una vez en ocasiones anteriores que la IA será más transformadora para la humanidad que descubrimientos como el fuego o la electricidad. Por ahora, queda por verse si Gemini podrá efectivamente destronar a GPT-4 tal como promete.


Artículo de Hannah Estefanía Pérez / DiarioBitcoin

Imagen de Unsplash 

ADVERTENCIA: Este es un artículo de carácter informativo. DiarioBitcoin es un medio de comunicación, no promociona, respalda ni recomienda ninguna inversión en particular. Vale señalar que las inversiones en criptoactivos no están reguladas en algunos países. Pueden no ser apropiadas para inversores minoristas, pues se podría perder el monto total invertido. Consulte las leyes de su país antes de invertir.