Google presenta Gemini: Su Nueva IA Diseñada para Superar a ChatGPT

Contenido

Es oficial: el coloso tecnológico Google ha revelado Gemini, su propio modelo de lenguaje de inteligencia artificial (IA) con el que pretende competir contra ChatGPT; así lo anunció la compañía radicada en California, Estados Unidos.

La firma comunicó que este nuevo LLM (modelo de lenguaje a gran escala) se lanzará en tres variantes distintas: Nano, Pro y Ultra, cada una adaptándose a los diversos requerimientos y complejidades de cada tarea. La versión Pro ya se encuentra disponible en múltiples dispositivos y herramientas (como Bard) en más de 170 naciones, mientras que su versión más potente, Gemini Ultra, estará disponible a principios de 2024.

Google Gemini, la IA multimodal más avanzada en la actualidad

A pesar de que Google aparenta haber tardado bastante en realizar pruebas y evaluaciones para lanzar su propia IA, parece que la espera ha sido provechosa, dado que el gigante de internet enfatiza que la funcionalidad de Gemini supera las expectativas actuales en el mercado, logrando los mejores resultados en 30 de las 32 evaluaciones académicas de uso general, alcanzando una puntuación del 90,0% en MMLU (comprensión masiva de lenguaje multitarea) y superando a GPT-4, el modelo más potente de OpenAI. Esto convierte a Gemini en la IA multimodal más potente en la actualidad.

Comparativa entre Gemini y GPT-4 Fuente: Google

«Gemini es el resultado de los esfuerzos colaborativos a gran escala de los equipos en Google, incluyendo a nuestros colegas en Google Research. Fue desarrollada desde cero para ser multimodal, lo que implica que puede generalizar y comprender sin dificultad, operando y combinando diversos tipos de información, incluyendo texto, código, audio, imágenes y video«, indica la empresa en su comunicado.

El CEO de Alphabet, Sundar Pichai, ha expresado su entusiasmo ante el lanzamiento de Gemini, resaltando sus capacidades con este vídeo en el que presenta funcionalidades como la comprensión de entradas en formato de video, algo que estaba fuera del alcance actual de GPT-4.

Seeing some qs on what Gemini *is* (beyond the zodiac :). Best way to understand Gemini’s underlying amazing capabilities is to see them in action, take a look ⬇️ pic.twitter.com/OiCZSsOnCc

— Sundar Pichai (@sundarpichai)6 de diciembre de 2023

Las tres variantes de Gemini se clasifican según las distintas funciones a las que estarán destinadas:

Nano: modelo que llevará a cabo tareas directamente desde dispositivos
Pro: elaborado para escalar en diversos tipos de tareas
Ultra: el modelo más robusto, concebido específicamente para actividades de alta complejidad

Su capacidad permite entender texto, código, imágenes y más

Con el modelo Gemini 1.0, la empresa busca hacer accesibles sus avanzadas habilidades de razonamiento, facilitando que los usuarios puedan interpretar información compleja tanto en formato de imagen como en texto, vídeo, audio o código. De esta manera, la IA podrá extraer conocimientos de cientos de documentos simultáneamente, filtrando la información a nuevas velocidades sin precedentes. Además, su modelo de lenguaje es tan sofisticado que incluso podrá comprender y proporcionar información sobre disciplinas como matemáticas o física.

Para los programadores, esta IA tendrá la capacidad de interpretar, explicar y generar código de alta calidad en diversos lenguajes de programación, como Python, Java, C++ y Go. La empresa garantiza que, con Gemini Ultra, los desarrolladores no solo tendrán la posibilidad de crear mejores servicios, sino que también podrán hacerlo con mayor rapidez.

“Gemini fue concebido para ser multimodal de manera nativa, preentrenado desde el inicio en múltiples modalidades y, posteriormente, fue perfeccionado con datos multimodales para aumentar aún más su efectividad. Esto permite que Gemini pueda comprender y razonar con gran precisión sobre cualquier tipo de entrada, superior a los modelos multimodales actuales”.

A partir de hoy, Gemini se presenta en su versión Pro en Google Bard, marcando la actualización más significativa desde su estreno. Google resalta que esto lo posiciona como uno de los modelos gratuitos más avanzados a nivel mundial. Inicialmente en inglés y disponible en más de 170 naciones, y a pesar de que todavía no está accesible en Europa, la compañía asegura que en los próximos meses se ampliará a otros territorios e idiomas.

En lo que respecta a Gemini Ultra, la variante más potente de este modelo, Google afirma que estará disponible para algunos clientes, desarrolladores y expertos en seguridad, quienes tendrán la oportunidad de probarlo antes de su lanzamiento general a todos los desarrolladores en los primeros meses de 2024.

En lo que concierne a la versión Nano, Gemini hace su aparición en el smartphone de alta gama de Google, el Pixel 8 Pro. Esta incorporación otorga al teléfono nuevas funcionalidades, como la integración de respuestas inteligentes del teclado Gboard en WhatsApp, entre otras características. Para el año 2024, la compañía promete extender la presencia de Gemini a diversas aplicaciones de mensajería.