
Es un hecho: el reciente modelo de lenguaje GPT-4 de OpenAI fue presentado este martes, y sus mejoras, que prometen ser más robustas y humanas, ya están accesibles para desarrolladores y en su versión premium ChatGPT Plus.
La inteligencia artificial de ChatGPT ahora exhibe mejores habilidades para analizar problemas complicados, así como más alternativas en la forma de interactuar con su sistema.
Qué es GPT-4
GPT-4 es un modelo de lenguaje multimodal, lo que significa que acepta tanto entradas visuales como textuales, generando contenidos escritos a partir de ellas. Las modificaciones y avances que incorpora esta tecnología la posicionan como la evolución optimizada de sus predecesores (GPT-3 y ChatGPT).
Desde OpenAI explican que, aunque sigue siendo menos competente que los humanos en muchos contextos, muestra un rendimiento comparativo en determinados aspectos académicos y profesionales. «Por ejemplo, aprueba un examen de barra simulado con una puntuación aproximadamente un 10 % superior a la de los examinados; por el contrario, el puntaje de GPT-3.5 se ubicó alrededor del 10 % inferior«.
Según la empresa, GPT-4 es su «último logro en su intento por escalar el aprendizaje profundo». Sin embargo, todavía no es impecable, tal como señala Sam Altman, fundador de OpenAI. «Aún presenta errores, parece mucho más impresionante al principio que después de un tiempo de uso».
here is GPT-4, our most capable and aligned model yet. it is available today in our API (with a waitlist) and in ChatGPT+.https://t.co/2ZFC36xqAJ
it is still flawed, still limited, and it still seems more impressive on first use than it does after you spend more time with it.
— Sam Altman (@sama) March 14, 2023
Para qué se utiliza GPT-4
Entre las principales innovaciones que ofrece GPT-4 se destacan:
Menos sesgos
Esto implica que produce menos inexactitudes y ahora podrá aprobar diversos tipos de exámenes, como los que se requieren en EE.UU. para ser miembro de una asociación de abogados.
A pesar de mostrar menos tendencia a engañar, OpenAI asegura que GPT-4 es más creativo que su versión previa, ya que tiene la capacidad de crear, editar y asistir al usuario en la elaboración de textos tanto en prosa como en poesía, incluyendo un estilo distintivo y un sentido del humor más agudo.
Reconocimiento de imágenes
Esta constituye una de sus mejoras más significativas, dado que GPT-4 puede analizar imágenes y reconocer objetos específicos dentro de fotografías que contengan múltiples elementos visuales.
Según su presentación, esta nueva versión podrá descifrar incluso diagramas realizados a lápiz y convertirlos en códigos HTML, CSS y Javascript con títulos y botones operativos.
Además, esta versión renovada será multimodal, lo que significa que permitirá la creación de imágenes (algo que ya realiza
Dalle-2), y, además, ahora también podría tener la capacidad de generar vídeos o audios.
A pesar de que estas funcionalidades recientes no están disponibles para el público en general, la empresa indicó que prefiere «progresar poco a poco y perfeccionar detalles», aunque en un futuro la opción de subir imágenes podría estar al alcance no solo de los suscriptores de ChatGPT Plus, sino también del público en general.
Mayor capacidad de entrada de texto
Ahora el usuario no estará restringido a interactuar con GPT-4 mediante preguntas sencillas o textos cortos, sino que podrá cargar textos de extensa longitud, incluso libros, para llevar a cabo resúmenes, análisis o la búsqueda de patrones más complejos.
De esta manera, la nueva versión puede gestionar más de 25.000 palabras de texto, lo que le permitirá generar contenidos más largos, mantener conversaciones amplias y realizar búsquedas y análisis de documentos.
En la esfera editorial, tendrá la capacidad de identificar errores gramaticales, ortográficos o simplemente prevenir redundancias en un artículo, e incluso puede detectar el estilo o la autoría de un texto.
¿En qué se distingue de GPT-3 y GPT-3.5 (ChatGPT)?
Como mencionamos, GPT-4 representa la evolución de los modelos que lo antecedieron, siendo una versión optimizada que integra las capacidades de los anteriores y añade innovaciones, como las mencionadas en el apartado previo.
Según lo indicado por OpenAI en su blog, la diferencia entre GPT-4 y GPT-3 y GPT-3.5 «emerge cuando la complejidad de la tarea alcanza un umbral considerable«. Esto significa que GPT-4 es más fiable, presenta una capacidad creativa superior y puede gestionar instrucciones mucho más detalladas.
¿Es gratuito? ¿Cómo puedes probarlo?
En la actualidad, GPT-4 ya se encuentra disponible en ChatGPT Plus, el modelo de pago con un coste de suscripción de 20$ mensuales, y con un límite de uso que la empresa podría ampliar según la demanda y el rendimiento del sistema.
Tal y como han señalado desde OpenAI «esperamos ofrecer en algún momento una cantidad determinada de consultas con GPT-4 de forma gratuita para que aquellos que no poseen una suscripción también puedan probarlo«. Pero hasta entonces, debemos esperar.
Por otro lado, también se ha comunicado que GPT-4 ya está disponible en la API de OpenAI, aunque con lista de espera. Actualmente, el acceso a la API solo permite hacer solicitudes a la herramienta mediante entradas de texto, no a través de imágenes. Esta funcionalidad se integrará posteriormente. Además, el precio se ha fijado en 0,03$ por cada 1.000 tokens de solicitud y 0,06$ por cada 1.000 tokens de finalización, teniendo los límites de tasa en 40.000 tokens por minuto y 200 solicitudes por minuto.
Otro anuncio significativo es que GPT-4 ya está integrado en la nueva versión de Bing potenciada por IA, que anteriormente se había sustentado en la tecnología de ChatGPT.
De igual manera, OpenAI también expuso sus colaboraciones con empresas que emplean GPT-4 para proporcionar servicios, entre las que destaca la aplicación para aprender idiomas Duolingo, la cual ahora incluye una opción de chat para aclarar inquietudes, como si estuvieses manteniendo una conversación con un educador virtual.
La inteligencia artificial de Google, Bard, se incorpora a Gmail y Google Docs
El anuncio acerca del lanzamiento de GPT4 ocurre apenas un par de días antes de la presentación conjunta con Microsoft, que este jueves mostrará el funcionamiento de Office con ChatGPT integrado.
Mientras tanto, Google ha anunciado su propio ChatGPT, Bard, liberado inesperadamente el pasado mes de febrero y cuyas novedades ha revelado hace solo unas horas, entre las que se encuentran herramientas de IA generativa para Gmail, Google Docs y otras aplicaciones como Workspace.
Aumentando un poco más las nuevas características de Bard, Google afirma que ahora podrá generar, resumir y crear ideas de texto en Google Docs, y además, sus usuarios podrán elaborar textos completos para correos electrónicos en Gmail, con solo proporcionar una breve indicación de texto.
Más allá de la creación de texto, Bard promete ser capaz de producir elementos multimedia, incluyendo fotos, videos o ilustraciones, para ser utilizado en diapositivas dentro de sus presentaciones.
Por el momento, estas nuevas características son accesibles únicamente para un reducido grupo de usuarios a los que Google se refiere como «evaluadores de confianza» y, aunque no hay una fecha precisa para su lanzamiento, estamos convencidos de que apenas comenzamos a observar la contienda por el dominio de la inteligencia artificial en la era digital.
Imagen: Depositphotos