El jueves, Google Publicado La compañía describe el Gemini 1.5 Pro como que ofrece un «rendimiento dramáticamente mejorado» con respecto al modelo anterior. El camino de la IA de la compañía, considerado internamente como crítico para su futuro, vio la semana pasada la presentación del Gemini 1.0 Ultra, rebautizado como Bart Chatbot (por Gemini) para alinearse con las capacidades más poderosas y versátiles del nuevo modelo.
En una publicación de blog de anuncio, el director ejecutivo de Google, Sundar Pichai, y el director ejecutivo de Google DeepMind, Temis Hassabis, hablan sobre las capacidades de rápido avance de sus modelos y tratan de tranquilizar a su audiencia sobre la seguridad ética de la IA. «Nuestros equipos continúan superando los límites de nuestros últimos modelos con la seguridad en el centro», resumió Pichai.
Los escépticos de la IA (incluido un ex director ejecutivo de Google) y los reguladores gubernamentales necesitan que la empresa haga hincapié en la seguridad. Pero los desarrolladores de IA, los clientes potenciales y los inversores que ven a la empresa como demasiado lenta para el gran éxito de OpenAI con ChatGPT deben enfatizar el rápido rendimiento de sus modelos.
Pichai y Hassabis dicen que el Gemini 1.5 Pro proporciona resultados comparables a los del Gemini 1.0 Ultra. Sin embargo, Gemini 1.5 opera de manera más eficiente a esa escala, con requisitos computacionales reducidos. Las capacidades multimodales incluyen texto, imágenes, vídeos, audio o código. A medida que avancen los modelos de IA, seguirán ofreciendo capacidades más versátiles en un solo cuadro de aviso (otro ejemplo reciente es la integración de OpenAI de la generación de imágenes DALL-E 3 en ChatGPT).
Gemini 1.5 Pro puede manejar hasta un millón de tokens o unidades de datos que los modelos de IA pueden procesar en una sola solicitud. Google dice que Gemini 1.5 Pro puede procesar bases de código con 700.000 palabras, una hora de vídeo, 11 horas de audio y más de 30.000 líneas. La compañía afirma que la versión que admite 10 millones de tokens ha sido «probada con éxito».
Gemini 1.5 Pro mantiene una mayor precisión en consultas con mayores recuentos de tokens mientras aprende más datos nuevos, dice la compañía. Dice modelo inspirado. Inyección en la valoración del pajar. En esta prueba, los desarrolladores insertan un breve fragmento de información en un largo bloque de texto para ver si el modelo de IA puede captarlo. Google dijo que Gemini 1.5 Pro puede detectar texto incrustado el 99 por ciento de las veces en bloques de datos de hasta un millón de tokens.
Google dice que Gemini 1.5 Pro puede razonar sobre varios detalles de las transcripciones de la misión lunar del Apolo 11 de 402 páginas. Además, puede analizar la trama y los acontecimientos de una película muda de 44 minutos protagonizada por Buster Keaton. «Dado que la larga ventana ambiental del 1.5 Pro es la primera de su tipo en modelos a gran escala, estamos constantemente desarrollando nuevas evaluaciones y puntos de referencia para probar sus nuevas capacidades», escribió Hassabis.
Google lanza Gemini 1.5 Pro con capacidades de 128.000 tokens. Mismo número De los cuales los modelos GPT-4 de OpenAI (anunciados públicamente) son el máximo. Hassabis dice que Google eventualmente introducirá nuevos niveles de precios que admitan un millón de consultas de tokens.
Gemini 1.5 Pro es experto en aprender nuevas habilidades a partir de información contenida en instrucciones más largas sin matices adicionales («aprendizaje en contexto»). En una escala que es Traducción automática de un libro., la modelo aprendió un manual de gramática de calamang, un idioma con menos de 200 hablantes en todo el mundo, en el que no había entrenado previamente. La compañía afirma que Gemini 1.5 Pro ha aprendido a traducir del inglés a Kalamang para actuar como un ser humano aprendiendo el mismo contenido.
En una parte del anuncio que llamará la atención de los desarrolladores, Google dice que Gemini 1.5 Pro podrá realizar tareas de resolución de problemas en largos bloques de código. «Dado un mensaje con más de 100.000 líneas, puede razonar mejor con ejemplos, sugerir cambios útiles y proporcionar explicaciones de cómo funcionan las diferentes partes del código», escribió Hassabis.
Google dice que está adoptando «el mismo enfoque de implementación responsable» que los modelos Gemini 1.0 en términos de ética y seguridad. Esto incluye el desarrollo y el uso de técnicas de formación de equipos rojos, en las que un grupo de desarrolladores de protocolos actúa esencialmente como abogado del diablo y realiza pruebas para detectar «diversos daños». Además, la compañía dice que está investigando intensamente áreas como la protección de contenido y el daño a la representación. La compañía dice que continúa desarrollando nuevos protocolos y pruebas de seguridad para sus herramientas de inteligencia artificial.
Google está lanzando Gemini 1.5 en acceso temprano para desarrolladores y clientes empresariales. La compañía planea hacer que su disponibilidad sea más amplia con el tiempo. Gemini 1.0 también está disponible actualmente para los consumidores. Variante profesional Cuesta $20 por mes.
«Especialista en viajes. Típico estudioso de las redes sociales. Amigo de los animales en todas partes. Ninja zombi independiente. Aficionado a Twitter».
More Stories
Ganancias de American Eagle (AEO) Q2 2024
Un dramático enfrentamiento entre 49ers y Brandon Iuck y signos de ruptura están en marcha
Surge nueva polémica por la visita de Trump al Cementerio Nacional de Arlington