El 6 de diciembre el alfabeto Lanzada la primera fase del modelo de IA de próxima generación, mellizo. Gemini está supervisada y dirigida por su CEO, Sundar Pichai y Google Mente profunda.
Géminis es el primer tipo que supera a los expertos humanos MMLU (Comprensión masiva del lenguaje multitarea), una de las formas más populares de probar el rendimiento de los modelos de lenguaje. Gemini puede generar código basado en diferentes entradas, crear texto e imágenes combinados y pensar visualmente en todos los idiomas.
Según Sundar Pichai, director ejecutivo de… GoogleGéminis sobresale Abierto AI‘s ChatGPT. Destacó la eficiencia de Gemini en una serie de pruebas que miden el rendimiento de la IA en una variedad de tareas que involucran texto e imágenes.
También es emocionante porque Gemini Ultra es lo último en 30 de 32 estándares líderes, especialmente en estándares multimedia. Este punto de referencia de MMMU muestra el progreso realizado allí. Personalmente, encuentro emocionante acerca de MMLU. [massive multi-task language understanding], que era uno de los estándares líderes, ha superado el umbral del 90%, lo que es un logro importante. La condición técnica hace dos años era del 30 o 40%. Así que piense en lo avanzado que está este campo. Casi el 89% son expertos humanos en estos 57 temas y es el primer modelo que cruza este umbral. – Sundar Pichai
Además de sus capacidades multimedia, Gemini está diseñado para brindar eficiencia y escalabilidad. Su arquitectura permite una rápida integración con herramientas y API existentes, lo que la convierte en un potente motor para impulsar futuras innovaciones en IA. Este enfoque de código abierto fomenta la colaboración y el desarrollo en toda la comunidad de IA, acelerando el ritmo del progreso y garantizando que se aproveche plenamente el potencial de Gemini.
Hay tres versiones principales de Géminis: Súperel más grande; primer plano, talla mediana; Y nano, que es significativamente más pequeño y más eficiente. Bard de Google, un chatbot similar a ChatGPT, funcionará con Gemini Pro. El Nano se ejecutará en el Google Pixel 8 Pro.
Las reacciones en las redes sociales han sido mixtas: algunos informaron resultados impresionantes, mientras que otros citaron alucinaciones persistentes. Melanie Mitchell«Está claro que Gemini es un sistema de inteligencia artificial muy sofisticado, pero no me queda claro que Gemini sea en realidad mucho más capaz que GPT-4», dijo un investigador de inteligencia artificial del Instituto Santa Fe en Nuevo México.
Estoy muy decepcionado con el Gemini Pro de Bard. Todavía da muy malos resultados en preguntas que ya no deberían ser difíciles con RAG. Una pregunta tan sencilla con una respuesta tan sencilla, y aún así se equivoca. – Vitor De Luca
Gemini es una familia de grandes modelos de lenguaje multimodal desarrollados por Google DeepMind y sirve como sucesor de lambda Y palma 2. El modelo recibió su nombre en relación con un proyecto de la NASA. mellizo. El modelo consta únicamente del decodificador. transformadorescon modificaciones para permitir un entrenamiento e inferencia efectivos TPU. Las imágenes de entrada pueden tener diferentes resoluciones, mientras que el vídeo se introduce como una serie de imágenes. El audio se muestrea a 16 kHz y luego se convierte en una serie de tokens mediante un modelo de voz global.
Antes de lanzar Gemini, su equipo desarrolló evaluaciones de impacto de modelos para identificar, evaluar y documentar los beneficios sociales clave y los daños potenciales asociados con el desarrollo de modelos Gemini avanzados. Sobre la base de una comprensión de los impactos conocidos y esperados, se ha desarrollado un conjunto de “políticas modelo” para guiar el desarrollo y la evaluación de modelos. Para evaluar los modelos de Gemini en comparación con las áreas de políticas y otras áreas de riesgo clave identificadas dentro de las evaluaciones de impacto, se llevó a cabo un conjunto integral de evaluaciones.
También se implementaron mitigaciones en la capa de datos del modelo y también se utilizó el ajuste de instrucciones para mitigar los problemas de integridad del modelo. Para reducir AlucinacionesSe utilizaron métodos de atribución, generación de respuestas a libro cerrado y cobertura. de acuerdo a Orden Ejecutiva N° 14110 Firmado por presidente joe biden En octubre, Google dijo que compartiría los resultados de las pruebas Gemini Ultra con el gobierno federal de Estados Unidos.
Los desarrolladores que quieran saber más sobre Gemini pueden seguir leyendo. Reporte técnico Disponible por Google.
«Food ninja. Freelance pop culture fanatic. Wannabe zombie maven. Twitter aficionado.»
More Stories
La red social Butterflies AI añade una función que te convierte en un personaje de inteligencia artificial
Edición del vigésimo aniversario de Hautlence HLXX: redefiniendo el tiempo con minutos que retroceden y horas saltantes
Un marco para resolver ecuaciones diferenciales parciales equivalentes puede guiar el procesamiento y la ingeniería de gráficos por computadora