La mesa está servida… y en el ring ya están los contrincantes. Google no podía quedarse atrás frente a OpenIA, cuando la inteligencia artificial (IA) generativa ya es una de las herramientas más poderosas que asoman en el planeta.
Hace escasos días, el gigante de las búsquedas y todopoderoso de la tecnología universal ha presentado en sociedad la Red de Inteligencia Multimodal Generalizada, o -lo que es lo mismo- su propia IA, destinada a remodelar la forma en que interactuamos.
Ante millones y millones de miradas de todas las latitudes, Google presentó Gemini, su nueva criatura, como “un modelo de inteligencia artificial multimodal, que muestra una competencia sin precedentes en el procesamiento de diversos tipos de datos, incluidos texto, imágenes, código, voz”… y mucho, mucho más. Por lo anunciado, todo lo que habíamos visto hasta ahora (incluidos el GPT-4 y las otras herramientas de inteligencia artificial más avanzadas) serán superadas en cuanto a magnitud y prestaciones de este programa.
Técnicamente, la invención fusiona un codificador y decodificador multimodal. El rol del codificador es transformar diferentes tipos de datos a un lenguaje común que el decodificador pueda entender. Después, el decodificador decide generar salidas en diferentes modalidades, según las entradas codificadas y la tarea en sí misma.
Para conocer los entresijos y el ‘otro lado’ de Gemini, proponemos los siguientes 10 ejes de un desarrollo que podría ser uno de los grandes hallazgos del siglo XXI, aunque todo está por verse: la velocidad de los desarrollos tecnológicos en materia de IA no hacen más que brotar y solaparse unos con otros, a un ritmo frenético y espectacular que no para de sorprender. Su anuncio llega casi en simultáneo a otro hito (nada casual): la UE acaba de aprobar la primera ley de inteligencia artificial del mundo, con todo lo que ello significará y afectará al funcionamiento de herramientas como el nuevo ‘bebé’ de Google.