Google I/O

Ver más allá de las palabras: generación aumentada de recuperación multimodal

El dicho de "una imagen vale más que mil palabras" engloba el inmenso potencial de los datos visuales. Pero la mayoría de las aplicaciones de generación aumentada de recuperación (retrieval-augmented generation, RAG) utilizan solo texto. En esta sesión, se aplica RAG en casos de uso multimodales. Se centra en inserciones y respuestas de preguntas atribuidas para recuperar datos. Comenzaremos por la arquitectura de alto nivel y pasaremos rápidamente a una demostración práctica. Los asistentes aprenderán a crear flujos de trabajo robustos basados en modelo de lenguaje grande e incorporarlos en aplicaciones existentes.

Principiante
Sesión técnica
Únete a un grupo de la comunidad

Conoce desarrolladores, descubre los grupos locales y crea una red global.

Primeros pasos
I/O Connect

Explora, conéctate con colegas y familiarízate con los últimos productos.