Ver más allá de las palabras: generación aumentada de recuperación multimodal
El dicho de "una imagen vale más que mil palabras" engloba el inmenso potencial de los datos visuales. Pero la mayoría de las aplicaciones de generación aumentada de recuperación (retrieval-augmented generation, RAG) utilizan solo texto. En esta sesión, se aplica RAG en casos de uso multimodales. Se centra en inserciones y respuestas de preguntas atribuidas para recuperar datos. Comenzaremos por la arquitectura de alto nivel y pasaremos rápidamente a una demostración práctica. Los asistentes aprenderán a crear flujos de trabajo robustos basados en modelo de lenguaje grande e incorporarlos en aplicaciones existentes.
Disertantes
Conoce desarrolladores, descubre los grupos locales y crea una red global.
Primeros pasosAumenta tus habilidades en relación con tu tecnología de Google favorita.
Primeros pasos