言葉で表せないものを見る: マルチモーダル検索拡張生成
Gemini を使用して、マルチモーダル検索拡張生成でテキストと画像のデータに関するインサイトを獲得します。
言葉で表せないものを見る: マルチモーダル検索拡張生成
Gemini を使用して、マルチモーダル検索拡張生成でテキストと画像のデータに関するインサイトを獲得します。
言葉で表せないものを見る: マルチモーダル検索拡張生成
「百聞は一見に如かず」という格言は、視覚データの計り知れない可能性を手短かに表しています。しかし、ほとんどの検索拡張生成(RAG)アプリケーションはテキストのみに依存しています。このセッションでは、RAG をマルチモーダル ユースケースに適用します。このユースケースでは、データの取得のために、埋め込みと属性質問応答に重点を置いています。アーキテクチャの概要を説明することから始めて、すぐに実践的なデモを実演します。参加者は、強力な LLM ベースのワークフローを作成して既存のアプリケーションに埋め込む方法を学びます。
初級
テクニカル セッション