Gemini APIに直接組み込まれた完全管理型RAGシステム という触れ込みですが、どんなものなのでしょうか。
お手軽ナレッジベース作成といえば、GPTs, Dify, AWS S3 Vector table などがありますが、File Search Tool in Gemini API も候補に入るのでしょうか?
なんせ Google ですから、クライアントの多くがすでにアカウントを持っています。できることなら登場するサービスはむやみに増やさずに、Google を活用していきたいところです。
News
Introducing the File Search Tool in Gemini API
料金体系
File Searchをすべての開発者にとってシンプルで手頃なものにするため:
- ストレージとクエリ時のエンベディング生成は無料
- ファイルを最初にインデックス化する際のエンベディング作成のみ課金(100万トークンあたり$0.15の固定料金)
File Searchの仕組み
主な特徴:
- シンプルで統合された開発体験
- RAGプロセス全体を効率化
- ファイルストレージ、最適なチャンキング戦略、エンベディング、プロンプトへの取得コンテキストの動的注入を自動管理
- 既存の
generateContentAPIで動作し、採用が容易
- 強力なベクトル検索
- 最新のGemini Embeddingモデルを搭載
- ユーザーのクエリの意味とコンテキストを理解
- 正確な単語が使われていなくても、ドキュメントから関連情報を検索可能
- 組み込み引用機能
- モデルの応答には自動的に引用が含まれ、回答生成に使用されたドキュメントの部分を明示
- 検証が簡単に
- 幅広いフォーマットのサポート
- PDF、DOCX、TXT、JSON、および多くのプログラミング言語ファイルタイプに対応
- 包括的なナレッジベースの構築が可能

