テキスト埋め込みでないPDFファイルをナレッジストアに登録する

テキスト埋め込みのPDFファイル（PDFファイル上の文章をマウスで選択し、コピーできるもの）をナレッジストアで活用する場合は、「PDF／オフィスファイル」として追加することができます。
しかし、テキスト埋め込みでないPDFファイルや、画像や図形での説明が多いPDFファイルについては、「PDF／オフィスファイル」としての登録では充分な情報を取得できません。

そのようなPDFファイルは、「PDF（画像認識）」としてナレッジストアに追加することをオススメします。

PDF（画像認識）の仕組み

「PDF（画像認識）」としてナレッジストアに追加されたPDFファイルは、Gen2Goの内部では、下記の手順で処理されます。

PDFファイルを1ページずつ画像化する
画像化したページを、ナレッジストアの「画像認識用プロンプト」で設定したプロンプトを使って、生成AIでテキスト化する（その際、画像をインプットとした文章生成が行われるため、クレジットが消費されます。）
取得したテキストをまとめて、ナレッジストアに保存（ベクトル化）する。

画像認識用プロンプトの作成と設定

プロンプトの作成

「PDF（画像認識）」を使用するには、まず、画像認識用のプロンプトを作成する必要があります。
プロンプトで使用するAIモデルは、画像認識に対応したものを指定する必要があります。

「画像認識用プロンプト」テンプレートから、プロンプトを作成することができます。
このテンプレートでは、下記のような設定が行われています。

システムメッセージ

この画像から下記の注意点に基づき情報を抽出し、まとめてください。

- まず、文字起こしする。
- 画像は、どのようなものか説明する。
- ○○に役立つ知見として整理する。

使用モデル
- GPT-4o (2024-11-20)

このテンプレートでは、PDFファイルの1ページを画像化したものについて、まず文字起こしを行い、画像についてはどのような画像かを説明させ、さらに知見の整理をさせようとしています。
「○○に役立つ知見として整理する。」となっているので、○○の部分をナレッジストアの目的に合わせて書き換えてください。

ナレッジストアへの設定

画像認識用プロンプトを作成したら、あとはナレッジストアの設定画面で、そのプロンプトを指定します。

これで、ナレッジストアへのナレッジ追加時に「PDFファイル（画像認識）」を選択し、ナレッジ化することが可能となります。