コンテンツにスキップ

テキスト埋め込みでないPDFファイルをナレッジストアに登録する

テキスト埋め込みのPDFファイル(PDFファイル上の文章をマウスで選択し、コピーできるもの)をナレッジストアで活用する場合は、「PDF/オフィスファイル」として追加することができます。
しかし、テキスト埋め込みでないPDFファイルや、画像や図形での説明が多いPDFファイルについては、「PDF/オフィスファイル」としての登録では充分な情報を取得できません。

そのようなPDFファイルは、「PDF(画像認識)」としてナレッジストアに追加することをオススメします。

PDF(画像認識)の仕組み

「PDF(画像認識)」としてナレッジストアに追加されたPDFファイルは、Gen2Goの内部では、下記の手順で処理されます。

  1. PDFファイルを1ページずつ画像化する
  2. 画像化したページを、ナレッジストアの「画像認識用プロンプト」で設定したプロンプトを使って、生成AIでテキスト化する(その際、画像をインプットとした文章生成が行われるため、クレジットが消費されます。)
  3. 取得したテキストをまとめて、ナレッジストアに保存(ベクトル化)する。

画像認識用プロンプトの作成と設定

プロンプトの作成

「PDF(画像認識)」を使用するには、まず、画像認識用のプロンプトを作成する必要があります。
プロンプトで使用するAIモデルは、画像認識に対応したものを指定する必要があります。

「画像認識用プロンプト」テンプレートから、プロンプトを作成することができます。
このテンプレートでは、下記のような設定が行われています。

システムメッセージ

この画像から下記の注意点に基づき情報を抽出し、まとめてください。

- まず、文字起こしする。
- 画像は、どのようなものか説明する。
- ○○に役立つ知見として整理する。

使用モデル
- GPT-4o (2024-11-20)

このテンプレートでは、PDFファイルの1ページを画像化したものについて、まず文字起こしを行い、画像についてはどのような画像かを説明させ、さらに知見の整理をさせようとしています。
「○○に役立つ知見として整理する。」となっているので、○○の部分をナレッジストアの目的に合わせて書き換えてください。

ナレッジストアへの設定

画像認識用プロンプトを作成したら、あとはナレッジストアの設定画面で、そのプロンプトを指定します。

これで、ナレッジストアへのナレッジ追加時に「PDFファイル(画像認識)」を選択し、ナレッジ化することが可能となります。