メインコンテンツにスキップ

OCR:AIモデルの違いについて

2025年3月時点の仕様です。

Yuki Omori avatar
対応者:Yuki Omori
一週間前以上前にアップデートされました

概要

書類から文字情報を読み取る(OCR機能)では、AIモデルによってできること・できないことが異なります。各AIモデルの違いについて説明します。

各モデルの違い

ChatGPT

Claude

Claude_v2

Gemini

ファイル容量

最大4.5MB

最大4.5MB

最大3.35MB

最大7MB

表形式(取得順)

上から取得

順不同

上から取得

上から取得

表形式(空白)

読み取り不可

読み取り可

読み取り可

読み取り不可

カンマ区切り文字の
ループ処理利用可否

ファイル容量

読み取り可能な最大ファイル容量を指します。

上記は有料プランのファイル容量となり、フリープランは最大3MBとなります。

表形式(取得順)

請求書や見積書など明細行を読み取った場合、

明細行を上から順番に読み取れるかどうかを指します。

表形式(空白)

請求書や見積書など表形式に、空白があった場合、空白を認識するかどうかを指します。

カンマ区切り文字

Yoomでは、アウトプットの値がカンマ区切りの文字であった場合でも、

アウトプットの入力形式が「リスト」ではない場合、下記オペレーションで利用できません。

なお、OCRを含むAI機能では、アウトプットの入力形式を変更できません。

  • 同じ処理を繰り返す

  • リスト型のアウトプットを個々のアウトプットに分割する

以上、OCRのAIモデルの違いの説明です。

#ocr,AI,AIモデル,ChatGPT,claude,Claude,claude_v2,Claude_v2

こちらの回答で解決しましたか?