OCR・画像認証 ベンチマーク
PDFまたは画像ファイルから情報を抽出します
ドキュメント詳細
ファイル情報
| ファイル名: | bond_jp_sample_ocr_1page.png |
|---|---|
| ファイルタイプ: | 画像 |
| アップロード日時: | 2025年10月14日 02:30:08 |
| 解析状況: | 完了 |
| 解析完了日時: | 2025年10月14日 02:32:12 |
指示プロンプト
あなたは銀行の審査部門に所属する「債券書類チェック担当者」です。
これから提示される書類(画像またはPDF)は、債券に関する正式な契約・発行・担保関連資料です。
あなたの唯一の目的は、**文書の内容を正確に文字起こし(テキスト化)すること**です。
推測・意訳・要約・整形・校正は一切行わず、**原文の表記・改行・記号・数字をそのまま再現**してください。
---
### 指示ルール
1. **原文忠実主義**
- 句読点、改行位置、空白、インデント、括弧、段落番号などを可能な限り維持。
- 文字が不鮮明・欠損している場合は推測せず、 `[不明]` と表記する。
- 読めない単語が連続している場合は `[不明×3]` のように回数を記載。
2. **項目保持**
- 書類中の章・条・節・箇条番号は必ず残す(例:第1条、第2項など)。
- 債券の種類、発行体名、日付、金額、条件等の固有名詞は一字一句正確に記録。
3. **特殊表記**
- 判子や署名欄がある場合は `[印影]`, `[署名欄]` などと明示。
- 図表・表形式部分は以下のように構造化:
```
───────────────
表:償還条件一覧
年度|償還額|残高
2025|100,000,000|900,000,000
───────────────
```
- 改ページは `[PAGE BREAK]` と記載。
4. **禁止事項**
- 書類の要約・翻訳・意味解釈・チェック・分類は行わない。
- 書類の一部を省略してはならない。
- 改行や句点を自動補完しない。
5. **出力形式**
- テキスト全体をコードブロック内に収める(例:```text ... ```)。
- 書類名とページ数がわかる場合はヘッダとして明示:
```
=== 債券発行条件書(1/3ページ) ===
```
- 複数ページある場合はページごとに区切って出力。
---
### あなたの目的
> 書類内容を100%忠実に文字データ化すること。
> 意味を理解したり、リスクを分析したりしてはいけない。
> すべての文字を「正確に」再現することを最優先とする。
処理時間の比較
Tesseract OCR
12.40秒
completedGPT-4o
26.49秒
completedGPT-4-turbo
41.45秒
completedGemini 2.0 Flash Exp
8.68秒
completedClaude 3 Opus
34.69秒
completed認識結果の比較
Tesseract OCR 抽出結果
文字数: 2822 文字
画像ファイル情報: 形式: PNG サイズ: (2880, 2122) モード: RGBA === OCR抽出結果(Tesseract) === [日本語認識] 債券目論見書 (サンプル) 一 OCRテスト用 この文書はOCR (光学式文字認識) の検証を目的としたダミーの目論見書サンプルです。 記載内容 (発行体名、ISIN、日付、金額、条項等) はすべて架空の情報であり、投資判断に用いることはできません。 1. 募集要項 (抜粋) 銘柄 年3.259% サンプル社債 2035年満期 発行体 サンプル・ホールディングス株式会社 ISIN / Common Code JP00XXXXXXX1 / 000000000 額面・発行額 USD 200,000 (最低売買単位) プ総額 USD 500,000,000 発行価格 額面の 99.756% 利率・利払日 年3.25% (毎年1月15日・7月15日 後払い) 償選日 2035年1月15日 (満期一括償本) 早期償寅条項 Make-whole、税制事由による繰上償二 等 受託者 (社債管理者) サンプル信託株式会社 払込取扱機関 サンプル銀行 ロンドン支店 清算機関 Euroclear / Clearstream, Luxembourg 上場予定 サンプル証券取引所 (規制市場・予定) 準拠法 英国法 (予定) 発行日 2025-10-08 2. 重要な注意事項 本サンプルには、投資家保護の観点から通常の目論見書に含まれる情報項目 (リスク要因、税務、財務情報、資金使途、コベナンツ、早期償還、イベント・オブ・デフォルト、販売制限 等) の一部を簡略化して記載しています。 虚偽記載・不実表示等に関する責任、並びに継続開示義務は本サンプルには適用されません。 3. リスク要因 (例示) ・① 金利リスク : 市場金利の変動により社債価格が上下する可能性があります。 ・③② 信用リスク : 発行体の財務状況の悪化により元利金の支払が行われないおそれがあります。 ・③ 流動性リスク : 流通市場が十分に形成されず、希望時に売買できない場合があります。 ・④ 為替リスク : USD建てのため、円換算額は為替相場の影響を受けます。 | | バ こ影響 い 。 3 昌和82998PRM5E科888 を %抽務才ギリー呆本】 上期2024 785.5 112.2 880。 7 82.9 ※本PDFはOCR動作確認のためのダミーです。 実在の団体・証券とは一切関係ありません。 フォント: /usr/share/fonts/opentype/noto/NotoSansCJK-Bold.ttc [英語認識] fas Bima (YY TIL) —OCRTFZAKB COMBISOCR (HFA Fat) ORAZANCLELAS-OBRMREYY TICS. eRAR (HATHA, ISIN, Aft. BH. RIS) STN TREOGMTHO. RAMMICHUSCCISTEECA,. 1.32218 (ik) Sti $F3.25% YY TILL 203556 GHA FAT GUT: K-NWF 4 VI RRNA ISIN / Common Code JPOOXXXXXXX1 / 000000000 aH ° 4TH USD 200,000 (RiRsc RR) #828 USD 500,000,000 FT hs #AI® 99.756% A + FILA 63.25% (#471158 * 715 thu) a8 2035421F15A (jmHA—tE(Ri2) RARE RIA Make-whole, #islSHlc & SRL S Site (tas) YU TIME HAMStt PIA RRS PUT IMRT OY RY Re eK Euroclear / Clearstream, Luxembourg ba Fie DUT IVEES ASIP (HBTS + FE) eK RE (FE) 3478 2025-10-08 2. BEGTES AYYTIICld, RARREORAD SHEORRRBIAENSRAR (UATER. HR. MB. ASR. INTUY, SH. TAU RAT FI AIL. ARTS |) O—Be MILL THMLTWNES. HAIR FRATSICMS SAE. MUCMRATBBSRY Y TIVICMBAENEtA, 3. UAZTBA (fm) “OBHNUAT : PHEMORHICE OMA MALES SAREDSO ET. *@BUAZ : MIAOMBRROREK dOTMSORUDTONGUSTENMSOES. ORE UAT : TEBEATOICERMENS. BBICBATCECUBAMHO ET. *@ ABU AZ : USDETORO. ARBAB OREERIES. | ! \ =e ‘ 5 ad Wc BP ALGAE OA RDAASEESS RACRIED? *7 eee: sGuBEAPy — OaRRRIRETE) £52024 785.5 112.2 "760. 7 82.9 X<ASPDFISOCREN FERED LOORS—TI. REOMMA + sks CS-MARS O SHA. 2724+: /usr/share/fonts/opentype/noto/NotoSansCJK-Bold.ttc
GPT-4o 解析結果
文字数: 1148 文字
適合率:
69.11%
```text
=== 債券目論見書(サンプル) — OCRテスト用(1/1ページ) ===
この文書はOCR(光学式文字認識)の検証を目的としたダミーの目論見書サンプルです。記載内容(発行体名、ISIN、日付、金額、条項等)はすべて架空の情報であり、投資判断に用いることはできません。
1. 募集要項(抜粋)
銘柄 年3.25% サンプル社債 2035年満期
発行体 サンプル・ホールディングズ株式会社
ISIN / Common Code JP0000XXXXXX / 0000000000
発行額・発行額 USD 200,000(最低売買単位)/ 総額 USD 500,000,000
発行価格 額面の99.756%
利率 年3.25% (毎年1月15日・7月15日 後払い)
償還期日 2035年1月15日 (満期一括償還)
早期償還事項 Make-whole、税制事情による繰上償還 等
受託者(社債管理者) サンプル信託株式会社
払込取扱機関 サンプル銀行ロンドン支店
保管機関 Euroclear / Clearstream, Luxembourg
上場予定 サンプル証券取引所(規制市場・予定)
準拠法 英国法(予定)
発行日 2025-10-08
2. 重要な注意事項
本サンプルには、投資家保護の観点から通常の目論見書に含まれる情報項目(リスク要因、税務、財務情報、資金使途、コベナンツ、早期償還、イベント・オブ・デフォルト、販売制限等)の一部を簡略化して記載しています。本書の虚偽・不実表示等に関する責任、並びに継続開示業務は本サンプルには適用されません。
3. リスク要因(例示)
1. 金利リスク:市場金利の変動により社債価格が上下する可能性があります。
2. 信用リスク:発行体の財務状況の悪化により元利金の支払が行われないおそれがあります。
3. 流動性リスク:流動性が十分に形成されず、希望時に売買できない場合があります。
4. 為替リスク:USD建てのため、為替変動により為替差損益の影響を受けます。
* 極端な為替変動により元本を大きく下回る影響を与える可能性があります。
* 実施例:円転換レート:USD/JPY 120.00 (USD/日月時) FCF(USD/日月時)
───────────────
表:為替変動リスク指標例
上限204.78 5.1% 下限 154.12 3.2% 基準 82.9
───────────────
フォントサイズや文書間隔のための参考データで、精査され、一字一句適用されます。
外部利用禁止
```
GPT-4-turbo 解析結果
文字数: 1159 文字
適合率:
61.34%
```text
債券発行書類(サンプル) — OCRテスト用
この文書はOCR(光文字認識技術)の検証を目的としたダミーの固定利付サンプルです。実際や契約条件、ISIN、日付、金額、名前等)はすべて架空の情報であり、投資判断に用いることはできません。
1. 約款要項(抜粋)
銘柄 年率3.25% ナサリス社2035年債
発行体 サンプリオーナテック株式会社
ISIN / Common Code 99999999999999999999
額面・発行額 USD 200,000(額面最低単位)/総額 USD 500,000,000
発行価格 置換回 99.756%
利率・利回日 年3.25% (毎月1日15日/7月15日発効)
満期日 2035年1月15日(初回利回付吸収)
買戻条項類型 Make-whole、特別利益による補足早期償還
契約者(社債管理者) サンプリオ債権代表社
担保及び補助権利 サンプル借用ロンドン支店
清算機関 Euroclear / Clearstream, Luxembourg
上場予定 サンプル証券取引所(承認保留中・予定)
満期化 定期庫(予定)
発行日 2025-10-08
2. 本文書発信意義事項
サンプリオには、投資家保護の為から通常の目盛調達に含まれる情報提供(リスク要因、税務、効力確認、資金使途、コベナント、影響評価、イベント・オフ・デフォルト、財政制限等)の一部を瞬時化して提供しています。企画通覈・不実表示に関する責任、並びに意図的誤解誘導は本サンプリオには適用されません。
3. リスク要因(例示)
・全般リスク:市場環境の変動により債券価格が下がる可能性があります。
・信用リスク:発行体の財務状況の悪化により元利金の支払が行われないおそれがあります。
・流動性リスク:流通市場が十分に形成されず、希望時に売買できない場合があります。
・金利リスク:U.S.Dollar市場の金利の変動の影響を受けます。
※ 注意点:契約・約款・契約修正等で投資家が保障され復旧保証を与える可能性があります。
年度 利息(%USD年間) 利回り(円/$USD年間) 月CF(USD年間)
2021 1,235.4 14.7 110.8
2022 1,150 20.9 95.1
2019*1 13,508(財務早期リザーブ積立金に反映) 92.2
上記2024 787.5 112.2 860.7 82.9
```
Gemini 2.0 Flash Exp 解析結果
文字数: 1228 文字
適合率:
85.3%
```text === 債券目論見書(サンプル) === 債券目論見書(サンプル) - OCRテスト用 この文書はOCR(光学式文字認識)の検証を目的としたダミーの目論見書サンプルです。記載内容(発行体名、ISIN、日付、金額、条項等)はすべて架空の情報であり、投資判断に用いることはできません。 1. 募集要項(抜粋) 銘柄 年3.25% サンプル社債 2035年満期 発行体 サンプル・ホールディングス株式会社 ISIN / Common Code JP00XXXXXXX1 /000000000 額面・発行額 USD 200,000(最低売買単位) / 総額 USD 500,000,000 発行価格 額面の99.756% 利率・利払日 年3.25%(毎年1月15日・7月15日 後払い) 償還日 2035年1月15日(満期一括償還) 早期償還条項 Make-whole、税制事由による繰上償還等 受託者(社債管理者) サンプル信託株式会社 払込取扱機関 サンプル銀行 ロンドン支店 清算機関 Euroclear / Clearstream, Luxembourg 上場予定 サンプル証券取引所(規制市場・予定) 準拠法 英国法(予定) 発行日 2025-10-08 2. 重要な注意事項 本サンプルには、投資家保護の観点から通常の目論見書に含まれる情報項目(リスク要因、税務、財務情報、資金使途、コベナンツ、早期償還、イベント・オブ・デフォルト、販売制限 等)の一部を簡略化して記載しています。虚偽記載・不実表示等に関する責任、並びに継続開示義務は本サンプルには適用されません。 3. リスク要因(例示) ・①金利リスク: 市場金利の変動により社債価格が上下する可能性があります。 ・②信用リスク: 発行体の財務状況の悪化により元利金の支払が行われないおそれがあります。 ・③ 流動性リスク: 流通市場が十分に形成されず、希望時に売買できない場合があります。 ・④ 為替リスク: USD建てのため、円換算額は為替相場の影響を受けます。 ⑤税務・規制: 税制・規制の変更が投資家の収益に影響を与える可能性があります。 年度売上高(USD百万円) 営業利益(USD百万円) 純有利子負債(USD百万円) FCF (USD百万円) 2021 1,235.4 145.7 920.1 110.8 202参粥88(財務マリー905体 検証用】 上期2024 785.5 112.2 877.3 860.7 154.2 82.9 ※本PDFはOCR動作確認のためのダミーです。実在の団体・証券とは一切関係ありません。 フォント: /usr/share/fonts/opentype/noto/NotoSansCJK-Bold.ttc ```
Claude 3 Opus 解析結果
文字数: 1414 文字
適合率:
88.25%
``` === 債券目論見書(サンプル) - OCRテスト用 === この文書はOCR(光学式文字認識)の検証を目的としたダミーの目論見書サンプルです。記載内容(発行体名、ISIN、日付、金額、条項等)はすべて架空の情報であり、投資判断に用いることはできません。 1. 募集要項(抜粋) 銘柄 年3.25% サンプル社債 2035年満期 発行体 サンプル・ホールディングス株式会社 ISIN / Common Code JP00XXXXXXX1 / 000000000 額面・発行額 USD 200,000(額低発買単位)/総額 USD 500,000,000 発行価格 額面の 99.756% 利率・利払日 年3.25%(毎年1月15日・7月15日 後払い) 償還日 2035年1月15日(満期一括償還) 早期償還条項 Make-whole、税制事由による繰上償還 等 受託者(社債管理者) サンプル信託株式会社 払込取扱機関 サンプル銀行 ロンドン支店 清算機関 Euroclear / Clearstream, Luxembourg 上場予定 サンプル証券取引所(規制市場・予定) 準拠法 英国法(予定) 発行日 2025-10-08 2. 重要な注意事項 本サンプルには、投資家保護の観点から通常の目論見書に含まれる情報項目(リスク要因、税務、財務情報、資金使途、コベナンツ、早期償還、イベント・オブ・デフォルト、販売制限 等)の一部を簡略化して記載しています。虚偽記載・不実表示等に関する責任、並びに繰納期示義務はをサンプルには適用されません。 3. リスク要因(例示) ・①金利リスク:市場金利の変動により社債価格が上下する可能性があります。 ・②信用リスク:発行体の財務状況の悪化により元利金の支払が行われないおそれがあります。 ・③流動性リスク:流通市場が十分に形成されず、希望時に売買できない場合があります。 ・④為替リスク:USD建てのため、円換算額は為替相場の影響を受けます。 ※① 税務・規制・規制・利利の変更が投資家の収益に影響を与える可能性があります。 年度 売上高(USD百万円) 営業利益(USD百万円) 純利益(USD百万円) FCF(USD百万円) 2021 1,235.4 145.7 920.1 110.8 2022 1,585.6 216.2 1060.5 161.4 2023 1,810.8* 205.3* 871.3* 134.2 上期2024 785.5 112.2 860.7 82.9 (* 予測値) 本PDF はOCR操作確認のためのダミーです。実在の団体・証券とは一切関係ありません。 フォント: /usr/share/fonts/opentype/noto/NotoSansCJK-Bold.ttc ```
精度比較分析(5つのツール/モデル)
| 項目 | Tesseract OCR | GPT-4o | GPT-4-turbo | Gemini 2.0 Flash Exp | Claude 3 Opus |
|---|---|---|---|---|---|
| ステータス | completed | completed | completed | completed | completed |
| 処理時間 | 12.40 秒 | 26.49 秒 | 41.45 秒 | 8.68 秒 | 34.69 秒 |
| 抽出文字数 | 2822 文字 | 1148 文字 | 1159 文字 | 1228 文字 | 1414 文字 |
| 適合率 |
48.8% |
69.11% |
61.34% |
85.3% |
88.25% |
正解テキストと比較した適合率
OCR
48.8%
GPT-4o
69.11%
GPT-4-turbo
61.34%
Gemini 2.0 Flash Exp
85.3%
Claude 3 Opus
88.25%
正解テキスト:
債券目論見書(サンプル)— OCRテスト用 この文書はOCR(光学式文字認識)の検証を目的としたダミーの目論見書サンプルです。記載内容(発行体名、1. 募集要項(抜粋) 銘柄 年3.25% サンプル社債 2035年満期 発行体 サンプル・ホールディングス株式会社 ISIN / Common Code JP00XXXXXXX1 / 000000000 額面・発行額 USD 200,000(最低売買単位)/総額 USD 500,000,000 発行価格 額面の 99.756% 利率・利払日 年3.25%(毎年1月15日・7月15日 後払い) 償還日 2035年1月15日(満期一括償還) 早期償還条項 Make-whole、税制事由による繰上償還 等 受託者(社債管理者) サンプル信託株式会社 払込取扱機関 サンプル銀行 ロンドン支店 清算機関 Euroclear / Clearstream, Luxembourg 上場予定 サンプル証券取引所(規制市場・予定) 準拠法 英国法(予定) 発行日 2025-10-08 2. 重要な注意事項 本サンプルには、投資家保護の観点から通常の目論見書に含まれる情報項目(リスク要因、税務、財務情報、資等)の一部を簡略化して記載しています。虚偽記載・不実表示等に関する責任、並びに継続開示義務は本サンプ3. リスク要因(例示) ・① 金利リスク:市場金利の変動により社債価格が上下する可能性があります。 ・② 信用リスク:発行体の財務状況の悪化により元利金の支払が行われないおそれがあります。 ・③ 流動性リスク:流通市場が十分に形成されず、希望時に売買できない場合があります。 ・④ 為替リスク:USD建てのため、円換算額は為替相場の影響を受けます。 ・⑤ 税務・規制:税制・規制の変更が投資家の収益に影響を与える可能性があります。 4. 参考(財務サマリー・体裁検証用) ``` 年度 売上高(USD百万円) 営業利益(USD百万円) 純有利子負債(USD百万円) FCF(USD百万円) 2021 1,235.4 145.7 920.1 110.8 2022 1,388.2 169.3 905.6 128.4 2023 1,510.6 201.9 877.3 154.2 上期2024 785.5 112.2 860.7 82.9 ``` ※本PDFはOCR動作確認のためのダミーです。実在の団体・証券とは一切関係ありません。 フォント: /usr/share/fonts/opentype/noto/NotoSansCJK-Bold.ttc
精度評価のポイント
- 処理時間: より短い方が効率的
- 適合率: 80%以上で良好、60%以上で普通、60%未満で要改善
- 構造化: 生成AIは情報を整理して出力
- コスト: OCRは無料、生成AIはAPIコストが発生