Nebulaが解析できるファイル形式は?

現在はPDF、画像、PowerPointに加え、複数ファイルをまとめて1ジョブにするフォルダアップロードに対応します。フォルダ階層はマージ後の出力にも残ります。

Nebulaはどのモデルで動いていますか?

OpenAI GPT-5.2、Google Gemini 3.1 Pro、Anthropic Claude（SonnetとOpus）、および当社独自のファインチューニング済みビジョン言語モデルです。Nebulaは文書ごとに最適なモデルを選びます。

日本語文書の扱いは?

日本語は後付けではなく第一級の入力です。縦書き、縦組みレイアウト、日英混在ページ、手書き、日本語の業務グラフや表に対応します。

データはどこに保管される?

文書はエンタープライズのモデルプロバイダーを通じて各社のエンタープライズ規約のもとで処理され、モデルの学習には使用されません。ストレージはテナントごとに分離され、顧客ごとのAPIキーとジョブ単位の監査履歴により、アクセスはスコープされ、後から確認できます。

料金は従量制で、規制対応ワークロード向けには専用キャパシティのオプションもあります。扱う文書とボリュームを教えていただければ、一緒に見積もります。

あります。本番導入では、可用性SLA、文書クラス別の応答時間目標、専任サポートを含みます。専用キャパシティ契約では、追加のスループット保証も得られます。

エージェントや検索基盤のバックエンドに使えるか?

それが主要なユースケースです。Markdown出力はLLM取り込みを前提に設計され、JSON出力にはグラフデータ、読取順序、ページ構造が含まれます。バッチ出力はファイル境界を保持し、下流側で原典へのトレースができます。

Nebula

あなたのAIに、眼鏡を。

グラフ・表・ビジネス文書を、AIが実際に答えを導ける構造化データへ。

WebでNebulaを試す

APIでNebulaを試す

ローカル導入について相談

ご自身のファイルで無料でお試しいただけます。結果は数分で。

99%標準解像度の活字文書での精度

97%手書き数字での精度

92%複雑なグラフ・表での精度

精度とは、下流のLLM（GPT-5.4-mini または Gemini 3 Flash）が、Nebulaの変換出力から、人が原文を読むのと同じように質問へ正しく答えられた割合です。詳細な方法論レポートは近日公開予定です。

入力文書

100%

Nebula出力

＜参考：売上高営業利益率（ROS）の日米比較、株式指数の長期的傾向＞

{
  "type": "line",
  "data": {
    "labels": ["2007", "2008", "2009", "2010", "2011", "2012", "2013", "2014", "2015", "2016", "2017", "2018", "2019", "2020"],
    "datasets": [
      {
        "label": "日本",
        "data": [4, 2, 3, 3, 3, 4, 4, 5, 5, 6, 5, 5, 5, 5],
        "borderColor": "red",
        "fill": false
      },
      {
        "label": "アメリカ",
        "data": [10, 7, 8, 10, 9, 10, 10, 10, 11, 11, 11, 11, 11, 10],
        "borderColor": "blue",
        "fill": false
      }
    ]
  },
  "options": {
    "scales": {
      "y": {
        "title": {
          "display": true,
          "text": "%"
        },
        "beginAtZero": true,
        "ticks": {
          "stepSize": 2
        }
      },
      "x": {
        "title": {
          "display": true,
          "text": "（年度）"
        }
      }
    },
    "plugins": {
      "title": {
        "display": true,
        "text": "売上高営業利益率（ROS）の日米比較"
      },
      "legend": {
        "position": "top"
      }
    },
    "responsive": true,
    "maintainAspectRatio": false
  },
  "caption": "（注）日本はTOPIX500、アメリカはS&P500を対象。\n（出所）Bloomberg",
  "notes": "（備考）自己資本利益率(ROE)は、ROE = 売上高利益率(ROS) × 総資産回転率 × 財務レバレッジと分解できる。"
}

{
  "type": "table",
  "data": {
    "headers": ["", "1990年", "2022年", "倍率"],
    "rows": [
      ["日経平均", "23,849", "26,848", "1.1倍"],
      ["NYダウ", "2,634", "32,979", "13倍"],
      ["FT100（英）", "2,143", "7,545", "4倍"],
      ["DAX（独）", "1,398", "14,098", "10倍"],
      ["香港ハンセン", "3,025", "21,089", "7倍"],
      ["インドムンバイ", "1,048", "57,061", "54倍"],
      ["中国上海", "128", "3,047", "24倍"],
      ["ジャカルタ", "418", "7,229", "17倍"],
      ["タイSET", "613", "1,667", "3倍"]
    ]
  },
  "options": {
    "title": "株式指数の長期的動向（1990年と2022年の比較）",
    "footer": "（注）1990年は12月末、2022年は4月末の数値を使用。\n（出所）Investing.com"
  },
  "alignment": {
    "column \"1990年\"": "right",
    "column \"2022年\"": "right",
    "column \"倍率\"": "right"
  }
}

＜参考：企業の営業利益に対する設備投資、研究開発投資の比率＞

{
  "type": "line",
  "data": {
    "labels": ["2011", "2012", "2013", "2014", "2015", "2016", "2017", "2018"],
    "datasets": [
      {
        "label": "米国",
        "data": [100, 105, 110, 112, 115, 130, 128, 115],
        "borderColor": "brown",
        "fill": false
      },
      {
        "label": "日本",
        "data": [100, 100, 90, 88, 88, 88, 80, 85],
        "borderColor": "blue",
        "fill": false
      }
    ]
  },
  "options": {
    "scales": {
      "y": {
        "title": {
          "display": true,
          "text": ""
        },
        "beginAtZero": false,
        "ticks": {
          "stepSize": 10
        }
      },
      "x": {
        "title": {
          "display": true,
          "text": ""
        }
      }
    },
    "plugins": {
      "title": {
        "display": true,
        "text": "設備投資／営業利益"
      },
      "legend": {
        "position": "bottom"
      }
    },
    "responsive": true,
    "maintainAspectRatio": false
  },
  "caption": "",
  "notes": ""
}

{
  "type": "line",
  "data": {
    "labels": ["2011", "2012", "2013", "2014", "2015", "2016", "2017", "2018"],
    "datasets": [
      {
        "label": "米国",
        "data": [100, 100, 105, 107, 108, 120, 130, 131],
        "borderColor": "brown",
        "fill": false
      },
      {
        "label": "日本",
        "data": [100, 100, 88, 88, 88, 85, 74, 74],
        "borderColor": "blue",
        "fill": false
      }
    ]
  },
  "options": {
    "scales": {
      "y": {
        "title": {
          "display": true,
          "text": ""
        },
        "beginAtZero": false,
        "ticks": {
          "stepSize": 10
        }
      },
      "x": {
        "title": {
          "display": true,
          "text": ""
        }
      }
    },
    "plugins": {
      "title": {
        "display": true,
        "text": "研究開発投資／営業利益"
      },
      "legend": {
        "position": "bottom"
      }
    },
    "responsive": true,
    "maintainAspectRatio": false
  },
  "caption": "",
  "notes": "乖離は拡大傾向",
  "visual_annotations": [
    "[arrow: down gray] (from 131 to 74)"
  ]
}

図：財務省「法人企業統計」、経済産業省「企業活動基本調査」、U.S Census Bureau「Quarterly Financial Report」、National Science Foundation 「Business Research and Development and Innovation」を基に経済産業省作成 ※日本は年度、米国は暦年

2018年の研究開発投資／営業利益、日米の乖離は？

57ポイント（米国131・日本74）

AIが正しく答えられる

原文の該当箇所より

経済産業省「コーポレート・ガバナンス・システム」実務指針より — 1ページに3つの折れ線グラフと株式指数表を含む多要素ページ。各要素がChart.js互換JSONとして抽出されています。

課題

「見た目が正しい」ことと、「AIが使える」ことは別物です。

多くのOCRは、文書を見た目どおりにきれいなテキストへ変換することを目指しています。しかし、表の文字が正しく書き起こされていても、行と列の対応関係が崩れていれば、AIは正しい答えを導けません。Nebulaが最適化しているのは、下流のモデルがその出力をもとに、人が原文を読んだときと同じように、質問へ正しく答えられるかという指標です。

従来のOCR：見た目はきれい、でも答えられない

Segment Cloud 12 19 27 41 Services 8 9 11 14
（行と列が平文化）

「FY24のCloud売上は?」と尋ねても、答え（27）は数字の羅列に埋もれ、モデルは推測するしかありません。

Nebula：構造化され、答えられる

| Segment  | FY22 | FY23 | FY24 | FY25 |
| -------- | ---: | ---: | ---: | ---: |
| Cloud    |   12 |   19 |   27 |   41 |
| Services |    8 |    9 |   11 |   14 |

同じ質問でも、下流のLLMが正しく答えられます：FY24のCloud = 27。

難所をどう解くか

グラフはChart.js JSONへ。表は形を保ったまま。

文書を有用にしている構造をパースで失わないので、AIは平文ではなくデータを受け取れます。

グラフをデータ化

棒・折れ線・円グラフを構造化Chart.js JSONへ書き起こします。ラベル、系列、数値、軸の単位まで保持し、数値は数値のまま残します。

表構造を保持

行、列、結合セル、財務諸表の階層をパース後も保持し、脚注も落とさず残します。

Nebulaを導入する3つの方法

Webで試す。APIで組み込む。自社専用モデルとして導入する。

チームで使うWebプラットフォーム、業務フローに組み込むAPI、自社環境で運用するファインチューニング済みモデル。Nebulaは3つの導入方法に対応します。

Nebulaアプリ

ログインして、PDF・画像・フォルダ一式をドラッグするだけ。ページの処理を見ながら、グラフ対応のMarkdownとJSONをダウンロードできます。コードは不要です。

アップロードするだけ、設定不要
バッチ・フォルダアップロードに対応
MarkdownまたはJSONで取得

アプリを開く

Nebula API

署名付きアップロード、バッチ・フォルダジョブ、MarkdownまたはJSON出力に対応した非同期REST。RAGやエージェントのパイプラインに組み込めます。

非同期REST、署名付きアップロード
バッチ・フォルダジョブ
Markdown・JSON・両方

ジョブを作成

POST /v1/jobs
{
  "model_id": "nebula",
  "options": { "response_format": "both" }
}

OpenAPI仕様を見る

ローカル・ファインチューニング導入

機微性が高く、継続的に発生するエンタープライズAIワークロードを、自社で管理できるプライベートなモデルとして導入します。

お客様のアーキテクチャに合わせて設計
自社の文書領域に合わせてファインチューニング
オンプレミスまたはプライベート環境での運用に対応

お問い合わせ

エンタープライズモデル提供

APIの先へ。AIを支えるモデルを、自社環境に導入し、業務に合わせて調整する。

AIを全社で活用していく企業にとって、Nebulaは文書解析にとどまらず、ローカルモデルの導入、ルーティング、ファインチューニングまで含めて、自社のAI基盤づくりを支えます。

モデルルーティング

単一の統合ポイントから、タスクごとに最適なフロンティアモデルまたはファインチューニング済みモデルへ振り分けます。特定ベンダーに縛られない構成です。

ローカル・プライベートLLMの提供

機微性の高いワークロード向けに、お客様の環境内で動作するプライベートなローカルLLMを設計・導入します。

ドメインファインチューニング

自社の文書と業務領域に合わせてモデルを調整し、日常的なAIワークロードを自社で管理できる基盤上で動かします。

評価・統合ハーネス

モデルを既存システムに組み込み、answerability（答えられるか）を軸にした評価ハーネスで品質を継続的に測定します。

デプロイ形態、SLA、レイテンシは、お客様のアーキテクチャと契約条件ごとに個別に取り決めます。

お問い合わせ

評価方法論を見る

モデルと信頼

文書ごとに最適なモデルを、エンタープライズの管理のもとで。

Nebulaは、最先端のフロンティアビジョン言語モデルと当社独自のファインチューニング済みVLMへルーティングし、文書ごとに最適なモデルを選びます。文書はエンタープライズのモデルプロバイダーを通じて各社のエンタープライズ規約のもとで処理され、テナントごとに分離され、モデルの学習には使用されません。

文書ごとに最適なモデル

最先端のフロンティアビジョン言語モデルと当社独自のファインチューニング済みVLMへルーティングし、文書とレイアウトごとに最も強いモデルを選びます。

テナントごとの分離

アップロード、処理中の成果物、最終出力までテナントごとに分離し、顧客ごとのAPIキーで認証します。

モデルの学習には不使用

文書はエンタープライズのモデルプロバイダーを通じて各社のエンタープライズ規約のもとで処理され、モデルの学習には使用されません。

ジョブ単位の監査履歴

顧客ごとのAPIキーに加え、ジョブ単位で処理時間・ステータス・ページ別の結果を記録し、セキュリティと財務のレビューに使えます。

セキュリティと信頼

すべてのジョブにエンタープライズの管理を。

テナントごとのデータ分離
顧客ごとのAPIキー認証
ジョブ単位の監査履歴
文書はモデルの学習に使用しない
エンタープライズのモデルプロバイダーを通じて各社のエンタープライズ規約のもとで処理

ISO 27001認証を取得済みで、SOC 2およびGDPRへの準拠は対応を進めています。

ユースケース

多くの文書ワークフローを支える一つのレイヤー。

視覚的な文書に閉じ込められた業務知識を、RAG、エージェント、分析、下流のLLMパイプラインへ渡す場面でNebulaを使えます。

日本語の財務・開示文書

決算資料、ガバナンス資料、IRリリース、開示書類を、日本語特有のレイアウトを失わずに構造化AI入力へ変換します。

明細・請求書

発行元ごとに異なる明細やバックオフィス文書を、会計・照合エージェントが扱える正規化された明細データへ変換します。

役員会資料・プレゼン資料

PowerPoint由来のファイルから、スライド構造、文脈、表、グラフ系列を、視覚情報を平坦化せずに抽出します。

データルーム・RAG取り込み

大量の企業PDFを、検索、要約、デューデリジェンス、エージェントワークフローに渡せる状態へ整えます。

法務・規制対応コーパス

長い日本語法務PDFでも、脚注や引用を読取順序のまま保持して取り込めます。

建設・物流・小売

点検表、台帳、納品書、各種帳票を、業種をまたいで一貫した構造へ整えます。

FAQ

Nebulaに関するよくある質問。

Nebulaとは何か、文書をどう処理するか、データがどこに置かれるか、どう連携するかを確認できます。

Nebulaを試す

AIが答えを導ける文書を、AIに渡そう。

文書をアップロードすれば、数分でグラフ対応のMarkdownと構造化JSONを取得できます。パイプラインからはAPIで呼び出せます。

フロンティアと自社ファインチューニングの最適なVLMを文書ごとに使い分け

RAGとエージェント向けのMarkdown + 構造化JSON

日本語の財務・法務・業務文書に最適化

Nebulaを試す

お問い合わせ

あなたのAIに、眼鏡を。

「見た目が正しい」ことと、「AIが使える」ことは別物です。

グラフはChart.js JSONへ。表は形を保ったまま。

グラフをデータ化

表構造を保持

Webで試す。APIで組み込む。自社専用モデルとして導入する。

Nebulaアプリ

Nebula API

ローカル・ファインチューニング導入

APIの先へ。AIを支えるモデルを、自社環境に導入し、業務に合わせて調整する。

モデルルーティング

ローカル・プライベートLLMの提供

ドメインファインチューニング

評価・統合ハーネス

文書ごとに最適なモデルを、エンタープライズの管理のもとで。

多くの文書ワークフローを支える一つのレイヤー。

日本語の財務・開示文書

明細・請求書

役員会資料・プレゼン資料

データルーム・RAG取り込み

法務・規制対応コーパス

建設・物流・小売

Nebulaに関するよくある質問。

Nebulaが解析できるファイル形式は?

Nebulaはどのモデルで動いていますか?

日本語文書の扱いは?

データはどこに保管される?

料金体系は?

SLAはあるか?

エージェントや検索基盤のバックエンドに使えるか?

AIが答えを導ける文書を、AIに渡そう。