Nebulaを公開しました: PDF・PPT・表・グラフをAIが使えるMarkdownへ
Ur AIは、PDF/PowerPoint、表、グラフ、財務資料などをLLMやRAGで使いやすいMarkdownへ変換するAI文書構造化プラットフォーム「Nebula」の初期公開版をリリースしました。
2026年5月1日、Ur AIは「Nebula」の初期公開版をリリースしました。Nebulaは、PDF、PowerPoint、画像、表、グラフ、財務資料などのビジネス文書を、AIが扱いやすいMarkdownへ変換する文書構造化プラットフォームです。
LLMはPDFでよく壊れます。正確に言えば、PDFの中に閉じ込められた「構造」を読めないときに壊れます。重要な業務情報は、きれいなテキストファイルではなく、決算資料、PPT、表、グラフ、注記、スキャン文書、フォルダに散らばった大量のPDFの中にあります。
OCRで文字を読むだけでは足りない
従来のOCRは、文字を読み取るための技術として発展してきました。しかし、LLM、RAG、エージェント、デューデリジェンスのワークフローで必要なのは、文字だけではありません。どの数字がどの列見出しに属するのか、グラフの系列が何を示しているのか、ページ同士がどうつながっているのか、どこからどこまでが一つのセクションなのか。こうした構造がなければ、AIは安定して推論できません。
財務表が単なる文字列に潰れると、数字だけは残っていても、その意味が失われます。グラフが抽出されなければ、プレゼン資料の主張そのものが抜け落ちます。ページ順や見出し階層が崩れれば、検索、要約、引用の品質も下がります。
Nebulaでできること
Nebulaは、PDF、一般的な画像形式、PowerPointファイルを、LLMやRAGで扱いやすい構造化Markdownへ変換します。単一ファイルのアップロードだけでなく、フォルダ単位のアップロード、非同期処理、ファイルごとのMarkdownダウンロード、構造化されたバッチ出力、複数文書をまとめたCombined Markdownの取得に対応しています。
実際の文書がMarkdownへ変換される様子は、Nebulaの製品ページにあるインタラクティブなサンプルギャラリーで確認できます。
- 経費・財務文書を、会計・照合ワークフローで扱いやすいMarkdownへ変換する。
- PDFやPPTを含むフォルダをバッチ処理し、ファイル境界を保ったまま出力できる。
- 表、グラフ、ページ文脈を、捨てられがちな視覚情報ではなく構造として残す。
- Combined Markdownにより、大量文書を下流のGenAIパイプラインへ渡しやすくする。
デューデリジェンスの現場から生まれた文書構造化
私たちはこの1年間、文書構造化の問題に深く取り組んできました。理由はシンプルで、デューデリジェンスにおいて文書の読み取り品質は土台そのものだからです。SpecterのようなM&Aデューデリジェンスプラットフォームでは、上位の分析が始まる前に、まず文書が正しく構造化されている必要があります。
Nebulaの考え方は明確です。入力が構造化されているほど、AIの出力は良くなります。OCRの見た目を整えることが目的ではありません。ビジネス文書に含まれる文脈を失わず、AIが実務で使える入力へ変換することが目的です。
国内処理とエンタープライズ利用を前提に
Nebulaは、SoftBankのGPUインフラ上で稼働し、Ur AIが調整したオープンソースモデルスタックを活用しています。顧客データは学習に使用しません。国内処理、データレジデンシー、監査可能性を、最初からエンタープライズ利用の前提として設計しています。
Ur AIはISO 27001認証を取得済みであり、SOC 2監査も進行中です。規制対応や高い信頼性が求められる環境でAI文書処理を検討するチームにとって、セキュリティとデータ管理は機能の一部です。
2026年5月15日まで無料トライアル
Nebulaの初期公開版は、2026年5月15日まで無料トライアルとして利用できます。PDF、PPT、表、グラフ、スキャン文書をGenAIワークフローで扱っている方は、ぜひ実際のファイルで試してみてください。どこで使えるか、どこで失敗するか、何が必要かを率直に教えていただけると嬉しいです。
Nebulaのベンチマークやモデルチューニングについては、今後さらに詳しく共有していきます。まずは実際の文書、実際の業務、実際のフィードバックを通じて、AIがビジネス文書を扱える状態を一緒に作っていきたいと考えています。
よくある質問
Nebulaとは何ですか
Nebulaは、PDF、PowerPoint、画像、表、グラフ、財務資料などのビジネス文書を、LLM、RAG、エージェント、デューデリジェンスで使いやすいMarkdownへ変換するUr AIのAI文書構造化プラットフォームです。
Nebulaはどのようなファイルやワークフローに対応していますか
Nebulaは、PDF、一般的な画像形式、PowerPointファイルに対応しています。単一ファイルだけでなくフォルダ単位のアップロードにも対応し、ファイルごとのMarkdown、構造化されたバッチ出力、複数文書をまとめたCombined Markdownを取得できます。
なぜ通常のOCRテキストではなく、構造化Markdownが重要なのですか
通常のOCRは文字を読むことには強くても、表の列関係、グラフの文脈、ページ順、財務ラベル、見出し階層を失いやすいです。LLMが正しく推論するには、単なる文字列ではなく、文書の構造ごと入力する必要があります。
アップロードしたデータは学習に使われますか
いいえ。Nebulaにアップロードされた顧客文書は学習には使用しません。Nebulaは国内処理、データレジデンシー、エンタープライズ利用を前提に設計されており、Ur AIはISO 27001認証を取得済みで、SOC 2監査も進行中です。
Nebulaは無料で試せますか
はい。今回の初期公開版では、2026年5月15日まで無料トライアルとして利用できます。PDFやPPTをGenAI、RAG、エージェント、デューデリジェンスで扱っているチームからのフィードバックを歓迎しています。

