急速なデジタル化の進展により、企業は膨大な量の非構造化データを効率的に処理する新しい方法を模索するようになってきました。中でも、契約書、請求書、申し込み書類など、大量かつ多様な形式の文書を扱う分野では、従来の手動処理では対応が難しくなってきています。そこで注目されているのが、AIを活用した文書処理の自動化です。最近では、生成系AI(Generative AI)によって複雑な情報を理解し、文脈を踏まえた応答や分類が可能になり、新たな業務効率化の可能性が広がっています。
本記事では、ドイツを拠点とするITサービス企業 Onity Group (オニティ・グループ) が、Amazon Bedrock を活用してどのようにして複雑な文書処理の課題を解決し、ビジネスに真のインパクトを与えるインテリジェントなソリューションを開発したのかについてご紹介します。
Onity Groupとは?
Onity Group は、公共機関や大手企業に向けて IT コンサルティングやアプリケーション開発、AI ソリューションの導入支援を行っているテクノロジー企業です。彼らは、持続可能性とデジタル化を重視し、革新的な技術を用いて社会課題を解決することに注力しています。特に、公共サービスやインフラ運用に関連する書類や手続きを自動化することにより、業務の効率化と市民サービスの向上を目指しています。
彼らのクライアントである機関の一つは、年間数百万件に及ぶ紙ベースおよびデジタル形式の文書を処理しています。これらの文書には、構造が不明確で複雑な内容を含むものも多く、人手による確認や分類、情報の抽出に非常に時間とコストがかかっていました。こうした背景から、よりスマートかつスケーラブルな方法で文書処理を行う必要性が高まっていたのです。
課題:多様で複雑な文書を精度高く処理したい
Onity Group のプロジェクトが直面した主な課題は、以下の3点にまとめられます。
1. 膨大な量の文書処理:年間数百万件にのぼる文書を短期間で処理する必要があり、従来の手作業では非効率となっていました。
2. 文書構造の多様性:使用されるテンプレート、形式、言語がバラバラであり、事前に特定の構造に基づいて作られたルールベースのモデルでは対応できませんでした。
3. 文脈理解の重要性:文書内容の文脈を正しく把握し、適切なラベリングやカテゴリ分け、情報抽出を行うには、高度な文脈理解能力が求められました。
こうした課題に対応するため、Onity Group は柔軟かつ高精度の自然言語処理が可能な手法を探す中で、AWS の提供する「Amazon Bedrock」に注目しました。
Amazon Bedrockとは?
Amazon Bedrock は、AWS が提供するフルマネージド型のサービスで、主要な大規模言語モデル (LLM) を API を通じて簡単に活用できるプラットフォームです。Bedrock は、Anthropic、AI21 Labs、Stability AI、Amazon Titan などの複数のモデルを取り扱っており、用途に応じて最適なモデルを選定・統合することが可能です。
また、Amazon Bedrock を使うことで、インフラの管理やLLMのトレーニングといった煩雑な工程なしに、アプリケーションへのAI機能の組み込みを容易にし、開発者やエンジニアが効率的にAI機能を導入できるようになっています。
Onity Group のアプローチと技術的ソリューション
Onity Group は、Amazon Bedrock の力を活用して複雑な文書処理を自動化するためのエンドツーエンドのAIソリューションを構築しました。以下はその主な仕組みです。
1. 文書の取り込みと前処理
顧客から寄せられる文書は紙ベース・PDF・スキャン画像など、多様なフォーマットを含んでいました。まず、それらをAmazon Textract を利用して文字データとして抽出し、次工程に送ります。Textract はスキャン画像から文字を正確に識別し、配置や階層構造も含めて抽出できる強力なOCRエンジンです。
2. Amazon Bedrock による意味理解とデータ抽出
抽出された文章情報については、Amazon Bedrock 上で稼働するAnthropic社のClaudeモデルなどを利用して、文書の意味解析、コンテキストの理解、キー情報の抽出を実施しました。これにより、従来のルールベースでは難しかった文脈依存情報(例: 特定の条件が記載されている部分、日付や人物固有情報など)を的確に取り出せるようになりました。
例えば、ある文書が「転居による変更届け」であるか「新規申請」であるかを文面から自動判定したり、請求書から支払期日・金額・受取人情報などを高精度で抜き出すことが可能になります。
3. 人手との協業インタフェースの設計
完全自動化だけでなく、必要に応じて人手によるレビューが入るようなインターフェースも設計され、信頼性の高い処理フローを構築しました。これにより、AIによる処理に対して人が確認・補完するシナリオもスムーズに対応可能となっています。
4. 継続的な学習と改善
処理結果にフィードバックや修正があった場合は、その情報を元にモデルの改善サイクルを回す設計となっており、運用を続けるごとに精度が向上していく仕組みです。Bedrock のAPIベース設計により、モデルのバージョンアップや切り替えも容易に行うことが可能です。
得られた成果とインパクト
このAIドキュメント処理システムの導入により、顧客となる公共機関では以下のような具体的成果が得られました。
・処理時間の大幅削減:従来1件あたり数分を要していた処理が、平均して60%以上短縮されました。
・人的工数の削減:単純作業への人的関与が減り、スタッフはより付加価値の高い業務に集中できるようになります。
・業務品質と正確性の向上:モデルにより一貫したロジックで処理されるため、人為的ミスが大幅に削減されました。
・拡張性と柔軟性の確保:将来的に異なる文書タイプが登場しても、トレーニングなしですぐに対応が可能な仕組みとなっています。
なによりこのプロジェクトが社会的意義を持ったのは、公共サービスのバックエンド業務を効率化し、市民サービスの応答時間や品質を向上させることにつながった点にあります。行政など社会インフラのデジタル化を支える例として、多くの組織にとって参考となる事例と言えるでしょう。
企業にとっての学びと今後の展望
このプロジェクトから得られる示唆の一つは、「生成系AIを活用することで、ルールベースでは困難だった業務にも柔軟な対応が可能になる」という点です。特に、文書内の意味解釈や文脈理解が求められるタスクにおいては、大規模言語モデルの力が効果を発揮します。
また、Amazon Bedrock のようなマネージドサービスの活用により、自社でモデルを構築・運用するための専門的リソースを抱えなくても、迅速にプロジェクトを始動し、ビジネスに価値を届けられることも大きな利点です。
今後、オンプレミス環境との連携、自動翻訳との統合、匿名化処理との組み合わせなど、多様な拡張の可能性も考えられます。Onity Group では、今回の成功を機に、他のユースケース(例えば、ヘルスケア関連書類の処理やリーガル関連文書のレビューなど)への展開も模索しています。
まとめ
Onity Group の事例は、生成AIのビジネス活用の現在地と未来を示してくれる好例です。Amazon Bedrock に代表される生成AIサービスは、エンタープライズの実務に密着した形で進化しており、その実装はもはや大型テック企業に限られたものではありません。特に、多様かつ大量の文書を扱う分野では、こうしたテクノロジーの恩恵を受けることで、業務負荷を軽減し、正確かつ迅速なサービスを実現することが可能になります。
AI の可能性は、単なる技術革新の枠にとどまらず、企業や公共機関の業務プロセス、さらには社会全体のサービスのかたちを根本から変える力を持っています。私たち一人ひとりがこれからのAI活用のかたちを意識し、自身の業務やサービスにどう活かせるかを考えることが、未来への第一歩となるはずです。