tsumiki-media logo

tsumiki-media

Command Palette

Search for a command to run...

AWSサービス比較
約14分
初級+
5/10
2025年9月17日

AWS AIF-C01 対策 Textract vs Kendra

Amazon TextractとAmazon Kendraの違いを理解し、文書処理要件に応じて適切なサービスを選択するための完全ガイド。実践的な問題を通じて使い分けのポイントを解説します。

この記事のポイント

  • 1
    TextractとKendraの基本的な違いを理解する
  • 2
    各文書処理サービスの適用場面と選択基準を把握する
  • 3
    資格試験の問題を通じて使い分けのポイントを理解する

目次

2つの文書処理サービスの違い

Amazon Textract(文書読み取り)とAmazon Kendra(エンタープライズ検索)は、それぞれ異なる文書処理段階を担当するAWSのAI/MLサービスです。

Textract文書からテキストを抽出し、Kendra抽出済みデータの検索・発見を行います。

Icon-Architecture/48/Arch_Amazon-Textract_48

Amazon Textract

主な機能
OCR・文書データ抽出
主な用途
PDF/画像からテキスト抽出、フォーム処理
対応文書形式
PDF、JPEG、PNG、TIFF
処理方式
バッチ・リアルタイム処理
高度な機能
テーブル抽出、フォーム分析、医療文書対応
一般的な統合先
Comprehend、Lambda、Step Functions
Icon-Architecture/48/Arch_Amazon-Kendra_48

Amazon Kendra

主な機能
エンタープライズ検索・情報発見
主な用途
企業文書検索、知識管理、Q&Aシステム
対応文書形式
PDF、HTML、Word、PowerPoint、テキスト
処理方式
インデックス作成後の検索
高度な機能
自然言語クエリ、ML推奨、ランキング学習
一般的な統合先
Bedrock、OpenSearch、S3
ベストプラクティス

金融サービス企業のチャットボット開発では、検索拡張生成(RAG)アーキテクチャを実装し、Amazon KendraOpenSearchをベクトルデータベースとして統合することで、既存のBedrockモデルを活用しながら社内の投資戦略レポートや規制コンプライアンスガイドラインなど最新の専門情報を動的に参照できる正確な回答システムを構築できます。

ベストプラクティス

医療機関での大量文書デジタル化では、Amazon Textractの機械学習ベースのOCR技術が手書き文字認識と文書構造理解を同時に実現し、患者の紹介状や処方箋の表・フォームから構造化データを自動抽出できるため、非同期APIによる数千件の並列処理と合わせて選択されます。

実践問題で確認

前セクションで学んだ内容を、AWS資格試験対策で確認してみましょう。ここでは、TextractとKendraの使い分けが問われる代表的な問題パターンを3つのカテゴリに分けて解説します。

各問題では、文書処理の段階を正しく判断し、最適解を導出する思考プロセスを体験できます。

AWS認定AIプラクティショナー

練習問題

金融サービス企業が、顧客向けの投資アドバイスを提供するためのチャットボットを開発しています。このボットは、一般的な市場知識に加えて、会社独自の投資戦略レポート、分析資料、規制コンプライアンスガイドラインなど、専門的で最新の社内情報を活用する必要があります。 企業は、Amazon Bedrockを使用してチャットボットの基礎となる大規模言語モデル(LLM)をデプロイしました。しかし、モデルは社内文書の知識を持っておらず、時折古い情報や不正確な回答を提供することがあります。 この問題に対する最適な解決策は何ですか?

AWS認定AIプラクティショナー

練習問題

医療機関が患者の紹介状、処方箋、検査結果などの手書き文書を含む何千もの医療記録からテキストを抽出し、デジタル化するソリューションを必要としています。これらの文書には手書きメモ、表、フォームなど様々な形式が含まれています。 この要件に最も適したAWS機械学習サービスはどれですか?

AWS認定AIプラクティショナー

練習問題

法律事務所が、大量の法的文書と契約書のデジタル化プロジェクトを実施しています。このプロジェクトでは、スキャンした文書からテキストを自動抽出し、そのコンテンツを検索可能にし、特定の法的概念や条項を特定できるようにする必要があります。また、法律専門家が自然言語で質問を行い、関連する文書や情報をすぐに見つけられるようにすることも求められています。 これらの要件を満たすためにどのAWSサービスを組み合わせるべきですか?(2つ選択)

まとめ

AWS文書処理サービスの選択では、TextractKendraの処理段階の違いを理解した適切な判断が成功の鍵となります。

文書からテキストデータを抽出するサービスです。OCR機能テーブル・フォーム抽出医療文書対応などの機能を提供し、PDF処理、文書デジタル化、データ入力自動化などの用途に最適です。

既存データから情報を検索・発見するサービスです。自然言語クエリML推奨機能ランキング学習などの機能を提供し、企業知識管理、Q&Aシステム、文書検索システムなどの用途に最適です。

文書処理の段階(データ抽出 vs 情報検索)を最初に確認し、次に具体的な機能要件(OCR、PII検出、ベクトル検索等)を判断します。データ抽出にはTextract情報検索にはKendra選択するのが基本原則です。

これらの判断基準を理解し、処理段階→具体的な機能要件→統合パターンの順で論理的に分析することで、適切な文書処理サービス選択ができます。

理解度チェック

TextractとKendraの文書処理段階の違いは?

PDF文書からテキストを抽出したい場合、どちらを選択すべきか?

企業文書の検索システムを構築したい場合、どちらを選択すべきか?

医療文書の自動処理システムを構築する場合の適切なサービス組み合わせは?

他の問題も解いてみませんか?

tsumikiでは、AWS認定試験の合格に必要な知識を体系的に学習できます。実践的な問題を通じて、AWSスキルを身につけましょう。