記事一覧に戻る
AI・エージェント9

本番のLLMエージェント:デモが省く失敗モード

SoftPlex · エンジニアリング
2026年2月24日
#llm#agents#evaluation

デモはハッピーパスが中心です。本番では、不正な入力、古い検索コンテキスト、ユーザーに見せる挙動が定義されていないツールエラーが事故の多くを占めます。

エージェント計画では次の6領域を必須としています。可能な範囲の決定論的ルーティング、明示的なツール契約、トラフィックに応じて増やす評価セット、セッション単位のコスト上限、個人情報を考慮したログ、モデル経路と同頻度で試す人間エスカレーション経路。

これらに工数が載っていない計画は、本番チャネルではなく試作です。