研究ページの読み込み

しばらくお待ちください...

Research / Graduation Thesis

協調型マルチエージェントプラットフォームに関する研究

Web操作・IoT制御・知識検索・スケジュール管理を統合し, 曖昧な自然言語指示でも実行可能な形に変換して動く自律型システムを,設計から実装・評価まで一貫して開発しました。

LangGraph MCP RAG Docker Flask / REST API Jetson / Raspberry Pi

研究プレゼン資料

英語版スライド: NCSP-Presentation-EN.pptx

プレゼンを見る

30秒でわかる研究概要

解いた課題

「いつものようにやっておいて」のような曖昧指示を,WebとIoTをまたいで実行する仕組みを構築。

アーキテクチャ

メモリ付きオーケストレータ+4専門エージェント(Browser / IoT / Life-Style / Scheduler)を統合。

実装の強み

Plan→Execute→Review の自己修正ループで,失敗時の再試行まで含めた堅牢な実行フローを設計。

独自性

MCPで機能を標準化し,クラウドLLMとエッジLLMを使い分ける階層推論を実装。

定量成果(卒業論文の評価結果)

指標 結果 アピールポイント
統合スコア(10シナリオ) 15点(メモリなし)→ 平均25.0点(メモリあり) 約1.7倍改善(+67%)
追加質問回数 ベースライン合計2回 → メモリあり3ケース合計0回 ユーザー負担を削減
エッジ推論速度 CPU 9.64 tok/s → GPU 24.76 tok/s 約2.57倍の高速化
パーソナライズ例 住所・アレルギー・嗜好を参照し,検索/提案/予定登録を自動実行 実利用に近い文脈理解を実証

就職向けアピール(担当したこと)

  • 要件定義: 曖昧指示を実行可能タスクへ変換するため,メモリ参照を前提にしたデータフローを設計。
  • バックエンド実装: 各エージェントをREST APIで疎結合化し,Docker上でマイクロサービス運用。
  • 信頼性設計: 実行結果を評価し再試行する自己修正ループを導入し,失敗を前提にした実行制御を実装。
  • AI実装: Function Calling / RAG / モデル切替を組み合わせ,精度とコストのバランスを最適化。
  • 性能検証: 単体評価+統合評価(10シナリオ)で,改善幅を数値で検証し再現可能な形で報告。

技術スタックと実務で活かせる力

AI / エージェント

LangGraph, MCP, Function Calling, RAG (LangChain + FAISS), 動的モデルルーティング。

バックエンド / インフラ

Python, Flask, REST API, SSE, SQLite, Docker, 非同期ジョブキュー, Chrome CDP。

エッジ連携

Jetson Orin Nano / Raspberry Pi 4 / Raspberry Pi Pico W と連携し,クラウドと役割分担。

実務で活きる能力

曖昧要件の構造化,API設計,評価設計,性能改善,課題分析まで一気通貫で推進。

課題認識と改善方針

  • 知識カットオフによる日時認識ズレに対して,タスクごとのタイムスタンプ強制付与を提案。
  • 複雑なWeb UI操作の失敗に対して,DOM解析に加えて画面理解(マルチモーダル)導入を計画。
  • 精度だけでなく,再現性・運用性・コストを含めて改善サイクルを回す設計思想を重視。

研究のビジュアルまとめ

協調型マルチエージェントプラットフォームの全体アーキテクチャ

全体構成図: オーケストレータがメモリと4つの専門エージェントを連携し、E2Eでタスクを完了します。

長期・短期メモリの設計図

メモリシステム

長期メモリと短期メモリを分離し、ユーザー文脈に応じたパーソナライズを実現。

研究で接続したエッジデバイスの例

エッジデバイス例

Jetson / Raspberry Pi を統合し、共通インターフェースで制御。

専門エージェント

Web操作を行うBrowserエージェント

Browser Agent

検索・閲覧・フォーム操作など、Web UIを自律実行。

デバイス制御を担当するIoTエージェント

IoT Agent

自然言語の指示を、デバイス固有コマンドへ変換して実行。

RAGで知識検索を行うLife-Styleエージェント

Life-Style Agent

RAGで根拠付きの生活支援回答を生成。

予定管理を担当するSchedulerエージェント

Scheduler Agent

自然言語で予定追加・更新・ルーティン管理を実行。