RESOURCE2SKILL: チュートリアルからAIエージェントのスキルへ

LLMエージェントに求められる役割は、質問に答えることから、スライド作成やスプレッドシート編集、3Dシーンの構築、CAD設計、音楽制作まで、実際にソフトウェアを操作して成果物を仕上げることへと広がっています。こうしたタス […]

SkillSight：AIエージェントのスキル検索精度を劇的に向上させる

エージェントが利用できるスキル（ツールやAPI、手順書などのドキュメント）は、SRA-Benchで約26,000件、SkillBench-Suppでは約77,000件におよびます。これほど大規模になると、膨大な選択肢から […]

近年、LLMベースのエージェントにおいて、自らのプロンプトやガードレールを修正し自己改善を進める「自動ハーネス最適化 (Automated Harness Optimization)」の導入が進んでいます。しかし、「観察 […]

現代のAIエージェントの能力は、基盤モデル単体の性能だけで決まるわけではありません。プロンプトの構築、状態の管理、そしてツールの呼び出しなどを統制する「ハーネス（Harness）」と呼ばれる実行基盤が重要な役割を担ってい […]

研究論文の執筆後、ポスターや動画、ブログ記事を作成する作業に負担を感じたことはありませんか？このような研究発表の「ラストマイル」を自動化するシステムには、これまで3つの大きな課題がありました。 1つ目は成果物ごとに独立し […]

現代の天文学は、Vera C. Rubin天文台やRoman宇宙望遠鏡などに代表される次世代の観測サーベイの稼働により、かつてない規模のデータ主導型科学へと急激に移行しています。こうした膨大なデータを前にして、従来の解析 […]

近年、LLMベースのエージェントは単なる受動的な質問応答から、自律的に環境を認識し、長期的なタスクを完遂するシステムへと移行しています。このような機能的要件を満たすため、現在のエージェントは「認知エンジン」である基盤モデ […]

近年、LLMエージェントの開発が盛んに進められていますが、現在の研究は現在の状態から次の行動を決定する「方策（Policy）」の改善にほぼ限定されています。しかし、汎用的なエージェントを実現するためには、行動によって環境 […]

観測データから物理法則や数学的関係式を導き出すシンボリック回帰（SR: Symbolic Regression）をご存知でしょうか？従来の手法では、探索空間の組み合わせ爆発や、事前知識をシステムに組み込む難しさが長年の課 […]

現代のAI開発において、LLM（大規模言語モデル）の進化は目覚ましいものがあります。しかし、実用的なAIエージェントを構築する際、基盤モデル単体の性能だけでは不十分です。エージェントの能力を引き出すには、プロンプト、ツー […]