Retrospective Harness Optimization: ラベル不要のエージェント自己進化手法

AIエージェントが複雑なタスクを解決する際、ツールやプロンプト、スキル、ワークフローの集合体である「ハーネス（Harness）」の継続的な改善が欠かせません。しかし、既存の最適化手法には大きな課題があります。それは、最適 […]

Physics Is All You Need？～ AIエージェントは「答え」を最適化するが、「真理」は探究できない～

AI技術が飛躍的に進歩する中、「AIは科学研究のパートナーになれるのか？」と考える方も多いのではないでしょうか。しかし、科学的ソフトウェアの開発においては、単に「テストを通過する」ことではなく、「物理法則と一致しているか […]

最近、LLM（大規模言語モデル）を自律的なエージェントとして活用するケースが増えてきました。エージェントに特定のタスクを遂行させる際、自然言語で書かれた「スキル（指示書や手順書）」を与えるアプローチが一般的です。しかしな […]

LLM（大規模言語モデル）をクラウドやエッジ環境で実運用する際、推論コストやメモリ使用量を削減するための「量子化」は欠かせない技術です。しかし、実社会のハイステークスな領域への適用が進むにつれ、量子化がハルシネーションや […]

LLM（大規模言語モデル）の進化により、AIエージェントの開発が急速に進んでいます。しかし、複雑なタスクを長期間にわたって自律的に実行させるには、自然言語による指示だけでは限界があります。現在、LLMにとって「コード」 […]

近年、LLM（大規模言語モデル）の運用において、タスクやユーザーごとにモデルを微調整してデプロイする機会が増加しています。しかし、細分化されたバリアントごとにフルサイズのチェックポイントをコピーしたり移動させたりする従来 […]

現在の天文学の最前線では、ZTF (Zwicky Transient Facility) などの大規模な観測プロジェクトによって、毎晩数百万件もの天文アラート（突発天体などの観測通知）が生成されています。しかし、データ量 […]

LLM（大規模言語モデル）に独自のドキュメントや複雑なデータを読み込ませ、特定のタスクを解かせたいと考えたことはありませんか？ LLMが未知のコンテキスト（背景情報）からルールを読み取り、自ら推論を実施する能力は「コンテ […]

現在、マルチエージェントシステム（MAS）において、エージェント間で「テキスト」を介して情報をやり取りする手法が一般的ですが、これが推論レイテンシ（遅延）を増大させる主な要因となっています。他のエージェントのテキスト出力 […]

LLMベースのエージェント開発において、「スキル」は特定のタスクを実行するための機能拡張モジュールとして広く利用されています。しかし、現状のスキルエコシステムには大きな課題があります。個々のスキルが局所的な問題解決に特化 […]