Retrospective Harness Optimization: ラベル不要のエージェント自己進化手法
AIエージェントが複雑なタスクを解決する際、ツールやプロンプト、スキル、ワークフローの集合体である「ハーネス(Harness)」の継続的な改善が欠かせません。しかし、既存の最適化手法には大きな課題があります。それは、最適 […]
Physics Is All You Need?~ AIエージェントは「答え」を最適化するが、「真理」は探究できない~
AI技術が飛躍的に進歩する中、「AIは科学研究のパートナーになれるのか?」と考える方も多いのではないでしょうか。しかし、科学的ソフトウェアの開発においては、単に「テストを通過する」ことではなく、「物理法則と一致しているか […]
SkillOpt: AIエージェントのスキルを最適化するための手法
最近、LLM(大規模言語モデル)を自律的なエージェントとして活用するケースが増えてきました。エージェントに特定のタスクを遂行させる際、自然言語で書かれた「スキル(指示書や手順書)」を与えるアプローチが一般的です。しかしな […]
LLMの量子化がもたらす「アライメントの崩壊」
LLM(大規模言語モデル)をクラウドやエッジ環境で実運用する際、推論コストやメモリ使用量を削減するための「量子化」は欠かせない技術です。しかし、実社会のハイステークスな領域への適用が進むにつれ、量子化がハルシネーションや […]
Code as Agent Harness: AIエージェントを自律駆動させるためのアーキテクチャ
LLM(大規模言語モデル)の進化により、AIエージェントの開発が急速に進んでいます。しかし、複雑なタスクを長期間にわたって自律的に実行させるには、自然言語による指示だけでは限界があります。 現在、LLMにとって「コード」 […]
MinT: LLMを効率的に管理する次世代インフラ
近年、LLM(大規模言語モデル)の運用において、タスクやユーザーごとにモデルを微調整してデプロイする機会が増加しています。しかし、細分化されたバリアントごとにフルサイズのチェックポイントをコピーしたり移動させたりする従来 […]
AstroAlertBench: マルチモーダルLLMによる天体分類の現在地
現在の天文学の最前線では、ZTF (Zwicky Transient Facility) などの大規模な観測プロジェクトによって、毎晩数百万件もの天文アラート(突発天体などの観測通知)が生成されています。しかし、データ量 […]
Ctx2Skill: 自律的なコンテキスト学習の実現
LLM(大規模言語モデル)に独自のドキュメントや複雑なデータを読み込ませ、特定のタスクを解かせたいと考えたことはありませんか? LLMが未知のコンテキスト(背景情報)からルールを読み取り、自ら推論を実施する能力は「コンテ […]
ExecuTorch: モバイル・エッジデイバス向けAI推論の事始め
モバイル端末やエッジデバイス上でAIを動かす「オンデバイス推論」が近年注目を集めています。これまで、PyTorchで構築したモデルをエッジデバイスで展開する際は、主にTorchScriptベースの「PyTorch Mob […]
RecursiveMAS: 潜在空間の再帰による次世代マルチエージェント協調
現在、マルチエージェントシステム(MAS)において、エージェント間で「テキスト」を介して情報をやり取りする手法が一般的ですが、これが推論レイテンシ(遅延)を増大させる主な要因となっています。他のエージェントのテキスト出力 […]