Ctx2Skill: 自律的なコンテキスト学習の実現

LLM(大規模言語モデル)に独自のドキュメントや複雑なデータを読み込ませ、特定のタスクを解かせたいと考えたことはありませんか? LLMが未知のコンテキスト(背景情報)からルールを読み取り、自ら推論を実施する能力は「コンテ […]

RecursiveMAS: 潜在空間の再帰による次世代マルチエージェント協調

現在、マルチエージェントシステム(MAS)において、エージェント間で「テキスト」を介して情報をやり取りする手法が一般的ですが、これが推論レイテンシ(遅延)を増大させる主な要因となっています。他のエージェントのテキスト出力 […]

Skills-Coach: LLMエージェントスキルの自動進化フレームワーク

LLMベースのエージェント開発において、「スキル」は特定のタスクを実行するための機能拡張モジュールとして広く利用されています。しかし、現状のスキルエコシステムには大きな課題があります。個々のスキルが局所的な問題解決に特化 […]

SWE-chat: 実際の開発者はAIコーディングエージェントをどう使っているのか?

AIコーディングエージェントが急速に普及していますが、実際の開発現場ではどのように使われているのでしょうか?この記事では、現実の利用実態を分析した初の大規模データセット「SWE-chat」から、実践的なインサイトを紹介し […]

Tool-Overuse: なぜLLMは内部知識よりも外部ツールを好むのか?

最近、LLMを利用したシステムを開発する中で、「内部知識で答えられるはずの簡単な質問なのに、なぜか外部APIを叩いてレスポンスが遅くなっている」と感じたことはないでしょうか? LLMが外部ツールを呼び出して問題を解決する […]

宇宙物理学研究の新たなパラダイム: AIサイエンティストと Human-in-the-Loop

現代の宇宙物理学におけるデータ解析は、データ表現やモデルの構造、最適化戦略といった高次元の「方法論的設計空間」を人間が網羅的に探索することが困難になっています。そのため、大規模言語モデル(LLM)を活用した自律型エージェ […]

Meta-Harness: AIエージェントの性能を引き出す最適化手法

大規模言語モデル(LLM)を活用したシステムを開発していると、「モデル単体は高性能なのに、システムに組み込むと思うように精度が出ない」という壁にぶつかることがよくあります。これは、システムの最終的な性能が、モデルの重みそ […]

バイブコーディングのリアル: ソフトウェア開発におけるAI活用の罠と対策

自然言語でAIと対話しながらコードを生成する「Vibe Coding(バイブコーディング)」。Claude CodeやGemini CLIといったコーディングエージェントの登場により、プロトタイピングの開発速度は劇的に向 […]

Intent Formalization: AI時代の信頼できる開発

近年、「Vibe coding」に代表される、自然言語で要件を伝えてAIが生成したコードをそのまま受け入れる開発スタイルが普及しつつあります。AIコーディングツールは高速でコードを出力します。ですが、ここで大きな問題とな […]

Agentic Code Reasoning: 構造化された準形式的推論の威力

大規模言語モデル(LLM)を活用したコーディングエージェントが普及する中、コードを実際に実行することなく、その意味や振る舞いを正確に読み解く「Agentic Code Reasoning(エージェントによるコード推論)」 […]