Ctx2Skill: 自律的なコンテキスト学習の実現
LLM(大規模言語モデル)に独自のドキュメントや複雑なデータを読み込ませ、特定のタスクを解かせたいと考えたことはありませんか? LLMが未知のコンテキスト(背景情報)からルールを読み取り、自ら推論を実施する能力は「コンテ […]
RecursiveMAS: 潜在空間の再帰による次世代マルチエージェント協調
現在、マルチエージェントシステム(MAS)において、エージェント間で「テキスト」を介して情報をやり取りする手法が一般的ですが、これが推論レイテンシ(遅延)を増大させる主な要因となっています。他のエージェントのテキスト出力 […]
Skills-Coach: LLMエージェントスキルの自動進化フレームワーク
LLMベースのエージェント開発において、「スキル」は特定のタスクを実行するための機能拡張モジュールとして広く利用されています。しかし、現状のスキルエコシステムには大きな課題があります。個々のスキルが局所的な問題解決に特化 […]
SWE-chat: 実際の開発者はAIコーディングエージェントをどう使っているのか?
AIコーディングエージェントが急速に普及していますが、実際の開発現場ではどのように使われているのでしょうか?この記事では、現実の利用実態を分析した初の大規模データセット「SWE-chat」から、実践的なインサイトを紹介し […]
Tool-Overuse: なぜLLMは内部知識よりも外部ツールを好むのか?
最近、LLMを利用したシステムを開発する中で、「内部知識で答えられるはずの簡単な質問なのに、なぜか外部APIを叩いてレスポンスが遅くなっている」と感じたことはないでしょうか? LLMが外部ツールを呼び出して問題を解決する […]
BERT-as-a-Judge: LLM評価の精度と効率を両立する新手法
LLMを活用したシステム開発において、モデルの生成した回答が正しいかを正確に評価するプロセスは、システムの信頼性を担保する上で非常に重要です。従来、回答の判定には正規表現(Regex)などを利用した字面の一致に頼る手法が […]
コンテキスト・エンジニアリングの構造化手法
AIを使っていて、「期待した結果が返ってこない」、「何度もやり取りを繰り返してしまう」と感じたことはないでしょうか。多くの場合、その原因は「プロンプトの書き方」ではなく、AIに与える「コンテキスト(背景情報)の不完全さ」 […]
Lemonade: ローカルAIサーバー構築の事始め
昨今、業務効率化に向けてAIの活用を進める企業が増えています。しかしながら、「機密データを外部のクラウドサービスに入力するのはセキュリティ上避けたい」、「利用規模が拡大するにつれてランニングコストが気になる」など、様々な […]
Meta-Harness: AIエージェントの性能を引き出す最適化手法
大規模言語モデル(LLM)を活用したシステムを開発していると、「モデル単体は高性能なのに、システムに組み込むと思うように精度が出ない」という壁にぶつかることがよくあります。これは、システムの最終的な性能が、モデルの重みそ […]
LLMを活用したドメイン駆動設計(DDD)の自動化
複雑なビジネスルールが絡み合うソフトウェア開発において、アーキテクチャの設計は常に頭を悩ませる課題です。この課題に対する強力な解決策として、ドメイン駆動設計(DDD; Domain-Driven Design)があります […]