ExecuTorch: モバイル・エッジデイバス向けAI推論の事始め
モバイル端末やエッジデバイス上でAIを動かす「オンデバイス推論」が近年注目を集めています。これまで、PyTorchで構築したモデルをエッジデバイスで展開する際は、主にTorchScriptベースの「PyTorch Mob […]
SWE-chat: 実際の開発者はAIコーディングエージェントをどう使っているのか?
AIコーディングエージェントが急速に普及していますが、実際の開発現場ではどのように使われているのでしょうか?この記事では、現実の利用実態を分析した初の大規模データセット「SWE-chat」から、実践的なインサイトを紹介し […]
BERT-as-a-Judge: LLM評価の精度と効率を両立する新手法
LLMを活用したシステム開発において、モデルの生成した回答が正しいかを正確に評価するプロセスは、システムの信頼性を担保する上で非常に重要です。従来、回答の判定には正規表現(Regex)などを利用した字面の一致に頼る手法が […]
LLMを活用したドメイン駆動設計(DDD)の自動化
複雑なビジネスルールが絡み合うソフトウェア開発において、アーキテクチャの設計は常に頭を悩ませる課題です。この課題に対する強力な解決策として、ドメイン駆動設計(DDD; Domain-Driven Design)があります […]
バイブコーディングのリアル: ソフトウェア開発におけるAI活用の罠と対策
自然言語でAIと対話しながらコードを生成する「Vibe Coding(バイブコーディング)」。Claude CodeやGemini CLIといったコーディングエージェントの登場により、プロトタイピングの開発速度は劇的に向 […]
Intent Formalization: AI時代の信頼できる開発
近年、「Vibe coding」に代表される、自然言語で要件を伝えてAIが生成したコードをそのまま受け入れる開発スタイルが普及しつつあります。AIコーディングツールは高速でコードを出力します。ですが、ここで大きな問題とな […]
Agentic Code Reasoning: 構造化された準形式的推論の威力
大規模言語モデル(LLM)を活用したコーディングエージェントが普及する中、コードを実際に実行することなく、その意味や振る舞いを正確に読み解く「Agentic Code Reasoning(エージェントによるコード推論)」 […]
Neuro-Symbolic AI: ブラックボックス時代における信頼性と論理の融合
現在の自然言語処理(NLP)やコンピュータビジョン(CV)の分野では、深層学習モデルが目覚ましい成果を上げています。しかし、これらのモデルはデータ効率の悪さや予測の根拠(説明性)が不透明であるという根本的な課題を抱えてい […]
Group-Evolving Agents: 経験共有によるAIの自己進化
LLMエージェントの開発において、人間の介入なしにシステムが自らの構造を改善し続ける「自己進化(Open-Ended Self-Improvement)」のアプローチが注目を集めています。しかし、従来の自己進化は「個体単 […]
Efficient-SAM2: セグメンテーションの高速化と効率化
Segment Anything Model 2 (SAM2) は、画像や動画のセグメンテーションにおいて非常に強力な性能を発揮する基盤モデルです。すでに実務でMLシステムへ組み込もうと検討された方も多いのではないでしょ […]