ニュース Provable Benefits of In-Tool Learning for Large Language Models をやさしく解説 — ツール内学習の理論的メリットと実装のコツ 2025年8月31日 onodera AIzine
ニュース MCP-Benchが切り開く「ツールを使うLLMエージェント評価」の新標準:実課題をMCPサーバーで再現し、再現性・安全性・拡張性を両立する 2025年8月30日 onodera AIzine
ニュース AgentFly: Fine-tuning LLM Agents without Fine-tuning LLMs ─ LLM本体をいじらずにエージェントを強化する実践ガイド 2025年8月26日 onodera AIzine
ニュース When and What: Diffusion-Grounded VideoLLM with Entity Aware Segmentation — 長時間動画理解の鍵は「いつ」と「何」にある 2025年8月25日 onodera AIzine
ニュース A Survey on Large Language Model Benchmarks を手がかりに学ぶ:LLMベンチマークの全体像と実務で役立つ評価設計 2025年8月25日 onodera AIzine