#AI Agent
科技频道标签:AI Agent
智谱 GLM 5.2 追上来了,但真正刺痛闭源模型的是性价比和可撤销性
据 CNBC 报道,智谱新发布的 GLM 5.2 在一个受关注的 agentic benchmark 上接近 Anthropic Opus 4.8,同时成本大约只有后者的五分之一。报道还说,OpenRouter 上的开发者 token 流量增长很快,速度甚至超过 DeepSeek V4 发布后的早期增长。
Claude 使用报告最有意思的不是 AI 更忙了,而是它开始接走整块工作
据 Anthropic 发布的 Economic Index report: Cadences,Claude 的使用方式正在发生变化:一年前,大部分使用还是用户和助手之间的对话;现在随着 Claude Code 和 Cowork 增长,越来越多 session 变成长时间运行的 agentic tasks。
OpenAI 说 Agent 正在改变工作,真正变化不是更会聊天,而是能接长期任务
据 OpenAI 发布的文章,Agentic AI 正在把知识工作的基本单位从“单次对话”推向“长期委托任务”。OpenAI 还披露了一个很有意思的内部变化:Codex 起初只是开发者工具,但到 2026 年,它已经在 OpenAI 的法务、招聘等非技术部门成为主要 AI 工作工具。
Gemini 把“电脑使用”塞进 Flash,开发者要先看权限边界
据 Google 官方博客 报道,computer use 现在成为 Gemini 3.5 Flash 内置工具,开发者可以通过 Gemini API 和 Gemini Enterprise Agent Platform 使用它来构建能跨浏览器、移动和桌面环境“看、推理、行动”的 agent。
Claude Tag 把 AI 放进 Slack,但真正难的是权限和上下文
一句话结论:Claude Tag 不是“在 Slack 里多一个聊天机器人”,而是把 Agent 放进团队协作现场,真正考验的是上下文、权限和责任边界。
Nvidia 给生物医学 Agent 做工具包,说明 AI 科研不是只靠通用模型硬问
一句话结论:BioNeMo Agent Toolkit 的价值不在让通用 Agent 直接当科学家,而在给它接上更专业、更省 token 的科研工具。