全部新闻
人工智能代理准备好进入工作场所了吗?新基准引发质疑 |TechCrunch
尽管预测人工智能将显着影响白领工作,但进展缓慢。Mercor 的新研究表明,领先的人工智能模型在处理现实世界的专业任务时表现不佳,成功率低于 25%。APEX-Agents 基准测试基于咨询、投资银行和法律领域的实际工作环境和任务,突出了多领域推理等挑战。尽管还有改进的空间,但研究表明,当前的人工智能模型尚未准备好取代高价值工作中的专业人员。
专家警告称,“人工智能机器人群”侵扰社交媒体对民主构成威胁
伯克利、哈佛大学和牛津等著名机构的专家表示,政治领导人可能很快就会部署模仿人类行为的人工智能群来影响公众舆论,对民主构成威胁。这些人工智能代理可以渗透社交媒体和消息平台来传播错误信息,并可能被独裁者用来影响民众反对选举或选举结果。预计该技术将在 2028 年美国总统大选前大规模部署。为了应对这一威胁,专家们呼吁采取全球行动,包括使用群体扫描仪和水印内容来检测人工智能驱动的虚假信息。这些影响力操作的早期版本已经在台湾、印度和印度尼西亚最近的选举中使用。
英雄前 PC 游戏作家创建了一个脚本来消除 Google Chrome 中的所有 AI 功能
前 PC 游戏作家在各个领域都开启了引人注目的职业生涯,包括解决当代问题的脚本工具,例如网络浏览器中的人工智能集成。Corbin Davenport 最近发布了“Just the Browser”,该脚本旨在删除 Chrome、Firefox 和 Edge 等流行网络浏览器中的人工智能功能、遥测数据报告、赞助内容和其他烦恼。该工具利用组策略设置,而不是黑客或浏览器扩展,为用户提供对通常缺乏简单关闭选项的某些浏览器功能的控制。尽管它不会直接影响网站内容,但该项目因其减轻在线侵入性人工智能功能的潜力而引起了技术社区的高度关注。
人工智能使能者闪闪发光。现在是主要事件。
投资者商业日报的内容仅供参考和教育用途,不得解释为投资建议或购买或出售证券的建议。信息是从被认为可靠的来源获得的,但不能保证准确性。历史表现并不能保证未来的结果。作者可能持有他们讨论的股票。对于投资特定证券或策略的明智性,不作任何陈述。实时价格由纳斯达克最新交易提供,所有权数据由伦敦证券交易所集团提供。内容和商标 ©2026 Investor’s Business Daily, LLC。
马斯克表示,特斯拉明年将向公众出售擎天柱机器人
特斯拉首席执行官埃隆·马斯克在达沃斯世界经济论坛上宣布,该公司计划在 2026 年底前向公众出售其 Optimus 机器人,在发布前强调了高可靠性和安全性。目前特斯拉工厂用于执行简单任务,马斯克预测 Optimus 很快将处理更复杂的功能。他认为,由于产品阵容问题和美国电动汽车激励措施的丧失,汽车市场面临挑战,因此人形机器与人工智能和自动驾驶汽车一样是一个关键业务领域。
谷歌 DeepMind 首席执行官对 OpenAI 在 ChatGPT 中推出广告感到“惊讶”
谷歌 DeepMind 首席执行官 Demis Hassabis 对 OpenAI 早期在其人工智能聊天机器人中采用广告表示惊讶,并质疑广告如何融入旨在获得信任和提供帮助的助理模型中。相比之下,哈萨比斯表示,谷歌目前没有在其人工智能服务中投放广告的计划,而是更愿意观察用户对 OpenAI 做法的反应。哈萨比斯强调了使用搜索引擎与聊天机器人作为个人数字助理之间的区别,强调了对广告集成降低用户体验质量的担忧。
谷歌 DeepMind 首席执行官对 OpenAI 在 ChatGPT 中急速推出广告感到“惊讶”TechCrunch
谷歌 DeepMind 首席执行官 Demis Hassabis 对 OpenAI 早期在其人工智能聊天机器人中引入广告表示惊讶,并表示这是他在谷歌的团队正在“非常仔细”考虑的事情。哈萨比斯强调了用户信任的重要性以及将广告深思熟虑地整合到人工智能服务中的必要性,特别是当这些服务演变成更加个性化的数字助理时。他澄清说,谷歌目前没有在其人工智能聊天机器人中投放广告的计划,但将监控用户对 OpenAI 方法的反应。哈萨比斯指出,整合广告可能会影响用户体验和对助手的信任,此前消费者对人工智能服务中的侵入性建议的强烈抵制凸显了这一担忧。
Humans& 认为协调是人工智能的下一个前沿领域,他们正在构建一个模型来证明这一点 |TechCrunch
Humans& 是一家由大型人工智能公司校友创立的初创公司,筹集了 4.8 亿美元,用于开发用于人类协作的“人工智能中枢神经系统”。与当前的聊天机器人不同,Humans& 旨在创建具有社交智能的基础模型,以管理复杂的团队合作和长期决策。该公司寻求解决现有人工智能技术中的协调差距,通过多智能体强化学习来训练其模型,以了解和平衡团队背景下的个人需求。尽管获得了大量资金,Humans& 仍面临着来自 Notion 和 Slack 等老牌企业的竞争,以及扩展其创新方法的挑战。
克劳德代码如何重塑软件和人类
工程师们对 Anthropic 的人工智能编码工具 Claude Code 越来越兴奋,该工具推出不到一年,年化经常性收入最近就超过了 10 亿美元。Claude Code 的负责人 Boris Cherny 将成功归功于构建了预测未来人工智能功能的最简单的产品。Workera 的 Kian Katanforoosh 等开发人员报告了 Claude Opus 4.5 的显着改进,并指出它超越了人类编码方法。Anthropic 的目标是到 2028 年实现正现金流,Claude Code 对收入增长做出了重大贡献。该公司还推出了 Cowork(一种用于文件管理和软件交互的人工智能代理),将业务扩展到非编码领域。
求职者想知道基于人工智能的招聘决策到底发生了什么:诉讼
加利福尼亚州的一项新诉讼试图强制人工智能招聘工具的运作方式透明化,主张自动申请人“评分”应与公平信用报告法案(FCRA)下的信用检查类似地对待。这起案件由两名女性提起,她们声称自己因人工智能系统而受到不公平的筛选,失去了工作机会,目标是人工智能人力资源公司八倍。该诉讼称,Eightfold 的评分系统根据 FCRA 生成消费者报告,因此应遵守要求求职者通知并同意的规定。八倍对这些指控提出异议,但面临遵守州和联邦消费者报告法和经济损失的要求。