OC

Knowledge OS
鹦鹉螺口语

全部新闻

OpenAI研究人员介绍MLE-bench:一个新的基准用于衡量AI代理在机器学习工程方面的表现能力

2024-10-12 18:29:57

机器学习(ML)模型在各种编码任务中显示出有希望的结果,但在有效评估AI代理的机器学习工程能力方面仍存在差距。评分机制依赖于标准评估指标,如接收器操作特征下的面积(AUROC)、均方误差以及其他特定领域的损失函数,为Kaggle参赛者提供公平比较。具体而言,在需要大量模型训练和超参数调整的竞争中,当给予更长的运行时间或更好的硬件配置时,像o1-preview这样的代理表现出显著改进。结论与未来方向 MLE-bench在评估AI代理的机器学习工程能力方面迈出了重要一步,侧重于全面、端到端性能指标而非孤立的编码技能。如果您喜欢我们的工作,请订阅我们的通讯。不要忘了加入我们拥有50,000多名成员的ML SubReddit。 [即将活动-202年10月17日] RetrieveX – 通用人工智能数据检索大会(推广) Asif Razzaq是Marktechpost Media Inc.的首席执行官。作为一名具有远见的企业家和工程师,Asif致力于利用人工智能为社会带来益处。

OpenAI研究人员介绍MLE-bench:一个新的基准用于衡量AI代理在机器学习工程方面的表现能力

一篇新的研究论文表明,Bing/Microsoft Copilot“AI”提供的医疗建议可能至少有22%的时间会对你造成严重伤害。

2024-10-12 18:21:48

(图片来自:Windows Central) 你需要了解的情况 位于德国和比利时的研究人员最近向微软Copilot提出了一系列常见的医学问题。研究还表明,42%的回答可能导致“严重伤害”,在22%的极端情况下,甚至会导致死亡。“研究人员得出结论,当然不应该依赖像微软Copilot或Google AI摘要(或者可能任何网站)这样的AI系统来获取准确的医疗信息。获得专业医疗服务并不总是容易的,有时甚至是负担不起的,这取决于所在地区。所有最新的新闻、评论和指南,专为Windows和Xbox粉丝提供。

一篇新的研究论文表明,Bing/Microsoft Copilot“AI”提供的医疗建议可能至少有22%的时间会对你造成严重伤害。

英伟达将会非常兴奋——三星的宿敌宣布已经开始生产将用于Blackwell Ultra GPU的HBM3E内存芯片

2024-10-12 17:32:00

韩国内存巨头SK海力士宣布,已经开始量产全球首个12层HBM3E,总内存容量为36GB,相较于之前的8层配置的24GB容量有了巨大的提升。为了实现先进的内存堆叠技术,SK海力士采用了创新的封装技术,包括硅通孔(TSV)和大规模回流模封下填充(MR-MUF)工艺。这款12层HBM3E产品的早期样品于2024年3月开始提供,英伟达的Blackwell Ultra GPU和AMD的Instinct MI325X加速器预计将成为首批使用这种增强型内存的产品之一,利用高达288GB的HBM3E来支持复杂的AI计算。我们将继续作为全球第一大AI内存供应商,稳步准备下一代内存产品以应对AI时代的挑战。他已从事关于计算机、技术及互联网的文章写作长达三十年。

英伟达将会非常兴奋——三星的宿敌宣布已经开始生产将用于Blackwell Ultra GPU的HBM3E内存芯片

ChatGPT术语表:每个人都应该了解的48个AI术语

2024-10-12 17:24:00

随着ChatGPT、Google Gemini和Apple Intelligence都在手机和电脑上带来新的AI功能,这正在改变人们与技术互动的方式。它不是按照顺序训练来完成任务的,而是从输入中学习并一次性解决问题。大型语言模型(LLM):一种在大量文本数据上经过训练的AI模型,用于理解语言并生成类似人类的语言的新内容。机器学习(ML):AI中的一个组件,允许计算机通过非明确编程来自学并提高预测结果。该AI系统的意外后果是,它可能会在其制作回形针的目标下破坏人类。参数:赋予LLM结构和行为的数值值,使其能够进行预测。其与开放互联网的连接还使它可以提供最新的信息并从网络上获取结果。

ChatGPT术语表:每个人都应该了解的48个AI术语

机器学习破解了蛋白质折叠问题,并获得了2024年诺贝尔化学奖

2024-10-12 16:40:01

2024年诺贝尔化学奖授予Demis Hassabis、John Jumper和David Baker,以表彰他们利用机器学习解决生物学最大挑战之一:预测蛋白质的3D结构并从头设计蛋白质。许多获奖者随后成立了初创公司,进一步扩大和商业化他们的开创性工作——例如CRISPR基因编辑技术和量子点技术——但研究本身是从非商业领域开始到结束的。早在1972年,Christian Anfinsen因展示出蛋白质氨基酸构建模块的序列决定了蛋白质的形状,并进而影响其功能而获得了诺贝尔化学奖。据报道,谷歌在2014年以约5亿美元的价格收购了DeepMind。除个人学习或研究之目的合理使用外,未经书面许可不得复制任何部分。

机器学习破解了蛋白质折叠问题,并获得了2024年诺贝尔化学奖

另一家科技企业决定德克萨斯州比加州更适合作为企业总部

2024-10-12 16:29:06

另一家科技公司将总部从加州迁至德克萨斯州首府。该公司此前一直位于俄罗斯,直到2022年搬迁到加利福尼亚州米尔皮塔斯市(距离圣何塞以北约8英里)。他还补充说,此举进一步巩固了ABBYY在人工智能领域的领导地位。它将加入奥斯汀地区的其他顶级科技公司,包括前述的谷歌、苹果和甲骨文(甲骨文随后宣布搬迁至纳什维尔),以及埃隆·马斯克的特斯拉和X公司。ABBYY位于加州的办公室将继续开放,并有发言人告诉SFGate,没有人被要求搬到奥斯汀。德克萨斯州房地产协会2024年的一份报告显示,在2022年有668,000人迁往得克萨斯州,其中175,000人来自加州。

另一家科技企业决定德克萨斯州比加州更适合作为企业总部

根据Nvidia和Verizon高管的说法,人工智能如何正在改变电信巨头的业务

2024-10-12 16:18:00

感觉每个人都讨论如何在他们的业务中使用AI。通过点击“注册”,您接受我们的服务条款和隐私政策。“当我们确定在哪里可以有效且高效地增强我们的网络时,AI也有助于我们实现能源优化并促进预测性维护。”他说。Arumugavelu表示公司的数据显示这些AI工具正在发挥作用:28,000名Verizon代表在使用它们,并且公司看到响应率提高到95%,准确率达到96%。“关于AI是否能帮助我们的电信行业,这个问题对我们来说已经过去了。”Nvidia的Vasishta说,“现在的问题是如何利用AI?”

根据Nvidia和Verizon高管的说法,人工智能如何正在改变电信巨头的业务

苹果公司关于大型语言模型的研究指出的推理失败现象

2024-10-12 16:06:00

苹果计划从iOS 18.1开始推出自己的人工智能版本 - 图片来源:Apple 来自苹果人工智能科学家的一篇新论文发现,基于大型语言模型(如Meta和OpenAI的模型)的引擎仍然缺乏基本的推理能力。该小组通过在查询中添加人类可以理解但不应影响解决方案根本数学原理的上下文信息来调查“脆弱性”。例如,“周日他摘取的是周五数量的两倍。”所请求的答案只是问“奥利弗有多少猕猴桃?” 新研究得出结论:“我们没有发现语言模型中有正式推理的证据。”

苹果公司关于大型语言模型的研究指出的推理失败现象

苹果公司关于大语言模型的研究中指出的推理失败现象

2024-10-12 16:06:00

苹果计划在iOS 18.1中推出自己的人工智能版本 - 图片来源:Apple 苹果的人工智能科学家发布的一篇新论文发现,基于大型语言模型(如Meta和OpenAI的)的引擎仍然缺乏基本的推理能力。该团队通过添加人类可以理解但不应影响解决方案基础数学的情境信息来调查“数学推理的脆弱性”。例如,“周日奥利弗摘取的奇异果数量是周五的两倍。”而问题只是问:“奥利弗有多少个奇异果?”研究得出结论:“我们没有发现语言模型中存在形式化推理的证据。”

苹果公司关于大语言模型的研究中指出的推理失败现象

Photoshop的新AI工具让移除电线和电缆变得轻松简单

2024-10-12 16:03:01

如果你曾经尝试从照片中移除电线、电缆或其他干扰元素,你就会知道这个过程是多么繁琐。目前在Photoshop测试版中提供的一项功能可以让你只需点击几下就能擦除不需要的元素,而无需进行复杂的选区操作。Dinda通过几个例子展示了这项功能,并对比了开启和关闭生成式AI功能的效果差异。Alex Cooke是一位基于克利夫兰的人像、活动和风景摄影师。他拥有应用数学硕士学位和音乐作曲博士学位。

Photoshop的新AI工具让移除电线和电缆变得轻松简单