英语轻松读发新版了,欢迎下载、更新

全部新闻

为了使语言模型更好,研究人员避开语言|Quanta杂志
为了使语言模型更好,研究人员避开语言|Quanta杂志
2025-04-14 14:23:27
大型语言模型(LLMS)的最新进步使他们能够在潜在空间中进行推理代表了这些模型如何处理和生成信息的重大进展。通过允许LLM在不连续将其计算转换为文本的情况下运行,汤姆·戈德斯坦(Tom Goldstein)和他的马里兰州团队等研究人员为模型效率和解决问题的能力开辟了新的可能性。###关键概念1。**潜在空间推理**: - 传统的LLM在每一层计算后将中间结果转换为文本表示。 - 潜在空间推理涉及允许计算在没有这种转换的情况下进行连续的,数值域进行,从而在更少或动态的层面层中实现了更深的推理。2。**循环体系结构**: - 戈德斯坦(Goldstein)的团队设计了一个具有复发块的体系结构,可以根据任务的复杂性多次使用。 - 该块过程不断嵌入,直到它们稳定或显示最小的变化,表明推理完成而没有过早转换回文本。3。**动态层用法**: - 该模型决定,根据手头任务的难度级别,循环循环需要多少次。 - 对于更简单的任务,需要更少的迭代;对于更复杂的迭代,额外的迭代允许在潜在空间中进行更深入的探索。###优势1。**效率和资源管理**: - 该模型根据输入的复杂性动态调整其计算深度,从而优化了资源使用情况。 - 这种方法可减少不必要的计算,以实现更简单的任务,同时为更复杂的问题提供足够的处理时间。2。**提高性能**: - 初始测试表明,在某些推理和编码任务中,这种模型可以胜过具有较少参数的传统LLM。 - 戈德斯坦(Goldstein)的经常性模型在数学推理任务上的准确性约为28%,尽管参数少得多,但尽管参数少得多。3。**紧急行为**: - 该模型自然学会了为道德上复杂的场景分配更多的计算资源,表明对体系结构的适应性和智能使用。###挑战1。**采用障碍**: - 当前的大规模LLM大量投资于现有的架构和培训方法。 - 将潜在的空间推理整合到这些模型中需要大量的工程工作,这可能会延迟广泛采用。2。**与人类推理模式的对齐**: - 由于数据培训LLM的文本主要是文本性的,因此远离这种格式可能会导致与人类认知过程不符的推理模式。 - 存在发现新的但潜在的无助或误导推理策略的风险。###未来方向1。**进一步的研究和测试**: - 继续研究潜在空间推理的益处和局限性对于理解其全部潜力至关重要。 - 跨各个领域的其他基准测试可以帮助确定这些模型在何处需要改进的区域。2。**与现有架构的集成**: - 调查将传统基于文本的LLM与潜在空间推理结合的混合方法可以提供更平衡的解决方案。 - 这可能涉及使用潜在空间来处理特定的处理阶段,同时保持基于文本的输出生成的鲁棒性。3。**道德和实际考虑**: - 确保在潜在空间中训练的模型与道德准则和人类价值观很好地保持一致,因为它们可以自动解决复杂问题。 - 在早期解决潜在的未对准可以防止问题的问题。### 结论LLM在潜在空间中推理的能力与当前实践有很大的不同,这可能会释放新的效率和解决问题的能力。尽管将这些进步集成到现有框架中存在挑战,但最初的结果表明,这个方向对AI研究和应用程序中的未来发展有望。
我测试了给您的年长父母的AI,如果您不能打扰
我测试了给您的年长父母的AI,如果您不能打扰
2025-04-14 14:06:53
AI初创公司介绍了Intouch服务,该服务使用AI生成的语音电话检查了年迈的父母。AI进行对话,并为用户帐户提供了心情指标的摘要。尽管可能担心其非人格化的性质,但该创作者声称它有助于维持接触并确保遥远的亲戚的安全。
人工智能如何彻底改变商业房地产
人工智能如何彻底改变商业房地产
2025-04-14 14:02:48
人工智能正在通过提高效率,降低成本并改变房地产评估,管理和营销来彻底改变商业房地产。AI分析大数据的能力有助于预测趋势并自动化常规任务,从而改善决策过程。物业经理受益于处理租户查询,安排维护和进行虚拟旅行的AI工具,而物联网传感器则监视设备性能以防止故障并减少支出。
莎拉·郭(Sarah Guo)成为AI顶级投资者的道路
莎拉·郭(Sarah Guo)成为AI顶级投资者的道路
2025-04-14 14:00:00
本通知概述了使用本网站的条款和条件,包括接受使用条款和隐私政策。它还提到Fortune Media IP Limited拥有财富商标,并可能会从网站上的某些链接中获得赔偿。用户可以选择不出售或共享其个人信息。
ABCI演变以满足日本不断变化的人工智能需求
ABCI演变以满足日本不断变化的人工智能需求
2025-04-14 13:55:08
日本先进的工业科学技术(AIST)在通过其一系列ABCI系统中推进AI基础设施方面发挥了作用。这是对他们旅程的摘要和见解:1。**初始动机:** - 在2017年,AIST注意到尽管该行业兴趣浓厚,但日本采用了AI技术的缓慢采用。主要目标是提供大规模的AI实验功能。2。** ABCIS系列概述:** - ** ABCI 1.0:**启动,目的是为不同的用户提供大规模的AI实验。 - 配置由Infiniband网络链接的Intel Xeon处理器和NVIDIA GPU。 - ** ABCI 2.0:**添加了更多功能来支持不断增长的用户需求。 - 进一步提高了性能,并为更广泛的应用范围增加了灵活性。 - ** ABCI 3.0(当前):** - 具有Intel Xeon可伸缩处理器和NVIDIA HOPPER GPU的功能更强大。 - 增强的网络基础架构支持更高的带宽和更好的延迟。 - 提供更多的计算能力:FP64时的415个Pflops,FP32时3个Eflops和FP16时的6.22 Eflops。3。**角色进化:** - 随着日本的商业云提供商开始提供AI数据中心,AIST的角色已转向专注于战略研发目的。 - 现在,资源的主要分配已用于国家机构,大学,初创企业和公共研究计划。4。**当前用例和未来方向:** - **主要用例:**培训大规模AI模型,尤其是大语言模型(LLMS)。 - 支持普拉莫和燕子等日本LLM的发展。 - **未来的重点:**探索高级应用程序,例如网络物理系统或物理AI,其中分析了现实世界数据,使用AI进行模拟,并将结果馈回控制机制。5。**技术前景:** - AIST的目标是根据用户需求和技术进步逐渐更新ABCI 3.0。 - 考虑到较低的精度计算的潜力(例如FP8)随着GPU的发展。6。**下一步:** - 没有立即计划ABCI 4.0的计划,但预计会进行持续改进。 - 未来的升级将以新兴趋势和预计的用户要求为指导。通过根据行业的进步和改变战略重点的发展,AIST继续在日本的AI生态系统中发挥关键作用,从而促进了各个部门的创新和发展。
北约购买Palantir AI-Wartighting Maven软件系统
北约购买Palantir AI-Wartighting Maven软件系统
2025-04-14 13:52:00
Palantir Technologies与北约达成了一项协议,以出售其支持AI的战争系统Maven Smart System。该协议于3月25日完成,重点介绍了北约的快速采购过程,这反映了对先进军事软件的迫切需求。宣布后,Palantir的股票增加了4.6%,在日内交易中攀升至92.66美元。分析师认为这不仅对Palantir,而且在更广泛的地缘政治背景下,这是对欧洲减少其对美国国防承包商的依赖的担忧。Palantir技术
Chatgpt记忆,边界和AI同伴,Auren
Chatgpt记忆,边界和AI同伴,Auren
2025-04-14 13:46:14
如果扩展到其他用例,Chatgpt的基本内存功能可能会成为重要的竞争优势。还概述了Stratechery Plus的订阅详细信息,该详细信息提供了对高级内容和播客的访问。
我们需要停止假装AI是聪明的 - 这就是
我们需要停止假装AI是聪明的 - 这就是
2025-04-14 13:34:31
这篇文章反对当前人工智能(AI)的描绘为人类,强调了真正的AI将军仍然是科幻小说。当今的AI通过基于广泛的数据集的统计预测来运作,缺乏意识,理解或情绪。它不能真正地同情或理解复杂的人类经验。作者警告不要拟人化AI,强调与表现为思想和感觉相关的风险。这种误导性的代表可能会导致对AI能力和意图的危险幻想。取而代之的是,该文章倡导在交流中剥夺人类特征,以防止滥用和误解。
Openai用于测试其AI模型数月 - 现在已经是几天了。为什么这很重要
Openai用于测试其AI模型数月 - 现在已经是几天了。为什么这很重要
2025-04-14 13:22:00
《金融时报》报道说,OpenAI大大缩短了其安全测试时间表,仅几天就可以给员工和第三方测试人员评估O3-Mini等新型号。这种匆忙归因于公司在开源车型的竞争增加的竞争中保持竞争优势的愿望。消息来源声称,这种方法不太彻底,缺乏适当的时间和减轻风险的资源。AI模型测试中缺乏政府监管会加剧这些担忧,Openai主张在特朗普政府的AI行动计划期间进行自我调节。专家警告说,随着AI系统的发展,风险的增长,需要更广泛的第三方访问和测试,以确保安全和保障。
Dolphingemma:Google AI如何帮助解码海豚交流
Dolphingemma:Google AI如何帮助解码海豚交流
2025-04-14 13:02:48
Google开发了Dolphingemma,这是一种AI模型,该模型培训,可与Georgia Tech和Wild Dolphin Project(WDP)的研究人员合作分析和生成海豚声。该模型旨在了解海豚的复杂通信模式,并可能使用诸如CHAT之类的技术启用双向互动,该技术将合成的哨声与对象相关联。这种进步可以帮助揭示自然海豚交流中的隐藏结构,并为人类和海豚之间的互动交流建立共同的词汇。