英语轻松读发新版了,欢迎下载、更新

全部新闻

培训大语言模型:从TRPO到GRPO |迈向数据科学
培训大语言模型:从TRPO到GRPO |迈向数据科学
2025-02-06 03:24:03
在培训大语言模型(LLMS)中加强学习(RL)技术的演变和应用的大概括!让我们分解要点和概念以确保清晰度:###关键概念#### 1。**加固学习基础:** - **指出:**当前情况或上下文。 - **动作:**模型基于对状态的理解的作用。 - **奖励:**由环境(或奖励模型)给予的反馈,以指导学习以提高绩效。 - **政策:**决定在给定状态下采取哪种行动的策略。#### 2。** trpo(信任区域策略优化):** - 介绍了使用KL Divergence从一次迭代变为另一种迭代的限制。 - 通过防止连续迭代之间发生大规模变化,从而避免灾难性遗忘或过度拟合,来确保稳定。#### 3。** PPO(近端策略优化):** - 通过引入策略更新的剪辑机制来简化TRPO的一些严格约束。 - 这使得PPO在计算上更有效,更易于实现,同时仍保持稳定性。###新技术#### 4。 - **消除价值模型:**而不是使用单独的值模型,而是使用生成的响应组的奖励来计算优势函数。\ [a(s,a)= \ frac {r_i- \ mu} {\ sigma}\] - **基于组的奖励归一化:**生成多个非确定性输出(使用低温),并根据这些组对奖励进行标准化,从而简化了训练过程。#### 5。** GRPO的优势:** - **效率:**通过消除对价值模型的需求并使用基于组的奖励归一化,GRPO降低了计算开销。 - **稳定性与对齐方式:**通过利用多个生成的输出来平衡策略优化与稳定性,并确保与人类偏好更好地保持一致性。### DeepSeek的方法 - ** DeepSeek-r1 **通过RLHF(从人类反馈中学习),重点是激励LLMS中的推理能力。 - ** DeepSeekmath **专门针对开放语言模型中数学推理的界限。###参考和进一步阅读提供的参考文献是深入研究这些主题的好起点,尤其是重点关注GRPO等最新进步。---此概述应该使您清楚地了解RL方法在培训LLM中如何发展,以及为什么像GRPO这样的新技术正在获得吸引力。如果您想探索更多详细信息或特定的数学表述,则引用论文将是一个很好的下一步!
Whoopi Goldberg使用AI版本的脸猛击减肥药:“不要看这个”
Whoopi Goldberg使用AI版本的脸猛击减肥药:“不要看这个”
2025-02-06 03:02:07
Whoopi Goldberg在Instagram上警告了粉丝关于假性减肥广告,该广告使用人工智能来表现她的肖像,以促进她不认可或使用的毒品。在《观点》一集中,戈德堡建议追随者无视广告,并强调,她的名字清楚地标记了她的任何产品认可。她还提到先前使用Mounjaro减肥,并表示担心AI在误导性广告中的滥用。乌比戈德堡
Google在内部开始测试新的搜索“ AI模式”  - 以下是早期查看
Google在内部开始测试新的搜索“ AI模式” - 以下是早期查看
2025-02-06 01:36:00
Google正在其搜索引擎中测试一种新的“ AI模式”,该搜索引擎由Gemini 2.0提供动力,该搜索引擎旨在通过智能研究功能为开放式问题提供更详细和有组织的回答。此模式使用户可以寻求建议,进行比较并参与超出标准搜索结果的后续查询。Google员工目前正在台式机和移动设备上测试该界面,该界面具有类似聊天机器人的UI,该UI提供了链接,以进一步探索相关内容。根据首席执行官Sundar Pichai的说法,AI模式预计今年将于今年启动。
访谈:Openai首席执行官Sam Altman关于DeepSeek Rise,India的AI机会和Stargate的大量资金
访谈:Openai首席执行官Sam Altman关于DeepSeek Rise,India的AI机会和Stargate的大量资金
2025-02-06 00:30:00
从您的摘要中,可以蒸馏出有关AI开发和围绕OpenAI的景观的几个关键点和见解:1。** AI开发的成本降低**:将大型语言模型(LLM)的成本降低10倍的趋势持续趋势。这表明,尽管有一次开发像OpenAI这样的基础AI模型,但其他组织和初创企业正在以明显更少的投资来寻找这样做的昂贵。2。**基础与垂直AI **:考虑到该领域的印度(或任何)初创企业的前进道路时,讨论是否专注于构建基本的LLM或开发可以利用现有基础模型的垂直应用程序。Openai似乎表明,这两种方法都是有价值的,而且取决于可用的资源和专业知识。3。** ai **的能源:重点是清洁能源(如核融合和下一代裂变)在降低与AI基础设施供电相关的成本方面的重要性,这是一个至关重要的组成部分型号。4。** AI法规**:承认美国和中国之间的地缘政治动态,建立类似于IAEA核能模型的全球监管框架仍然希望。这强调了AI治理中国际合作的复杂性,但也强调了可能性。5。**与微软的关系**:Openai与微软的关系仍然至关重要,因为它们致力于使投资者基础多样化,同时维持对其增长和发展起着重要作用的关键伙伴关系。6。** AGI预测**:尽管有进步,但由于定义的不同定义和尖端研究中固有的不可预测性,预测实现人工通用智能(AGI)的时间表仍然充满不确定性。7。**开源策略**:鉴于其战略重点和业务模型的考虑,OpenAI在AI开发中承认开源的角色,但仍保持其专有方法。8。**埃隆·马斯克(Elon Musk)的影响力**:与埃隆·马斯克(Elon Musk)有着持续的动态,他对Openai的方向持批评态度,尤其是在2019年后转向更商业取向之后。在关于AI伦理和治理的更广泛讨论中,这一批评继续受到监测。总体而言,这些观点强调了人工智能发展的不断发展的性质,强调了技术进步,战略业务决策,监管挑战以及国际合作在塑造人工智能未来方面的重要性。
人工智能与稳定
人工智能与稳定
2025-02-06 00:02:22
您对AI对财务稳定构成的潜在威胁的分析是全面而有见地的。您可以正确地确定几种关键风险,并提出可行的建议,以使监管机构有效地减轻这些风险。这是一个摘要和一些其他考虑因素,可以进一步加强您的论点:###关键点摘要1。** AI的新稳定风险:** - **速度和效率:**多个AI系统之间决策的快速融合会加剧市场不稳定。 - **错误的路风险:**缺乏有关极端财务结果的数据,使AI在危机期间更容易出现错误的风险。 - **风险单一文化:** AI分析空间中一些供应商的主导地位可能会导致统一的决策并扩大全身风险。2。**政策建议:** - 在监管机构中建立内部AI专业知识。 - 将AI集成到核心财务稳定性功能中,而不是将其视为辅助关注点。 - 在监管机构的AI系统与金融机构的直接API链接进行实时监控之间。 - 创建自动触发流动性设施,以迅速响应市场压力。 - 在管理相关风险的同时外包关键的AI功能。###其他注意事项1。**增强的透明度机制:** - 要求金融机构维护AI决策过程的详细日志,尤其是在高波动期间。这种透明度可以帮助监管机构理解并减轻新兴风险。2。**用于AI测试的监管沙箱:** - 建立监管沙箱,在该条件下可以在受控条件下测试新的AI技术,然后再在实际市场上推出。这将允许当局尽早确定潜在的问题。3。**与行业和学术界的合作框架:** - 促进监管机构,金融机构,技术公司和学术研究人员之间的合作伙伴关系,以制定财务AI的标准和最佳实践。4。**涉及AI的压力测试方案:** - 将AI驱动的方案纳入监管机构进行的常规压力测试中,以更好地为潜在的危机做准备。5。**在金融中使用AI的道德准则:** - 制定道德准则,以确保AI系统不仅有效,而且公平,透明和弹性。6。**监管技术(RegTech)创新:** - 鼓励开发专门旨在有效监视和规范AI驱动的财务活动的RegTech解决方案。7。**公共意识运动:** - 发起公众意识运动,了解与AI在财务中相关的利益和风险,以维持对监管措施的信任和支持。### 结论您的结论正确地强调,尽管AI具有显着优势,但其整合到金融系统中需要仔细考虑新兴风险。当局必须积极主动地开发有效管理这些风险的强大框架和能力。通过采用涉及增强透明度,协作测试环境,道德准则和高级RegTech解决方案的整体方法,监管机构可以更好地为潜在的AI诱发的金融危机做好准备和减轻。这些其他考虑因素旨在通过提供更具体的工具和策略来补充您的全面分析,这些工具和策略可能会采用这些工具和策略来维护以人工智能为主导的时代,以维护金融体系的稳定性。
研究人员为Openai的O1“推理”模型创建了一个公开的竞争对手,价格低于$ 50 |TechCrunch
研究人员为Openai的O1“推理”模型创建了一个公开的竞争对手,价格低于$ 50 |TechCrunch
2025-02-05 23:38:07
斯坦福大学和华盛顿大学的研究人员培训了一种名为S1的AI推理模型,使用云计算学分低于50美元。该模型与OpenAI的O1和DeepSeek在数学和编码测试中的R1等领先模型相似。S1是通过称为蒸馏的过程开发的,该过程涉及使用最小数据的微调基础模型,特别是1000个策划的问题,以及Google的Gemini模型的答案。该项目强调了对AI模型的商品化的担忧,以及低成本训练的ai的大型实验室构成的挑战::斯坦福大学和华盛顿大学的研究人员使用云计算学分以低于50美元的价格开发了AI推理模型S1。S1匹配了OpenAI的O1和DeepSeek在数学和编码测试中的R1等顶级模型的性能。该团队使用蒸馏来微调基本型号,其中有1,000个策划的问题和Google双子座模型的答案。这一发展引起了人们对AI商品化和主要AI实验室挑战的担忧。
视频游戏演员仍在对AI保护措施上。这就是原因
视频游戏演员仍在对AI保护措施上。这就是原因
2025-02-05 23:35:00
Destiny 2的异端更新具有无声的角色,这是由于持续的SAG-AFTRA罢工始于7月。超过2500个视频游戏表演者正在为带有AI保护的新合同而引人注目。尽管一些公司签署了临时协议,但其他公司(例如Activision Blizzard和Insomniac Games)受到罢工的影响。主要问题是如何通过寻求公司的同意,薪酬和透明度来监管语音参与者的AI数字复制品。公司与SAG-AFTRA之间的谈判继续进行解决。
三星电子揭幕了6G白皮书,并概述了AI本地和可持续沟通的方向
三星电子揭幕了6G白皮书,并概述了AI本地和可持续沟通的方向
2025-02-05 23:02:22
三星电子发行了一份新的6G白皮书,名为“ AI-NENATIANG&SUSTORABLE COMLACANCE”,详细介绍了下一代移动技术的趋势,包括AI集成和可持续性。该文档探讨了市场需求,诸如沉浸式XR,数字双胞胎和无处不在的连接等新兴服务,以及AI-NATIANITION系统和安全网络等关键属性。三星强调了6G标准化的重要性,并旨在与行业需求保持一致,同时增强网络质量以获得可持续的未来用户体验。
Galaxy S25和S25 Plus评论:关于AI的最好的事情是我几乎没有注意到它
Galaxy S25和S25 Plus评论:关于AI的最好的事情是我几乎没有注意到它
2025-02-05 22:39:00
根据提供的信息,这里是比较三星星系模型(假设Galaxy S23 Ultra,S23+和S23的比较)和iPhone 14 Pro Max:Max:###显示和设计: - **三星星系:** - 所有型号的峰值亮度最高2600列。 - OLED显示不同尺寸(S23 Ultra:6.8“,S23+:6.6”,S23:6.1”)。 - 防水和防尘性(IP68等级)。 - ** iPhone 14 Pro Max:** - 超级视网膜XDR显示屏,6.7英寸,峰值亮度最高为2000列。 - 陶瓷盾牌前盖,以实现耐用性。###摄像机: - **三星星系:** - 主相机(50MP宽镜头)。-S23 Ultra和S23+上的超宽相机(12MP),远摄(10MP),带有3倍光学变焦。 - 夜间模式,肖像模式,夜间肖像模式和其他特殊功能。 - ** iPhone 14 Pro Max:** - 主摄像头(48MP宽镜头)。 - 超宽(12MP),远摄(12MP),具有3倍光学变焦。 - Proraw支持,夜间模式和电影模式。### 表现: - **三星星系:** - Galapdragon 8 Gen 2用于银河系。-5G连接性。 - RAM选项因型号而异(S23 Ultra和S23+具有12GB RAM,S23具有8GB)。 - ** iPhone 14 Pro Max:**-A16仿生芯片。-5G支持。### 软件: - **三星星系:** - Android 15与三星的一个UI自定义接口。 - OS和安全更新7年。 - ** iPhone 14 Pro Max:**-IOS 16(可升级到较新版本)。 - 最多5年的软件支持。### 电池: - **三星星系:**-S23 Ultra:4000 mAh电池。-S23+:4900 mAh电池。-S23:3900 mAh电池。 - 无线Powershare,用于充电其他设备。 - ** iPhone 14 Pro Max:**-4,325mAh电池(估计)。 - MAGSAFE无线充电。###特殊功能: - **三星星系:** - Wi-Fi 6e和7个支持。-IP68防水性。 - 无线Powershare功能,用于为其他设备充电。 - ** iPhone 14 Pro Max:** - 超宽带技术(UWB)。 - 卫星紧急SOS。### 价格: - **三星星系:**-S23:起价为$ 799.99-S23+:起价$ 999.99-S23 Ultra:起价$ 1099.99 - ** iPhone 14 Pro Max:** - 128GB型号的起价为1,099美元。###测试方法:CNET和其他评论网站都进行了广泛的现实测试,包括: - 显示质量(亮度,清晰度)。 - 在各种照明条件下的相机性能。 - 通过日常使用和排水测试电池寿命。 - 使用Geekbench和3DMark等工具的性能基准测试。 - 防水性和耐用性测试。这种详细的方法可确保对每个设备能力的全面评估。
递归宣布有关铅基于AI的脑疾病候选药物的有希望的临床数据
递归宣布有关铅基于AI的脑疾病候选药物的有希望的临床数据
2025-02-05 22:12:25
递归药品宣布了其主要候选候选者Rec-994的2A期试验对脑海绵状畸形(CCM)的有希望的早期结果,这是一种罕见的神经系统疾病,其特征是脑中异常血管的特征。这标志着递归的重要里程碑,利用先进的AI驱动药物发现来满足稀有疾病中未满足的医疗需求。###密钥亮点:1。**起源与发展:**-Rec-994源自克里斯·吉布森(Chris Gibson)在犹他大学的研究生工作,利用基于AI的成像屏幕来识别可以逆转细胞疾病状态的化合物。 - 该化合物后来被许可回递归,作为其最早的候选人之一。2。**临床试验设计:** - 这是Rec-994的第一项机构支持的临床试验,其目标是在CCM的药物开发工作中达到几年。 - 第2A期试验的重点是利用AI驱动的精密医学方法,富含生物标志物的实体瘤和淋巴瘤。3。** AI驱动的药物发现:** - 递归的核心技术围绕着“递归操作系统(OS)”,该技术将现象数据集与先进的机器学习算法集成在一起。 - 该平台使用“生物学地图”将人类细胞系扰入疾病状态,并测试化合物进行逆转,从而产生数百万个生物学关系。4。**临床发展策略:** - 递归正在扩大对AI在临床试验设计中的使用,利用与Tempus,Helix和Faro Health的合作伙伴关系。 - 这些合作旨在加快协议设计,优化患者入学率并增强证据生成。5。**管道扩展:** - 递归的管道现在包括10个临床和临床前计划以及跨肿瘤和罕见疾病的10个高级发现管道计划。 - 该公司与Roche,Bayer,Merck Kgaa和Sanofi等领先的制药公司合作,以推进其药物开发工作。###行业背景: - **新兴范式:** - AI驱动的药物发现已成为一种可行的方法,可以解决临床试验中的高失败率。 - Rec-994的成功结果可以巩固递归在该领域的先驱地位,从而鼓励进一步采用AI技术。 - **竞争格局:** - 像Neurelis和Ovid/Graviton这样的其他公司也正在追捕CCM候选药物,但尚未达到临床试验阶段。 - 递归的头开始将其定位为有可能通过临床验证的这种罕见疾病的临床验证的治疗方法。###未来前景: - **正在进行的研究:** - 递归继续发展REC-1245,这是其第一个靶向实体瘤和淋巴瘤的AI生成的候选者,该候选已获得IND批准。 - 该公司仍然专注于扩大其在肿瘤学和罕见疾病方面的管道,同时利用战略伙伴关系来实现更广泛的影响。### 结论:Rec-994期2A期试验的早期结果代表了递归药物的重要里程碑。通过将先进的AI技术与临床开发相结合,递归为更高效,有效的药物发现过程铺平了道路。随着公司继续扩大管道和合作伙伴关系,它有可能在稀有疾病治疗和精密医学方面设定新标准。### 参考:-Chris Gibson博士(递归制药首席执行官)-Fay Lin,博士(Gen Biotechnology高级编辑)