ProLix的词汇和无偿曲折的措辞使人们感到愤怒,这些措辞经常渗透到技术论文,哲学论述或因缺乏言辞经济困扰的记者的蜿蜒曲折的言论吗?然后,Google为您提供了一个新的AI功能 - 只要您使用iOS,也就是说。
巧克力工厂周二为iOS的Google应用程序添加了一项新功能,称为“简化,“这是为了愚弄复杂的写作而不会失去其含义。
简化的iOS应用程序附加了研究证明了它的有效性以及对Google如何实现系统的解释。技术巨头所说的“小说”•自动化评估和迭代及时精致循环呼应一种评估另一个模型的想法 - 在概念上让人联想到一个好的老式老式的想法生成对抗网络(gan) - 因此,这是自动驾驶仪上迅速工程的情况,而不是改变游戏规则的创新。
正如Google在其研究博客中所解释的那样,该系统的工作原理:用户从iOS Google应用程序内置的Web浏览器中选择了网页上的一块文本,简化了TAPS,然后一对Gemini Bots开始工作以使其更可读。”
该系统使用两种评估方法进行工作:一种可读性评估,其中一个双子座机器人以1-10的分数为段落的可读性得分,而忠诚度评估是第二个双子座bot(模型的运行版本1.5 Pro)用于“模型的映射声明”,“从原始文本到简化版本”,查看是否丢失或丢失了任何重要信息。
双子双子座通过可读性和保真度评估来来回来回进行优化,然后为读者吐出来,就像Google在Emphysema上提供的医疗文件提供的以下示例一样。
Google谈到其工作时说:“这个自动化过程,一个LLM评估了另一个过程,并根据绩效指标和颗粒状错误来完善其说明,这代表了一个关键的创新。”
自从我们听说两个神经网络相互对抗以获得的想法以来已经有几年了更好的输出,但这听起来很像Boffins设法重塑的山景。
Google告诉我们,当似乎像gan一样,简化实际上并未使用甘恩使用的特定方法(例如,生成与模型的真实数据无法区分的合成数据)。Google发言人告诉我们,差异是微妙的,但是简化的是使用多个LLM来消除设计特定提示的需求,而不是使用多个LLM来生成特定的输出。
根据Google的统计数据,抛开它是创新的还是简单的迭代性,简化的作品。开发开发的研究人员通过介绍了4,563个人具有原始和简化的段落,然后提出多项选择问题来衡量他们对内容的理解程度,并发现“统计学上的显着结果表明简化的价值”。
根据他们的发现,摘录的简化版本导致了4%的准确测验得分,在某些领域(例如医学文本(改善15%)和财务文档(6%)(6%))中的测验得分更高。
但是,他们确实承认,即使简化了术语写作,LLM仍然可以弄错事情。研究人员指出:“尽管我们的系统旨在实现高保真度,但LLM错误是可能的,需要持续的警惕。”如果食用摘要的人无法完全理解原件,则不知道谁会行使这种警惕。
顺便说一句,Google告诉我们它仍在其iOS用户群上推出,因此,如果您找不到,这就是原因。对不起,Android用户 - Google告诉我们,对于“其他平台”添加简单的内容,它没有什么可分享的。哎哟。®