作者:Written by
当我第一次检查是否有可能与AI生成窃以及该方法如何起作用,那是2023年1月 - 世界上几个月来爆炸了对生成的AI。
还:2025年的前20个AI工具以及使用它们时要记住的第一件事
这是该2023年1月的原始文章的完全更新版本。当我第一次测试GPT探测器时,最佳结果是从三个可用的调查台之一中的一个正确的结果是66%。我最近的一组测试,即2025年2月,最多使用了10个检查员,其中3个表现得分完美。这次,仅几个月后,有五个。
不过,在继续之前,让我们讨论窃及其与我们的问题的关系。Merriam-Webster定义”抄袭“ as”偷走并删除(他人的想法或言语)自己的自己;使用(他人的生产)而不归功于来源。”
该定义非常适合AI创建的内容。当某人使用AI工具之类的人概念ai或者chatgpt不是窃取内容,如果该人不称赞来自AI的单词并声称自己是自己的单词,它仍然符合窃的字典定义。
要测试AI检测器,我使用五个文本块。我写了两个,三个是由Chatgpt撰写的。要测试内容检测器,我将每个块分别馈送到检测器并记录结果。如果检测器正确,我考虑通过测试。如果是错误的,我认为它失败了。
当检测器提供一个百分比时,我将任何超过70%的东西都视为强大的概率 - 无论是支持人写的还是AI编写的内容 - 并考虑探测器的答案。如果您想使用相同的文本块自己测试内容检测器,则可以从这个文档。
为了评估AI探测器,我在10个检测器上重新读了我的五个测试系列。换句话说,我剪切并粘贴了50个单独的测试(我有一个很多咖啡)
我测试的探测器包括Brandwell,,,,海与串联,,,,GPT-2输出检测器,,,,gptzero,,,,语法,,,,莫妮卡,,,,原创性,,,,QuillBot,,,,无法检测到,,,,writer.com, 和Zerogpt。
对于此更新,我添加了Copyleaks和Monica。我从测试中丢下写入,因为它停产其GPT检测器。内容守护者要求包含,但我没有及时听到测试帐户的回复。
该表显示了总体结果。如您所见,在所有测试中,五个检测器正确识别了人类和AI文本。
我试图确定是否会随着时间的推移有切实的改进模式,因此我构建了一个图表,比较了五个测试的时间。到目前为止,我已经六次运行了这个系列赛,但是没有强大的趋势。我确实增加了测试和交换的检测器数量,但唯一一致的结果是测试5在跨检测器和日期之间可靠地鉴定为人类。
我将随着时间的推移继续测试,希望我会始终如一地看到可靠性趋势。
尽管有一些完美的分数,但我不建议仅依靠这些工具来验证人写的内容。如图所示,非本地人的写作通常会被AI产生的评分。
即使我的手工制作的内容大多在本轮上被评为人文编写,但一个探测器(gptzero)宣称自己太不确定了,无法判断,另一个探测器(Copyleaks)宣布了AI编写。结果在整个系统之间存在极大的不一致。
还:最好的AI聊天机器人:Chatgpt,Copilot和著名的替代方案
底线:在依靠这些工具的任何或全部的结果之前,我会提倡谨慎。
现在,让我们看一下按字母顺序列出的每个单独的测试工具。
该工具最初是由AI内容生成的公司生产的。后来迁移到Brandwell.ai,以AI为中心的营销服务公司的新名称。
另外: AI生成的图像是法律上的混乱 - 仍然是一个非常人性化的过程
不幸的是,其准确性很低。该工具无法判断测试2中的AI生成的含量是人类还是AI,如此屏幕截图所示:
我觉得很有趣海与串联当超过一半的测试探测器的表现效果更好时,自称是“准确性超过99%的最精确的AI检测器”。但是营销人员将是营销人员 - 最高级的人很难抵抗像在松鼠(以及Fedex卡车和所有邻居的孩子)的吠叫一样。
该公司的主要产品是窃的检查员,出售给了教育机构,出版商和企业,以确保内容创意和维护学术完整性。
该工具是使用由纽约AI公司管理的机器学习中心构建的拥抱脸。尽管该公司已获得4000万美元的资金来开发其自然语言图书馆,但GPT-2检测器似乎是使用拥抱Face Transformers库的用户创建的工具。
显然已经在增长。当我第一次测试它时,该网站是简单的 - 甚至还不清楚Gptzero是公司还是某人的激情项目。现在,该公司拥有一个完整的团队,其使命是“保护人类的东西”。它提供了AI验证工具和窃检查器。
不幸的是,性能似乎有所下降。在我的最后两次跑步中,gptzero正确地将我的文本确定为人类生成。这次,它宣布了与AI生成的同一文本。
以帮助作家制作语法正确的内容而闻名 - 这不是我在这里测试的内容。语法可以检查窃和AI内容。在语法检查器中,右角有一个pla窃和AI文本检查按钮:
我在这里没有测量窃检查器的准确性,但即使语法的AI检查准确性很差,该网站也正确地识别了先前发布的测试文本。
是一个新进入者。这项服务提供了一项多种服务的AI助手。用户可以从各种大型语言模型中进行选择。
该公司将莫妮卡称为“最佳AI检测器在线”,但看起来它通过包括Zerogpt,Gptzero和Copyleaks在内的其他检测器运行内容。奇怪的是,Gptzero和Copyleaks在我的测试中表现不佳,但是Monica和Zerogpt却做到了。
我们将其100%提供给它,因为它获得了该评分,但是我会看到它在以后的测试中如何表现。
是一家商业服务,将自己视为AI和pla窃检查器。该公司出售用法信用:我在本文中使用了30个学分。他们以每月12.95美元的价格出售2,000个积分。我通过系统抽1,400个单词,仅使用了每月分配的1.5%。
我测试的最后几次QuillBot,结果非常不一致 - 相同文本的多次通过产生的分数差异很大。但是,这一次它是岩石固体,100%正确。所以我给了它胜利。几个月后,我会回来查看它是否符合此表演。
无法检测到的最大的说法是它可以“人性化” AI生成的文本,因此检测器不会标记它。我没有测试该功能 - 它使我成为专业作家和教育家,因为这似乎是在作弊。
另外: 为什么您应该忽略99%的AI工具 - 我每天使用哪四个
但是,该公司还拥有一个AI检测器,这非常重要。
AI检测器通过了所有五项测试。注意显示其他检测器的标志的指标。该公司表示:“我们开发了以这些主要检测器建模的多个检测器算法,以提供一种基于联合和共识的方法。它们并未将其直接输入列出的模型;相反,这些模型是根据它们生成的结果进行培训的。当它说这些模型标记时,它是基于这些模型创建和更新这些模型的。”
另外: 如何使用chatgpt:最受欢迎的AI聊天机器人的初学者指南
我确实对OpenAi国旗有疑问,因为OpenAI的内容探测器在2023年由于精度较低而停产。即便如此,无法检测到的。IAI都检测到了所有五项测试,获得了完美的100%。
是为公司团队生成AI写作的服务。它是AI内容检测器工具可以扫描生成的内容。不幸的是,其准确性很低。即使六个测试中的三项是由Chatgpt编写的,它将每个文本块都标识为人文编写。
自从我上次评估以来,已经成熟。然后,没有列出公司名称,并且该网站上有Google Ads的挑战,并且缺乏明确的货币化。该服务运行良好,但似乎很粗略。
那种粗略的感觉消失了。Zerogpt现在以典型的SaaS服务呈现,并提供定价,公司名称和联系信息。它的准确性也提高了:上次是80%;这次,它得分为5分。
你呢?您是否尝试过AI内容检测器,例如Copyleaks,Monica或Zerogpt?他们在您的经验方面有多准确?您是否使用这些工具来保护学术或编辑的完整性?您是否遇到过将人工写作的作品错误地标记为AI的情况?您是否比其他探测器比其他探测器评估了独创性?在下面的评论中让我们知道。
每天与我们的收件箱中获取早晨的顶级故事 今日技术新闻通讯。
您可以在社交媒体上关注我的日常项目更新。确保订阅我的每周更新时事通讯,并在Twitter/X上关注我@davidgewirtz,在Facebook上facebook.com/davidgewirtz,在Instagram上instagram.com/davidgewirtz,在布鲁斯基(Bluesky)@davidgewirtz.com,在YouTube上youtube.com/davidgewirtztv。.