2025-04-30 15:15:00 · 英文原文

我测试了10个AI内容探测器 - 每次都正确识别了AI文本

作者：Written by

cyber detective — Mustafahacalaki/Getty图像

当我第一次检查是否有可能与AI生成窃以及该方法如何起作用，那是2023年1月 - 世界上几个月来爆炸了对生成的AI。

还：2025年的前20个AI工具以及使用它们时要记住的第一件事

这是该2023年1月的原始文章的完全更新版本。当我第一次测试GPT探测器时，最佳结果是从三个可用的调查台之一中的一个正确的结果是66％。我最近的一组测试，即2025年2月，最多使用了10个检查员，其中3个表现得分完美。这次，仅几个月后，有五个。

我正在测试什么以及我如何做

不过，在继续之前，让我们讨论窃及其与我们的问题的关系。Merriam-Webster定义”抄袭“ as”偷走并删除（他人的想法或言语）自己的自己；使用（他人的生产）而不归功于来源。”

该定义非常适合AI创建的内容。当某人使用AI工具之类的人概念ai或者chatgpt不是窃取内容，如果该人不称赞来自AI的单词并声称自己是自己的单词，它仍然符合窃的字典定义。

还：Chatgpt写了您的内容的死赠品 - 以及如何处理它

要测试AI检测器，我使用五个文本块。我写了两个，三个是由Chatgpt撰写的。要测试内容检测器，我将每个块分别馈送到检测器并记录结果。如果检测器正确，我考虑通过测试。如果是错误的，我认为它失败了。

当检测器提供一个百分比时，我将任何超过70％的东西都视为强大的概率 - 无论是支持人写的还是AI编写的内容 - 并考虑探测器的答案。如果您想使用相同的文本块自己测试内容检测器，则可以从这个文档。

总体结果

为了评估AI探测器，我在10个检测器上重新读了我的五个测试系列。换句话说，我剪切并粘贴了50个单独的测试（我有一个很多咖啡）

我测试的探测器包括Brandwell，，，，海与串联，，，，GPT-2输出检测器，，，，gptzero，，，，语法，，，，莫妮卡，，，，原创性，，，，QuillBot，，，，无法检测到，，，，writer.com，和Zerogpt。

另外： 3个聪明的Chatgpt技巧，证明它仍然是AI

对于此更新，我添加了Copyleaks和Monica。我从测试中丢下写入，因为它停产其GPT检测器。内容守护者要求包含，但我没有及时听到测试帐户的回复。

该表显示了总体结果。如您所见，在所有测试中，五个检测器正确识别了人类和AI文本。

2025-04-content-detector-001 — David Gewirtz/Zdnet

我试图确定是否会随着时间的推移有切实的改进模式，因此我构建了一个图表，比较了五个测试的时间。到目前为止，我已经六次运行了这个系列赛，但是没有强大的趋势。我确实增加了测试和交换的检测器数量，但唯一一致的结果是测试5在跨检测器和日期之间可靠地鉴定为人类。

2025-04-content-detector-002 — David Gewirtz/Zdnet

我将随着时间的推移继续测试，希望我会始终如一地看到可靠性趋势。

尽管有一些完美的分数，但我不建议仅依靠这些工具来验证人写的内容。如图所示，非本地人的写作通常会被AI产生的评分。

即使我的手工制作的内容大多在本轮上被评为人文编写，但一个探测器（gptzero）宣称自己太不确定了，无法判断，另一个探测器（Copyleaks）宣布了AI编写。结果在整个系统之间存在极大的不一致。

还：最好的AI聊天机器人：Chatgpt，Copilot和著名的替代方案

底线：在依靠这些工具的任何或全部的结果之前，我会提倡谨慎。

每个AI内容检测器的执行方式

现在，让我们看一下按字母顺序列出的每个单独的测试工具。

Brandwell AI内容检测（准确40％）

该工具最初是由AI内容生成的公司生产的。后来迁移到Brandwell.ai，以AI为中心的营销服务公司的新名称。

另外： AI生成的图像是法律上的混乱 - 仍然是一个非常人性化的过程

不幸的是，其准确性很低。该工具无法判断测试2中的AI生成的含量是人类还是AI，如此屏幕截图所示：

海laks（准确性80％）

我觉得很有趣海与串联当超过一半的测试探测器的表现效果更好时，自称是“准确性超过99％的最精确的AI检测器”。但是营销人员将是营销人员 - 最高级的人很难抵抗像在松鼠（以及Fedex卡车和所有邻居的孩子）的吠叫一样。

另外： 苹果AI工具可以随时微调您的写作的5种快速方法

该公司的主要产品是窃的检查员，出售给了教育机构，出版商和企业，以确保内容创意和维护学术完整性。

GPT-2输出探测器（准确性60％）

该工具是使用由纽约AI公司管理的机器学习中心构建的拥抱脸。尽管该公司已获得4000万美元的资金来开发其自然语言图书馆，但GPT-2检测器似乎是使用拥抱Face Transformers库的用户创建的工具。

gptzero（准确性80％）gptzero

显然已经在增长。当我第一次测试它时，该网站是简单的 - 甚至还不清楚Gptzero是公司还是某人的激情项目。现在，该公司拥有一个完整的团队，其使命是“保护人类的东西”。它提供了AI验证工具和窃检查器。

另外： 2025年最受欢迎的AI工具（这甚至意味着什么）

不幸的是，性能似乎有所下降。在我的最后两次跑步中，gptzero正确地将我的文本确定为人类生成。这次，它宣布了与AI生成的同一文本。

语法（准确40％）语法

以帮助作家制作语法正确的内容而闻名 - 这不是我在这里测试的内容。语法可以检查窃和AI内容。在语法检查器中，右角有一个pla窃和AI文本检查按钮：

我在这里没有测量窃检查器的准确性，但即使语法的AI检查准确性很差，该网站也正确地识别了先前发布的测试文本。

莫妮卡（准确性100％）莫妮卡

是一个新进入者。这项服务提供了一项多种服务的AI助手。用户可以从各种大型语言模型中进行选择。

另外： Chatgpt可以帮助您撰写论文的5种方法

该公司将莫妮卡称为“最佳AI检测器在线”，但看起来它通过包括Zerogpt，Gptzero和Copyleaks在内的其他检测器运行内容。奇怪的是，Gptzero和Copyleaks在我的测试中表现不佳，但是Monica和Zerogpt却做到了。

我们将其100％提供给它，因为它获得了该评分，但是我会看到它在以后的测试中如何表现。

原创性。EA（准确100％）原创性

是一家商业服务，将自己视为AI和pla窃检查器。该公司出售用法信用：我在本文中使用了30个学分。他们以每月12.95美元的价格出售2,000个积分。我通过系统抽1,400个单词，仅使用了每月分配的1.5％。

QuillBot（准确性100％）

我测试的最后几次QuillBot，结果非常不一致 - 相同文本的多次通过产生的分数差异很大。但是，这一次它是岩石固体，100％正确。所以我给了它胜利。几个月后，我会回来查看它是否符合此表演。

无法检测到的ai（准确100％）

无法检测到的最大的说法是它可以“人性化” AI生成的文本，因此检测器不会标记它。我没有测试该功能 - 它使我成为专业作家和教育家，因为这似乎是在作弊。

另外： 为什么您应该忽略99％的AI工具 - 我每天使用哪四个

但是，该公司还拥有一个AI检测器，这非常重要。

AI检测器通过了所有五项测试。注意显示其他检测器的标志的指标。该公司表示：“我们开发了以这些主要检测器建模的多个检测器算法，以提供一种基于联合和共识的方法。它们并未将其直接输入列出的模型；相反，这些模型是根据它们生成的结果进行培训的。当它说这些模型标记时，它是基于这些模型创建和更新这些模型的。”

另外： 如何使用chatgpt：最受欢迎的AI聊天机器人的初学者指南

我确实对OpenAi国旗有疑问，因为OpenAI的内容探测器在2023年由于精度较低而停产。即便如此，无法检测到的。IAI都检测到了所有五项测试，获得了完美的100％。

writer.com AI内容检测器（准确40％）writer.com

是为公司团队生成AI写作的服务。它是AI内容检测器工具可以扫描生成的内容。不幸的是，其准确性很低。即使六个测试中的三项是由Chatgpt编写的，它将每个文本块都标识为人文编写。

Zerogpt（准确100％）Zerogpt

自从我上次评估以来，已经成熟。然后，没有列出公司名称，并且该网站上有Google Ads的挑战，并且缺乏明确的货币化。该服务运行良好，但似乎很粗略。

另外： AI会破坏人类的创造力吗？不 - 这就是为什么

那种粗略的感觉消失了。Zerogpt现在以典型的SaaS服务呈现，并提供定价，公司名称和联系信息。它的准确性也提高了：上次是80％；这次，它得分为5分。

是人类，还是人工智能？

你呢？您是否尝试过AI内容检测器，例如Copyleaks，Monica或Zerogpt？他们在您的经验方面有多准确？您是否使用这些工具来保护学术或编辑的完整性？您是否遇到过将人工写作的作品错误地标记为AI的情况？您是否比其他探测器比其他探测器评估了独创性？在下面的评论中让我们知道。

每天与我们的收件箱中获取早晨的顶级故事 今日技术新闻通讯。

您可以在社交媒体上关注我的日常项目更新。确保订阅我的每周更新时事通讯，并在Twitter/X上关注我@davidgewirtz，在Facebook上facebook.com/davidgewirtz，在Instagram上instagram.com/davidgewirtz，在布鲁斯基（Bluesky）@davidgewirtz.com，在YouTube上youtube.com/davidgewirtztv。.

关于《我测试了10个AI内容探测器 - 每次都正确识别了AI文本》的评论

暂无评论

发表评论

摘要

基于摘要中提供的详细分析，很明显，在AI内容探测器之间的准确性差异很大。这是一些关键要点：1。**高度精确的探测器：** - **莫妮卡：**这次是100％准确的，但是一个新的进入者，因此需要进一步的测试。 - ** Originality.ai：**在多个测试中始终如一地纠正。 - ** Quillbot：**最近变得非常可靠，并正确识别了所有测试用例。 - ** Undectable.ai：**检测到所有AI生成的内容，并显示了其他检测器的标志。 - ** Zerogpt：**显着成熟，现在在检测人类和AI含量时100％精确。2。**中度至低精度：** - ** Copyleaks：**这次表现不佳，在识别AI编写的内容时出现了重大错误。 - ** writer.com AI内容检测器：**尽管三个来自chatgpt，但将所有测试用例误认为是人类生成的文本。 - ** Undectable.ai在Openai上的旗帜：**好奇，鉴于Openai的探测器由于准确性较低而停止了。3。**未来的注意事项：** - 请留意莫妮卡（Monica）等新进入者，这可以通过联合方法提供其他检测层。 - 持续测试和更新至关重要，因为AI模型迅速发展，从而影响探测器的有效性。 - 信任诸如Originality.ai和Zerogpt之类的成熟服务似乎是根据一致的性能而得到的。###用户体验：如果您使用这些工具，请考虑共享： - **准确性：**他们多久正确地识别人类与AI内容？ - **误报/负面因素：**是否有一个实例将真正的人工作品标记为AI，反之亦然？ - **用例：**学术论文，新闻文章，博客 - 在哪些情况下，您发现这些工具最有帮助？###其他见解： - **联合方法：**诸如Undectect.ai之类的服务，来自多个检测器的数据可能会提供更强大的结果。 - **教育意义：**讲师和编辑可以使用高度准确的探测器来确保学术或编辑的完整性，而不会惩罚合法人类的贡献。您是否有兴趣分享有关这些工具的任何经验或见解，特别是专注于它们的准确性和实用性？

OC