OpenAI 于 2022 年 11 月推出 ChatGPT 几个月后,该服务开始在中国起飞,公民用它来讽刺亲政府人物和寻求家庭作业帮助。由于 OpenAI 限制中国用户的访问,因此当地开发者创建了镜像站点以方便访问该服务。但 ChatGPT 在中国的繁荣是短暂的。新研究发现,中国政府于 2023 年 3 月 2 日封锁了 ChatGPT 域名。
从历史上看,追踪中国当局封锁特定域名的具体时间非常困难,因为研究人员必须选择测试各个域名。但根据新推出的平台 GFWeb(该平台授予世界其他地区独家优先访问权),在中国政府首次屏蔽 ChatGPT 的同一个月,当局还屏蔽了数十个使用 ChatGPT 技术的替代聊天机器人和网站。世界其他地区还发现,流行的机器学习平台 Hugging Face 在该公司报告问题前几个月就在中国被屏蔽。
GFWeb 现在免费向公众开放,并持续测试来自中国的数百万个网站。中国境内和境外的用户都可以确定这些内容何时不再对中国用户开放。它利用防火墙独特的过滤行为来检测哪些站点被阻止。该服务主要由非营利性开放技术基金资助,并收到了不列颠哥伦比亚大学、多伦多大学、芝加哥大学和石溪大学教师的研究投入。
该系统不仅增强了我们的能力平台开发者、不列颠哥伦比亚大学计算机科学家 Nguyen Phong Hoang 告诉《世界其他地区》,该平台不仅能够跟踪审查事件的时间和范围,还有助于识别防火墙所采用策略的模式和变化。我希望 GFWeb 能够帮助研究人员、政策制定者和公众更深入地了解中国审查制度的演变。
此前尚不清楚 Hugging Face 何时在中国首次被屏蔽。2023 年 10 月,该公司报告了该国令人遗憾的无障碍问题。事实上,GFWeb 数据表明 Huggingface.co 实际上是在 2023 年 5 月 7 日被屏蔽的,也就是该公司发现问题的几个月前。
来自 GFWeb 的数据使观察者能够发现长期趋势。例如,这表明中国当局特别关注用于内容生成的人工智能工具。除了似乎使用 ChatGPT 技术的网站外,大多数被屏蔽的 AI 网站都包含辅助视频和图像编辑的工具。其中包括 OpenArt 和 VoiceDub 等服务。
这表明中国共产党对不受政权控制的内容生成平台非常敏感。乔治华盛顿大学政治学助理教授、研究中国技术能力的权威专家杰弗里·丁 (Jeffrey Ding) 告诉世界其他地区,这是主要威胁。
阻止人工智能网站可能不会阻止开发人员使用 VPN [虚拟]丁说,私人网络]可以访问这些工具,但对于普通中国人使用人工智能生成政治敏感内容(例如取笑中共领导人的视频或有关中国腐败的对联)来说,存在摩擦。
他指出去年在西方社交媒体平台上流传的一段由人工智能操纵的视频,视频中中国国家主席习近平用流利的英语对美国社会进行了赞美。它包含许多不准确之处,而且习近平从未用英文发表过完整的讲话。
人工智能操纵的内容可能歪曲中国领导人,这正是北京不想在自己的社交媒体上看到的内容”,丁说。
使用该工具对世界其他地区进行的分析发现,审查活动的激增与重大事件(例如新的人工智能法规的通过)之间存在相关性。例如,今年春天,数百个与宗教相关的人工智能网站(包括 Biblechat.ai 和 Church.ai)被屏蔽,恰逢与灵性相关的人工智能应用程序的启动激增。
该系统不不仅增强了我们跟踪审查事件的时间和范围的能力,而且还有助于识别防火墙所采用策略的模式和转变。
2023 年 1 月,中国成为第一个世界各国将出台管理人工智能深度伪造技术的规则,并于 2023 年 8 月实施全面的生成式人工智能法规。这些日期也对应着人工智能领域封锁的增加。
耶鲁大学法学院蔡保罗中国中心高级研究员杰里米·道姆 (Jeremy Daum) 表示,数据表明当局正在将现有的审查协议应用于新的人工智能技术。
流量最大的大牌将会被屏蔽。除此之外,似乎还有一个发现期,所以你会看到一批批网站受到审查,他告诉世界其他地区。这个过程总是很神秘,在较低级别上有一些自动化,但当批量阻止时,这通常是由 CAC(中国国家互联网信息办公室)官员决定的。
来自中国公司的流行人工智能聊天机器人必须遵守审查制度包括百度的 Ernie Bot、阿里巴巴的统一钱文、字节跳动的豆宝以及一系列中国初创公司。
Phong 之前是 GFWatch 的首席研究员,这是一项为期 9 个月的大型研究,提供了对中国的见解域阻止行为并为 GFWeb 的设计铺平了道路。他曾在土库曼斯坦和中东部分地区从事过有关互联网审查制度的小规模研究。
出于安全原因,查理·史密斯 (Charlie Smith) 使用化名,他是 GreatFire.org 的联合创始人,该网站提供分析和规避中国互联网审查的工具。史密斯说,冯的工作为研究人员开辟了令人兴奋的可能性。
了解审查的确切日期有很多帮助。例如,我们可以确定网站是否因某些事件而被屏蔽,他告诉世界其他地区。它还有助于展示当局如何封锁这些网站。他们大多在周一封锁吗?他们周末工作吗?我们将能够确定当局是否按照某种模式封锁网站。
史密斯说,GFWeb 系统应该鼓励更多的人自己发起测试,这可以极大地扩展我们对中国互联网控制的了解。