人工智能的幻觉让我发疯。另外,当幻觉发生时,信任和捍卫我周围的人对人工智能的使用变得更加困难。
一旦我告诉别人我尝试使用 ChatGPT 进行诊断,他们就会睁大眼睛看着我,好像我犯了第一个严重错误。
可悲的是,他们并不完全错误,因为我在事实核查和溯源时也有过类似的经历。如果您不小心,这些聊天机器人可能会让您在寻找答案时完全偏离正轨。
最近,我一直在大量使用人工智能进行故障排除和事实核查。这就是我注意到人工智能幻觉已经失控的地方。
这几乎就像我在兜圈子,因为聊天机器人不断重复相同的结论,尽管我过去说过它们并不适合我的情况。
由于这种混乱的经历,我找到了新的方法来避免被锁定在我的提示之外(我是所有帐户的免费用户)。
我已经将练习融入到我的即兴写作中。虽然它仍然不完美,但这就是我开始采用的方法,所以我不再因为我在我的电脑上免费尝试人工智能聊天机器人而感到被骗了。安卓手机和电脑。
让人工智能意识到它的幻觉
要求它验证自己的答案
我发现用更多问题探究其逻辑是让人工智能摆脱困境的好方法。
例如,人工智能向我推荐了一个程序(我当时使用的是 ChatGPT),它会给我一个明确的、结论性的结果。绝对可以肯定这个程序可以解决我的硬件问题。
我对使用该程序持怀疑态度(它是为超频机器设计的),因此我试图表达我的担忧 - 基本上,我对这个建议缺乏信心。
然后 ChatGPT 会重新评估其置信度,并重新评估为什么答案可能不再 100% 确定。
我用于 ChatGPT 的提示是:
嘿 ChatGPT,关于 [空白] 上的 [你的答案],我读到 [插入矛盾或担忧],这是真的吗?你能告诉我为什么这可能是真的吗?
当我需要打破 ChatGPT 的注意力,以免它继续吐出虚假信息时,这个提示对我来说效果最好。
另一种方法是要求它改变方向。您可以使用提示来基本上重新引导其逻辑。
我使用过的对我来说效果很好的一个是:
嘿 ChatGPT,你能幽默一下并告诉我为什么这不是答案吗?
它迫使人工智能通过考虑双方来重新评估其对答案的信心。然后你可以使用后续提示来找出论点中的漏洞。
当您这样做时,您会强制基于 LLM 的聊天机器人在提出索赔之前检查自己的工作。
在提示中使用中性语言并询问来源
您希望避免引入偏见和包容性
对我来说幸运的是,我可以识别人工智能何时可能产生幻觉,因为我对主题有足够的了解,可以看出它传递的信息可能是错误的。但我知道如果你不熟悉这个主题的话很难做到。
当我做研究时,如果可能的话,我会要求聊天机器人,无论是 Claude、CoPilot、Gemini 还是 ChatGPT,如果可以的话,提供来源。
这样,您就可以阅读完整的源代码,并查看人工智能是否将这些源代码组合起来得出不准确的答案。我以前必须纠正这个问题。
例如,我查找了一家公司,但还有另一家公司名称相似。一个专注于 STEM 相关研究,而另一个则纯粹专注于金融。
我向 Gemini 询问了该公司的业务及其背景的内幕。事实证明,双子座混淆了消息来源,给了我相互矛盾的信息(本质上是将它们合并为一家公司)。
最终,我进行了自己的研究并了解了它的作用:结合所有内容并挑选信息。遗憾的是,在这种情况下,两家公司都与另一家公司没有关联。
就在那时我知道我需要提高我的即兴写作。
经过一番尝试和错误以及一些研究后,我发现两个自定义提示确实改善了我得到的答案。
第一个涉及要求其给出的任何回复的来源归属。
使用的提示:
嘿 ChatGPT/Gemini,在回答我的问题时,能否请您提供每项声明的引用,并在适用时提供 URL。请仅使用信誉良好、权威的来源。
然后,如果我发现答案是错误的或者是幻觉,我会发送我自己的消息来源并要求它根据提供的信息(作为起点)做出响应,或者声明我不相信那些没有消息来源的说法。
当您将人工智能连接到可信的、精心策划的知识库或特定文档来回答问题时,这被称为检索增强生成(RAG)。这种方法有助于防止人工智能根据其训练数据产生有偏见的反应。
第二个是我尝试过的几年前的 Reddit。当我需要分解代码、了解调试过程或掌握一些基础知识时,这种方法很有帮助。
使用的提示:
一步步思考。仔细考虑我的问题,并考虑最能回答我的问题的人的学术或专业知识。您拥有该领域专业知识的人的经验。提供帮助并详细回答,同时更愿意使用来自信誉良好的来源的信息。
鉴于我在获取事实答案时遇到问题,因为聊天机器人有时过于强调用户生成的内容,这对保持事物的过滤很有帮助。
可悲的是,任何人都可以在 Reddit 和 Quora 上发帖,这通常使得评估这些答案的准确性变得困难。即使答案被高度评价为最佳答案,但这并不一定意味着它是正确的。
保持人工智能专注并脚踏实地
我最近使用的一种方法是我的网络浏览器中的“询问双子座”功能。您还可以使用在 Google Workspace 中询问 Gemini使用 Google 表格、文档等。
我发现这比仅仅打开另一个选项卡或使用专用应用程序更有用,因为它让 Gemini 专注于我当前正在处理的工作。
我主要用的是这个总结 YouTube 视频这样我就可以在不看内容的情况下找到内容,也可以在较长的文章中找到信息而无需完全阅读它们。如果内容证明与我的问题相关,那么我将观看完整视频并阅读文章。
这就是我如何过滤与我的研究相关的内容,同时确保人工智能的范围仍然集中在上下文(选项卡的内容或您也与之共享的内容)上。
另外,根据美联储的上下文,我可以轻松验证双子座传递的信息是否真实。
这是一个无缝工具,我推荐更多人尝试。