Claude 的新 AI 数据分析工具与 ChatGPT 的版本相比如何(提示:没有)

2024-10-28 14:47:00 英文原文

作者:Written by David Gewirtz, Senior Contributing Editor Oct. 28, 2024 at 6:47 a.m. PT

big data concept
JuSun/盖蒂图片社

上周,Anthropic(已来自亚马逊的 4B 美元投资)宣布Claude 3.5 Sonnet 现在支持数据分析。TechCruch 的标题

对于这种能力,“Anthropic 的人工智能现在可以运行和编写代码”。这在技术上是正确的,但不要太兴奋。克劳德不会坐在那里为您模拟所有代码。现实情况要有限得多。

还:人工智能会让数据科学过时吗?

Anthropic 宣布的功能类似于 ChatGPT 的高级数据分析。一个区别是克劳德的分析工具可供所有人使用,包括免费用户。ChatGPT 的高级数据分析仅适用于企业帐户用户每月支付 20 美元或更多。

生成代码

两个都聊天GPTPlus 和 Claude 通过编写和运行解析和处理数据的代码片段来执行数据分析。一个关键的区别是 Claude 使用 JavaScript 编写代码,而 ChatGPT 使用 Python 编写代码。

还:2024 年最流行的编程语言(以及这意味着什么)

这些都是有趣的选择。Python 拥有丰富的数值分析库生态系统,例如 Pandas、NumPy 和 SciPy。JavaScript 也拥有丰富的生态系统,但其数据和人工智能产品并不像 Python 那样广泛。Python 在机器学习和人工智能方面非常强大,拥有 TensorFlow、PyTorch 和 Keras 等框架。Python 还为大数据提供了出色的支持,不过,正如您将看到的,Claude 当前的分析工具甚至不能被视为中等数据。

相比之下,JavaScript 非常适合网页中的数据可视化。Anthropic 解决方案使用 React,但也有很棒的可视化库,如 D3.js 和 Chart.js 可用于信息呈现。我确实发现奇怪的是,使用如此出色的可视化工具,我使用 Claude 生成的饼图往往会砍掉某些类别的数据标签。

另外: 2024 年最佳编码人工智能(以及不该使用的人工智能)

当您要求 Claude 处理数据时,它会为您提供其输出,但也允许您查看它生成的用于进行数据分析的底层代码。这是一个例子。

code
David Gewirtz/ZDNET 截图

使用限制

我决定用Claude来测试一下它的分析能力。我将我的使用限制为免费版本。根据 Claude 的常见问题解答,20 美元/月的 Pro 版本将使用限制提高了五倍。

pro-usage
David Gewirtz/ZDNET 截图

这对于认真使用来说可能是必要的,因为经过大约 20 分钟的测试后,我被关闭了。

shut-down
David Gewirtz/ZDNET 截图

我确实尝试打开一个新的聊天室,但它没有让我重新进入。等了一个小时后,我能够问更多问题。

编写代码来清理数据

为了测试Claude的数据分析能力,我去了数据网网站并下载了一个社会保障管理局数据集关于社会保障卡申请中衍生的婴儿姓名使用情况。

该数据以 ZIP 文件的形式出现。我提取了 145 个逗号分隔值 (CSV) 文本文件,其中包含从 1880 年到 2023 年的婴儿姓名数据,每年一个文件。

还:我将 Claude 3.5 Sonnet 与 AI 编码测试 ChatGPT aced 进行了比较,结果创造性地失败了

我首先尝试选择所有文件并将它们作为一个组导入到 Claude 中。我被告知克劳德一次只会导入五个文件。

five-files
David Gewirtz/ZDNET 截图

因此,我决定编写一个脚本来创建包含所有数据的单个文件。问题是每个单独的文件都不包含年份作为字段之一。因此,我的脚本必须将文件名中的年份添加到文件中的每个记录,然后对所有文件执行此操作。

我没有自己编码,而是请克劳德为我做。

我需要在 Macintosh 上快速合并 145 个文本文件。每个文件名由字母 yob 后跟四个数字组成,表示年份,后跟 .txt。文件本身是逗号分隔的值。对于每个文件,我需要在相应文件的每一行前面添加文件名中包含的年份,后跟逗号。然后我需要将所有 145 个文件合并到一个主文件中。我怎样才能快速做到这一点?

它创建了一个看起来可以完成这项工作的 shell 脚本。

script1
David Gewirtz/ZDNET 截图

我保存了脚本并运行它。 

shell1
David Gewirtz/ZDNET 截图

它有效并且完全按照我的要求进行。运行该 shell 脚本的结果是一个 37MB 的文件。不幸的是,我很快发现 37MB 超出了 Claude 的上传限制 30MB。我需要一个小得多的数据集。

我认为,如果我每十年仅使用一个文件中的名称数据,而不是使用每年的名称数据,我会将数据集大小减少到原始大小的 10%。所以我改变了我的提示并将其反馈给克劳德。

我需要在 Macintosh 上快速合并 145 个文本文件。每个文件名由字母 yob 后跟四个数字组成,表示年份,后跟 .txt。文件本身是逗号分隔的值。对于每个文件名以 0.txt 结尾的文件,请在相应文件的每一行前面添加文件名中包含的年份,后跟逗号。然后需要将所有以0.txt结尾的文件合并为一个主文件。编写一个 shell 脚本来执行此操作。

这和第一个提示一样有效,我得到了一个 3.9MB 的文件。

总的来说,我对今天的 Claude 3.5 Sonnet 的编码工作非常满意。我已经之前通过我的一系列编码测试运行了法学硕士没有取得多大成功。所以很高兴这次看到它顺利运行。不幸的是,这是今天测试过程的最后一部分,进展顺利。

克劳德的更多限制

那么我们来看看克劳德的数据分析。不幸的是,克劳德在可以摄取的数据量方面似乎非常有限。克劳德说其专业版“与我们的免费服务相比,使用量至少增加了 5 倍”,并且“如果您的对话相对较短,则预计每 5 小时至少发送 45 条消息。”

另外: 人工智能骗局已经渗透到针织和钩针世界 - 为什么它对每个人都很重要

那不是很多。虽然 Claude 确实说您可以上传 5 个文件和 30MB,但我发现我的合并 3.9MB 文件被认为超出了其长度限制的 9124%。该文件包含 219,181 条记录。

9124-over
David Gewirtz/ZDNET 截图

好吧,好吧。所以后来我尝试了一个文件一年。文件 yob2020.txt 只有 561KB,仅包含 31,550 条记录。该文件显然超出了 Claude 长度限制的 1239%。

1239-over
David Gewirtz/ZDNET 截图

做一些数学计算,假设您没有达到他们的消息使用限制,看起来 Claude 将其数据分析限制在大约 2,000 行,每行约 25 个字符。

让我们将其与 ChatGPT Plus 进行比较,好吗?

现在,是的,我正在使用免费的 Claude 版本,但如果 Claude Pro 提供 5 倍容量,我们可以概括(因为该公司没有提供硬性限制)Claude Pro 的最大容量约为 10,000 25 个字符的行。

还:Anthropic 最新的人工智能模型可以像你一样使用计算机 - 错误和所有

相比之下,我将 69,215 条记录(平均每行 50 个字符)输入到 ChatGPT Plus 中,效果很好。我将 22,797 条记录数据集包含来自卸载我的应用程序的用户的情绪数据(大多数记录包含情绪短语以及固定数据)到 ChatGPT Plus 中,效果很好。我将两个包含 170,000 多行 3D 打印机 G 代码的文件输入到 ChatGPT Plus 中,然后效果很好

我发现 ChatGPT Plus 的数据分析确实很有帮助并且可以提高工作效率。但是,如果专业帐户仅限于 10,000 条记录或更少,就像 Claude Pro 似乎所做的那样,我可能会发现它是一个有趣的技术演示,但不是我可以可靠地添加到我的工作流程工具包中的东西。

实际测试克劳德的数据分析

我从以下网站下载了大约 30 个数据集数据网在我找到一个足够小的供克劳德检查之前。那是一个2020年11月可领养宠物数据集来自马里兰州德伍德蒙哥马利县动物服务和收养中心。

该数据集有 85 条记录,每条记录约 190 个字符。让我们看看它能告诉我们什么。

提示“关于这些数据你能告诉我什么?”克劳德确定了最常见的宠物类型(狗)、最常见的饲养类型(主人投降然后流浪——这看起来很悲伤)、显着的模式和独特的特征(莫莉是一个常见的名字)。

tell-me
David Gewirtz/ZDNET 截图

我要了一张代表动物分布的饼图。它给了我这个,它显示了主要的动物类型,但将“其他”留给了条形图的近 50%。

distribution
David Gewirtz/ZDNET 截图

我想知道“其他”类别代表什么。“其他”类别中 30% 左右的鱼是热带鱼,这一想法有点令人心酸。我的脑海里浮现出这样令人沮丧的景象:一排又一排的金鱼缸,每个鱼缸里都养着一条孤独的金鱼。

other
David Gewirtz/ZDNET 截图

看一下该图表及其上方的图表。请注意,虽然图表有足够的空间来显示标签,但它们在两个图表中都被切断了。我知道有百分之三十左右的热带鱼,但我不知道确切的百分比,因为显示的只是“3”。

JavaScript 拥有优秀的图表库。我认为 Anthropic 能够调整输出以完全代表图表数据,尤其是在横向视图中。

好吧,那真是太糟糕了

我真的希望Claude的数据分析功能能够与ChatGPT Plus相媲美。即使 Claude 的免费版本只能完成 ChatGPT Plus 功能的五分之一,我也可能会订阅。

我真的很喜欢通过多个分析工具发送数据并比较结果的想法。仅此一点就足以证明我每年另外支付 240 美元的人工智能费用是合理的。

还:Google 的 AI 播客工具可将您的文本免费转换为极其逼真的音频

但由于从我上面的推断可以清楚地看出,Claude Pro 版本甚至无法处理我之前成功输入 ChatGPT Plus 的最小数据集,因此它似乎不值得投资。

我已联系 Anthropic 征求意见,但尚未收到回复。如果该公司做出回应,我将用其反馈更新本文。

与此同时,你觉得怎么样?您使用过 ChatGPT Plus 中的高级数据分析吗?您是 Claude 或 ChatGPT 用户吗?您什么时候会考虑使用 Claude 而不是 ChatGPT?请在下面的评论中告诉我们。


您可以在社交媒体上关注我的日常项目更新。请务必订阅我的每周更新时事通讯,并在 Twitter/X 上关注我:@大卫格维茨,在 Facebook 上Facebook.com/DavidGewirtz,在 Instagram 上Instagram.com/DavidGewirtz,以及 YouTube 上的YouTube.com/DavidGewirtzTV。.

关于《Claude 的新 AI 数据分析工具与 ChatGPT 的版本相比如何(提示:没有)》的评论


暂无评论

发表评论

摘要

从 Claude 和 ChatGPT Plus 之间的详细比较来看,很明显,数据处理能力和输出质量存在显着差异。以下是要点总结:1. **数据大小限制:**- **Claude:** 将分析限制为大约 2,000 行,每行 25 个字符(约 50 KB)。对于 Claude Pro,此限制可能大 5 倍 (~250 KB)。- **ChatGPT Plus:** 可以毫无问题地处理更大的数据集,例如 69,215 条记录,平均每行 50 个字符(超过 3.4 MB)。2. **分析能力:**- **克劳德:** 成功识别了小型数据集中的关键模式(来自蒙哥马利县动物服务中心的 85 条记录),例如最常见的宠物类型和摄入类型,但在视觉表示和数据完整性方面遇到了困难。- **ChatGPT Plus:** 提供详细的分析,包括完全显示所有必要标签而无需截断的图表。3. **可视化质量:**- **Claude:** 生成的饼图,其中标签被切断,留下大部分作为“其他”类别(例如,30% 的热带鱼仅标记为“3”)。- **ChatGPT Plus:** 创建清晰完整的数据可视化表示,使其更易于解释。4. **用户体验:**- 与 ChatGPT Plus 相比,Claude 数据处理和可视化质量的局限性使其对于复杂的分析任务不太有用。### 影响- 如果您需要强大的数据分析功能和高质量的输出,ChatGPT Plus 目前似乎是更好的选择。- 对于较小的数据集或有限的数据分析需求(视觉表示并不重要),Claude 可能仍然是一个可行的选择。### 后续步骤1. **联系 Anthropic:** 询问其高级数据分析功能的潜在升级以及他们是否计划在未来的更新中增加数据大小限制。2. **社区反馈:** 在论坛或社交媒体平台上与其他用户互动,以收集更多关于这两个平台的见解和经验。### 用户注意事项- 对于需要全面数据分析的专业人士来说,ChatGPT Plus 可能值得投资,尽管其成本较高。- 对于业余爱好者或使用小型数据集的人来说,Claude 仍然可以以较低的成本提供价值。请随意在评论部分分享您对此比较的想法,并在更新推出时继续探索这两个平台。