作者:Written by David Gewirtz, Senior Contributing Editor Oct. 28, 2024 at 6:47 a.m. PT
上周,Anthropic(已来自亚马逊的 4B 美元投资)宣布Claude 3.5 Sonnet 现在支持数据分析。TechCruch 的标题
对于这种能力,“Anthropic 的人工智能现在可以运行和编写代码”。这在技术上是正确的,但不要太兴奋。克劳德不会坐在那里为您模拟所有代码。现实情况要有限得多。
Anthropic 宣布的功能类似于 ChatGPT 的高级数据分析。一个区别是克劳德的分析工具可供所有人使用,包括免费用户。ChatGPT 的高级数据分析仅适用于加企业帐户用户每月支付 20 美元或更多。
两个都聊天GPTPlus 和 Claude 通过编写和运行解析和处理数据的代码片段来执行数据分析。一个关键的区别是 Claude 使用 JavaScript 编写代码,而 ChatGPT 使用 Python 编写代码。
这些都是有趣的选择。Python 拥有丰富的数值分析库生态系统,例如 Pandas、NumPy 和 SciPy。JavaScript 也拥有丰富的生态系统,但其数据和人工智能产品并不像 Python 那样广泛。Python 在机器学习和人工智能方面非常强大,拥有 TensorFlow、PyTorch 和 Keras 等框架。Python 还为大数据提供了出色的支持,不过,正如您将看到的,Claude 当前的分析工具甚至不能被视为中等数据。
相比之下,JavaScript 非常适合网页中的数据可视化。Anthropic 解决方案使用 React,但也有很棒的可视化库,如 D3.js 和 Chart.js 可用于信息呈现。我确实发现奇怪的是,使用如此出色的可视化工具,我使用 Claude 生成的饼图往往会砍掉某些类别的数据标签。
另外: 2024 年最佳编码人工智能(以及不该使用的人工智能)
当您要求 Claude 处理数据时,它会为您提供其输出,但也允许您查看它生成的用于进行数据分析的底层代码。这是一个例子。
我决定用Claude来测试一下它的分析能力。我将我的使用限制为免费版本。根据 Claude 的常见问题解答,20 美元/月的 Pro 版本将使用限制提高了五倍。
这对于认真使用来说可能是必要的,因为经过大约 20 分钟的测试后,我被关闭了。
我确实尝试打开一个新的聊天室,但它没有让我重新进入。等了一个小时后,我能够问更多问题。
为了测试Claude的数据分析能力,我去了数据网网站并下载了一个社会保障管理局数据集关于社会保障卡申请中衍生的婴儿姓名使用情况。
该数据以 ZIP 文件的形式出现。我提取了 145 个逗号分隔值 (CSV) 文本文件,其中包含从 1880 年到 2023 年的婴儿姓名数据,每年一个文件。
还:我将 Claude 3.5 Sonnet 与 AI 编码测试 ChatGPT aced 进行了比较,结果创造性地失败了
我首先尝试选择所有文件并将它们作为一个组导入到 Claude 中。我被告知克劳德一次只会导入五个文件。
因此,我决定编写一个脚本来创建包含所有数据的单个文件。问题是每个单独的文件都不包含年份作为字段之一。因此,我的脚本必须将文件名中的年份添加到文件中的每个记录,然后对所有文件执行此操作。
我没有自己编码,而是请克劳德为我做。
我需要在 Macintosh 上快速合并 145 个文本文件。每个文件名由字母 yob 后跟四个数字组成,表示年份,后跟 .txt。文件本身是逗号分隔的值。对于每个文件,我需要在相应文件的每一行前面添加文件名中包含的年份,后跟逗号。然后我需要将所有 145 个文件合并到一个主文件中。我怎样才能快速做到这一点?
它创建了一个看起来可以完成这项工作的 shell 脚本。
我保存了脚本并运行它。
它有效并且完全按照我的要求进行。运行该 shell 脚本的结果是一个 37MB 的文件。不幸的是,我很快发现 37MB 超出了 Claude 的上传限制 30MB。我需要一个小得多的数据集。
我认为,如果我每十年仅使用一个文件中的名称数据,而不是使用每年的名称数据,我会将数据集大小减少到原始大小的 10%。所以我改变了我的提示并将其反馈给克劳德。
我需要在 Macintosh 上快速合并 145 个文本文件。每个文件名由字母 yob 后跟四个数字组成,表示年份,后跟 .txt。文件本身是逗号分隔的值。对于每个文件名以 0.txt 结尾的文件,请在相应文件的每一行前面添加文件名中包含的年份,后跟逗号。然后需要将所有以0.txt结尾的文件合并为一个主文件。编写一个 shell 脚本来执行此操作。
这和第一个提示一样有效,我得到了一个 3.9MB 的文件。
总的来说,我对今天的 Claude 3.5 Sonnet 的编码工作非常满意。我已经之前通过我的一系列编码测试运行了法学硕士没有取得多大成功。所以很高兴这次看到它顺利运行。不幸的是,这是今天测试过程的最后一部分,进展顺利。
那么我们来看看克劳德的数据分析。不幸的是,克劳德在可以摄取的数据量方面似乎非常有限。克劳德说其专业版“与我们的免费服务相比,使用量至少增加了 5 倍”,并且“如果您的对话相对较短,则预计每 5 小时至少发送 45 条消息。”
另外: 人工智能骗局已经渗透到针织和钩针世界 - 为什么它对每个人都很重要
那不是很多。虽然 Claude 确实说您可以上传 5 个文件和 30MB,但我发现我的合并 3.9MB 文件被认为超出了其长度限制的 9124%。该文件包含 219,181 条记录。
好吧,好吧。所以后来我尝试了一个文件一年。文件 yob2020.txt 只有 561KB,仅包含 31,550 条记录。该文件显然超出了 Claude 长度限制的 1239%。
做一些数学计算,假设您没有达到他们的消息使用限制,看起来 Claude 将其数据分析限制在大约 2,000 行,每行约 25 个字符。
让我们将其与 ChatGPT Plus 进行比较,好吗?
现在,是的,我正在使用免费的 Claude 版本,但如果 Claude Pro 提供 5 倍容量,我们可以概括(因为该公司没有提供硬性限制)Claude Pro 的最大容量约为 10,000 25 个字符的行。
还:Anthropic 最新的人工智能模型可以像你一样使用计算机 - 错误和所有
相比之下,我将 69,215 条记录(平均每行 50 个字符)输入到 ChatGPT Plus 中,效果很好。我将 22,797 条记录数据集包含来自卸载我的应用程序的用户的情绪数据(大多数记录包含情绪短语以及固定数据)到 ChatGPT Plus 中,效果很好。我将两个包含 170,000 多行 3D 打印机 G 代码的文件输入到 ChatGPT Plus 中,然后效果很好。
我发现 ChatGPT Plus 的数据分析确实很有帮助并且可以提高工作效率。但是,如果专业帐户仅限于 10,000 条记录或更少,就像 Claude Pro 似乎所做的那样,我可能会发现它是一个有趣的技术演示,但不是我可以可靠地添加到我的工作流程工具包中的东西。
我从以下网站下载了大约 30 个数据集数据网在我找到一个足够小的供克劳德检查之前。那是一个2020年11月可领养宠物数据集来自马里兰州德伍德蒙哥马利县动物服务和收养中心。
该数据集有 85 条记录,每条记录约 190 个字符。让我们看看它能告诉我们什么。
提示“关于这些数据你能告诉我什么?”克劳德确定了最常见的宠物类型(狗)、最常见的饲养类型(主人投降然后流浪——这看起来很悲伤)、显着的模式和独特的特征(莫莉是一个常见的名字)。
我要了一张代表动物分布的饼图。它给了我这个,它显示了主要的动物类型,但将“其他”留给了条形图的近 50%。
我想知道“其他”类别代表什么。“其他”类别中 30% 左右的鱼是热带鱼,这一想法有点令人心酸。我的脑海里浮现出这样令人沮丧的景象:一排又一排的金鱼缸,每个鱼缸里都养着一条孤独的金鱼。
看一下该图表及其上方的图表。请注意,虽然图表有足够的空间来显示标签,但它们在两个图表中都被切断了。我知道有百分之三十左右的热带鱼,但我不知道确切的百分比,因为显示的只是“3”。
JavaScript 拥有优秀的图表库。我认为 Anthropic 能够调整输出以完全代表图表数据,尤其是在横向视图中。
我真的希望Claude的数据分析功能能够与ChatGPT Plus相媲美。即使 Claude 的免费版本只能完成 ChatGPT Plus 功能的五分之一,我也可能会订阅。
我真的很喜欢通过多个分析工具发送数据并比较结果的想法。仅此一点就足以证明我每年另外支付 240 美元的人工智能费用是合理的。
还:Google 的 AI 播客工具可将您的文本免费转换为极其逼真的音频
但由于从我上面的推断可以清楚地看出,Claude Pro 版本甚至无法处理我之前成功输入 ChatGPT Plus 的最小数据集,因此它似乎不值得投资。
我已联系 Anthropic 征求意见,但尚未收到回复。如果该公司做出回应,我将用其反馈更新本文。
与此同时,你觉得怎么样?您使用过 ChatGPT Plus 中的高级数据分析吗?您是 Claude 或 ChatGPT 用户吗?您什么时候会考虑使用 Claude 而不是 ChatGPT?请在下面的评论中告诉我们。
您可以在社交媒体上关注我的日常项目更新。请务必订阅我的每周更新时事通讯,并在 Twitter/X 上关注我:@大卫格维茨,在 Facebook 上Facebook.com/DavidGewirtz,在 Instagram 上Instagram.com/DavidGewirtz,以及 YouTube 上的YouTube.com/DavidGewirtzTV。.