英语轻松读发新版了,欢迎下载、更新

11 个开发人员会喜欢的开源人工智能项目

2024-10-21 09:00:00 英文原文

作者:by Peter Wayner Contributing writer

特征

2024年10月21日6分钟

人工智能开发工具生成式AI

AI副驾很棒,但还有其他什么值得关注的吗?这里有11个开源AI项目,能让你编写美观的软件变得更轻松。

最具有创意和影响力的想法往往出现在开源软件中。分享代码邀请全球的贡献者共同合作,推动项目向前发展。人工智能并无例外。虽然人工智能对计算能力的需求可能限制了个人的成就,但一个分布式的团队可以完成任务。在人工智能这一技术领域,所有努力的总和确实大于各部分之和。

为了培育这一重要领域,这里列出了11个开源AI项目,让开发者的任务变得更容易。有些项目优化了模型训练的过程,而另一些则帮助你寻找或访问所需的數據源。还有提高生产效率的技巧、性能优化工具、SQL处理工具等等。

这些项目让我们看到了人工智能领域的创新如何将智能、有感知力的计算机的梦想变为我们日常生活和工作的一部分。你可以将它们作为自己项目的起点,或者在灵感来临时作为创造非凡事物的蓝图。

Upscale

有时候,一张图片只需要再多一点细节就能在页面上看起来很好。Upscale(参见GitHub项目)这里) 提高图像分辨率,以达到您所追求的清晰度和细节。如果您拥有合适的硬件,这是增强数字艺术品或为照片添加细节的好方法。请记住,AI基本上是在凭空创造这些细节。这意味着Upscale非常适合增强由数字艺术家创作的虚构图像,但对于需要绝对准确性的图像(如犯罪现场记录证据)则不太适用。

尼罗

开发人员花费相当多的时间通过命令行与计算机的操作系统交互。虽然这些时间很容易被忽视,但它们加起来却不少。尼罗是一个基于之上的开源项目电子原件该工具可以处理像截图、调整窗口大小以及在应用程序之间同步数据这样的日常任务。自动化这些日常工作可以节省你许多微小的时间片段,最终会累积成显著的生产力提升。

焦佩托

有些开发团队主要在Slack频道中进行工作,因此这些帖子最终成了相当不错的第一代文档。杰佩托Geppetto 是一个 Slack 机器人,它能够将你的频道与多个不同的大型语言模型(OpenAI、Anthropic 和 Gemini)连接起来,这些模型可以清理和增强你的想法。如果你想要艺术作品为你的文档增添生命力,Geppetto 还会向 Dall-E 发送请求。

E2B沙箱

最早的大型语言模型回答问题,并且可能利用训练数据集中的一切知识生成一些艺术作品。但如果它们能够自由地在互联网上漫游并使用人类使用的所有工具会怎么样?E2B是一个代理沙盒,允许大语言模型连接到许多我们人类每天使用的相同工具。这意味着Web浏览器、GitHub代码库以及像代码检查器这样的命令行工具。然后,这些语言模型可以利用这些工具的强大功能来执行有用的任务,比如管理云基础设施,从而减少人类的负担。

数据线

不是每个人都愿意将自己的所有数据上传到遥远的AI GPU上进行训练。数据线使用大语言模型生成SQL命令以从数据库中提取数据。然后,代码通过本地连接到本地数据来创建数据分析报告。这是一种混合方法,将经典的数据科学算法与引导这些算法的大语言模型相结合。

漩涡连接

有时候,你想要开始处理一个数据集,但又不想费劲去提取和重新格式化它。如果数据集很大,这些过程可能会非常耗时。漩涡连接(参见GitHub项目)这里)链接了许多标准数据库与大多数标准的大语言模型和RAG搜索索引。您所需的所有数据都在一个地方,您可以专注于训练。

DSPy

大模型(LLMs)的出现催生了一个全新的职业专业化领域——提示工程。与开发人员使用的算法不同,提示工程师通过摆弄文字并编写长篇指令来引导和激发大模型产生正确结果。这个职业需要口才好并且能够对大模型施展“绝地武士”的心灵控制技巧。DSPy是一个希望为大型语言模型训练带来更系统方法的工具。DSPy 不是连接词和短语,而是连接模块和优化器,并将它们安排在一个管道中供大型语言模型使用。使用 DSPy 的开发人员可以减少对语言细微差别的担忧,而更多地专注于编写代码。

护栏

其中一个挑战是生成式AI是防止AI偏离正轨。工程师们正在做的事情是魔杖网关找到了一种方法,将更多的控制措施整合到生成式人工智能的流程中。异步函数,被称为护栏,可以追踪AI生成答案的发展,并在流程的不同阶段进行投票。每次投票后,答案都会被进一步完善。最终结果应该是减少幻觉效应并产生更多正确的答案。

无懒惰

在新的数据集上训练基础的大语言模型通常是很昂贵的。无懒惰是一个旨在为一些最常见的开源模型优化此类训练的工具。据某些说法,该工具的开源版本比没有使用Unsloth时的模型训练速度快两到五倍,并且专业版速度快达30倍。精心手写的内核代码以降低内存使用量的同时保持甚至提高准确性的方式被应用。

Wren AI用于SQL

世界上大多数数据都存储在庞大的表格中,通常可以通过SQL访问。可惜的是,很少有人知道如何编写出色的SQL查询。甚至好的程序员也在这方面挣扎。编写快速且高效的SQL查询. Wren AI是一个自然语言的SQL前端。你可以用普通的英语提问,AI会将这些问题翻译成SQL,节省每个人的时间和精力。

AnythingLLM

如今,许多人把大量的数字文档藏在某个地方以备将来参考。挑战在于当你需要时找到那个完美的引用或数据点。AnythingLLM将你的文档堆整理成有用的东西。你只需将文档输入任何LLM或RAG系统,然后查询你需要的答案。该工具可以在Linux、macOS或Windows机器上运行,并且响应可以采用多种形式,包括文字转语音。

Peter Wayner

彼得·韦纳是超过16本涵盖不同主题书籍的作者,包括开源软件(《免费供所有人》)、自动驾驶汽车(《未来的乘车体验》)、增强隐私计算(《半透明数据库》)、数字交易(《数字货币》)和隐写术(《隐形密码学》)。

更多来自该作者的作品

关于《11 个开发人员会喜欢的开源人工智能项目》的评论


暂无评论

发表评论

摘要

功能 2024年10月21日 6分钟 人工智能 开发工具 生成式AI AI助手很棒,但还有其他什么选择吗?有些工具可以优化模型训练过程,而另一些则可以帮助你查找或访问所需的数据源。Nyro 是一个基于 Electron 构建的开源项目,用于处理截取屏幕截图、调整窗口大小以及在应用程序之间同步数据等琐碎任务。Dataline 并非所有人都希望将所有数据上传到某个远程 AI GPU 进行训练。Guardrails 生成式AI的一个挑战是防止AI偏离轨道。