作者:Kyle Wiggers
Hugging Face的一支团队发布了一个免费的,云托管的计算机代理。
拥抱面孔的经纪人打开计算机代理,可以通过网络访问,并且可以使用预装有多个应用程序的Linux虚拟机,包括Firefox。类似于Openai的操作员,您可以提示打开的计算机代理完成任务 - 使用Google Maps查找巴黎的拥抱脸部总部,并在代理商打开必要的程序并确定所需步骤时坐下来。
打开的计算机代理可以很好地处理简单的请求。但是,更复杂的机构(例如寻找航班)在TechCrunch的测试中绊倒了。打开的计算机代理通常还遇到了无法解决的验证验测试。
您还必须等待虚拟队列才能使用开放的计算机代理 - 根据需求,排队秒至分钟长。
m_ric(@aymericRoucher)2025年5月6日我们正在Smolagents启动计算机使用!ð¥³
- >随着视觉模型变得越来越有能力,它们将能够为复杂的代理工作流提供动力。尤其是支持内置接地的QWEN-VL模型,即能够通过其坐标找到图像中的任何元素,因此可以pic.twitter.com/mi8muwzkis
当然,拥抱的脸队的目标不是建立最先进的计算机代理商。相反,他们想证明开放的AI模型变得越来越有能力,可以在云基础架构上运行。
随着视觉模型变得越来越有能力,他们能够为复杂的代理工作流提供动力。在X上的帖子中写了。[其中一些模型]支持内置接地,即[]通过其坐标找到图像中的任何元素的能力,因此[和]可以单击[虚拟机中]的任何项目。
尽管它远非完美,但随着企业寻求提高生产率,代理技术吸引了越来越多的投资。根据最近的毕马威会计师调查,有65%的公司正在尝试AI代理商。市场和市场项目AI代理部门将从2025年的78.4亿美元增长到2030年的526.2亿美元。
TechCrunch活动
加利福尼亚州伯克利 | 6月5日
Kyle Wiggers是TechCrunch的AI编辑。他的写作出现在VentureBeat和数字趋势中,以及一系列小工具博客,包括Android警察,Android Authority,Droid-Life和XDA-Developers。他与他的伴侣,音乐治疗师一起住在曼哈顿。