今天,我们宣布推出下一代亚马逊 SageMaker,一个数据、分析和人工智能的统一平台。全新的 SageMaker 几乎包含数据探索、准备和集成、大数据处理、快速 SQL 分析、机器学习(ML)模型开发和培训,以及生成式人工智能应用程序开发。
当前的 Amazon SageMaker 已更名为亚马逊 SageMaker 人工智能。SageMaker AI 集成在下一代 SageMaker 中,同时也可以作为独立服务提供给那些希望专门专注于大规模构建、训练和部署 AI 和 ML 模型的人。
新 Amazon SageMaker 的亮点
其核心是SageMaker 统一工作室(预览版),单一数据和人工智能开发环境。它汇集了我们今天拥有的一系列独立“工作室”、查询编辑器和可视化工具的功能和工具。亚马逊雅典娜,亚马逊电子病历,AWS胶水,亚马逊红移,Amazon Apache Airflow 托管工作流程 (MWAA),以及现有的SageMaker工作室。我们还集成了亚马逊基岩 IDE(预览版)是 Amazon Bedrock Studio 的更新版本,用于构建和自定义生成式 AI 应用程序。此外,亚马逊Q在 SageMaker 中的整个工作流程中提供 AI 帮助。
以下是关键功能的列表:
- Amazon SageMaker 统一工作室(预览) – 在单一环境中使用所有数据和工具进行分析和 AI 构建。
- 亚马逊 SageMaker Lakehouse– 统一数据亚马逊简单存储服务(Amazon S3)数据湖、Amazon Redshift 数据仓库以及使用 Amazon SageMaker Lakehouse 的第三方和联合数据源。
- 数据和人工智能治理– 使用基于 Amazon SageMaker Catalog 构建的 Amazon SageMaker Catalog 安全地发现、管理和协作数据和 AI亚马逊数据区。
- 数据处理– 使用 Amazon Athena、Amazon EMR 和 AWS Glue 上的开源框架分析、准备和集成用于分析和 AI 的数据。
- 模型开发 – 构建、训练和部署机器学习基础模型 (FM)具有完全托管的基础设施、工具和工作流程亚马逊 SageMaker 人工智能。
- 生成式人工智能应用程序开发– 构建和扩展生成式人工智能应用程序亚马逊基岩。
- SQL分析– 获得见解亚马逊红移,最具性价比的SQL引擎。
在这篇文章中,我将带您快速浏览新的 SageMaker Unified Studio 体验以及如何开始数据处理、模型开发和生成式 AI 应用程序开发。
使用 Amazon SageMaker Unified Studio(预览)
借助 SageMaker Unified Studio,您可以发现数据并使用熟悉的 AWS 工具将其投入使用,以在单一受控环境中完成端到端开发工作流程,包括数据分析、数据处理、模型训练和生成式 AI 应用程序构建。
集成的 SQL 编辑器可让您查询来自多个源的数据,可视化提取、转换和加载 (ETL) 工具可简化数据集成和转换工作流程的创建。新的统一 Jupyter 笔记本可实现跨不同计算服务和集群的无缝工作。借助新的内置数据目录功能,您可以查找、访问和查询整个组织中的数据和 AI 资产。集成了 Amazon Q 以简化整个开发生命周期的任务。
让我们更详细地探讨个人能力。
数据处理
SageMaker 集成SageMaker 湖屋并让您能够以统一的体验分析、准备、集成和编排数据。您可以使用提供的连接选项集成和处理来自各种来源的数据。
首先在 SageMaker Unified Studio 中创建一个项目,选择SQL分析或者数据分析和 AI-ML 模型开发项目概况。项目是与同事协作、共享数据以及使用工具以安全方式处理数据的场所。SageMaker 中的项目配置文件定义了在创建新项目时预配置的一组预配置资源和工具。在您的项目中,选择数据在左侧菜单中并开始添加数据源。
内置 SQL 查询编辑器可让您直接在 SageMaker Unified Studio 中查询存储在数据湖、数据仓库、数据库和应用程序中的数据。在 SageMaker Unified Studio 的顶部菜单中,选择建造并选择查询编辑器开始吧。此外,您还可以尝试使用自然语言通过 Amazon Q 创建 SQL 查询。
您还应该探索内置的可视化 ETL 工具,以使用可视化的拖放界面创建数据集成和转换工作流程。在顶部菜单中,选择建造并选择可视化 ETL 流程开始吧。
如果启用了 Amazon Q,您还可以使用生成式 AI 来创作流程。Visual ETL 配备了各种数据连接器、预构建的转换以及调度、监控和数据预览等功能,可简化您的数据工作流程。
模型开发
SageMaker Unified Studio 包含 SageMaker AI 的功能,为整个 ML 生命周期提供基础设施、工具和工作流程。从顶部菜单中选择建造访问数据准备、模型训练、实验跟踪、管道创建和编排工具。您还可以使用这些工具进行模型部署和推理、机器学习操作 (MLOps) 实施、模型监控和评估以及治理和合规性。
要开始模型开发,请使用以下命令在 SageMaker Unified Studio 中创建一个项目数据分析和 AI-ML 模型开发项目简介并探索新的统一朱皮特笔记本。在顶部菜单中,选择建造并选择Jupyter实验室。您可以使用新的统一笔记本跨不同的计算服务和集群无缝工作。您可以使用这些笔记本在环境之间切换,而无需离开工作空间,从而简化模型开发过程。
您还可以使用亚马逊 Q 开发者在整个模型开发过程中协助完成代码生成、调试和优化等任务。
生成式人工智能应用程序开发
使用新的 Amazon Bedrock IDE 在 Amazon SageMaker Unified Studio 中开发生成式 AI 应用程序。Amazon Bedrock IDE 包括使用 FM 和高级功能构建和自定义生成式 AI 应用程序的工具,例如亚马逊基岩知识库,亚马逊基岩护栏,亚马逊基岩代理, 和亚马逊基岩流创建符合您的要求和负责任的人工智能准则的定制解决方案。
选择发现在 SageMaker Unified Studio 的顶部菜单中浏览 Amazon Bedrock 模型或试验模型游乐场。
使用创建一个项目GenAI应用开发配置文件以开始构建生成式 AI 应用程序。选择建造在 SageMaker Unified Studio 的顶部菜单中,然后选择聊天代理。
借助 Amazon Bedrock IDE,您只需点击几下即可构建聊天代理并从您的专有数据源创建知识库,从而使检索增强生成 (RAG)。您可以添加护栏以促进安全的 AI 交互并创建与任何系统集成的功能。借助内置模型评估功能,您可以在与团队协作的同时测试和优化 AI 应用程序的性能。设计由 genAI 支持的确定性工作流程,准备好后,在域内共享您的应用程序或提示,或导出它们以便在任何地方部署,同时保持对项目和域资产的控制。
有关所有 Amazon SageMaker 功能的详细说明,请查看SageMaker Unified Studio 用户指南。
入门
要开始使用 SageMaker Unified Studio,管理员需要完成几个设置步骤。这包括设置AWS IAM 身份中心、配置必要的虚拟私有云 (VPC) 以及AWS 身份和访问管理 (IAM)角色、创建 SageMaker 域并启用 Amazon Q Developer Pro。除了 IAM Identity Center,您还可以通过 IAM 联合配置 SAML 来进行用户管理。
配置环境后,用户通过提供的 SageMaker Unified Studio 域 URL 进行单点登录。您可以创建项目以与团队成员协作,从针对不同用例的预配置项目配置文件中进行选择。每个项目都连接到 Git 存储库以进行版本控制,并包含一个统一的 Jupyter 笔记本示例以帮助您入门。
有关详细的设置说明,请检查SageMaker Unified Studio 管理员指南。
现已上市
下一代 Amazon SageMaker 现已在美国东部(弗吉尼亚北部、俄亥俄)、美国西部(俄勒冈)、亚太地区(东京)和欧洲(爱尔兰)AWS 区域推出。Amazon SageMaker Uniïed Studio 和 Amazon Bedrock IDE 现已在这些 AWS 区域提供预览版。检查完整地区列表以供将来更新。
有关定价信息,请访问Amazon SageMaker 定价和亚马逊基岩定价。要了解更多信息,请访问亚马逊 SageMaker,SageMaker 统一工作室, 和 亚马逊基岩 IDE。
现有的 Amazon Bedrock Studio 预览域将在 2025 年 2 月 28 日之前可用,但您不能创建新的工作区。要体验 Bedrock IDE 的高级功能,请按照以下说明创建一个新的 SageMaker 域管理员指南。
尝试一下新的 Amazon SageMaker安慰今天让我们知道您的想法!将反馈发送至适用于 Amazon SageMaker 的 AWS re:Post或通过您常用的 AWS Support 联系人。
— — 安杰