Google Kubernetes引擎定制用于更快的AI工作
2025-04-09 16:04:10
Google Cloud在Google Cloud下一个会议上宣布了其Google Kubernetes引擎(GKE)的增强功能,旨在优化AI工作负载。关键功能包括: - 支持AI任务智能路由的网关API推断扩展标准。 - 介绍集群主管,该局长是一项超级计算服务,允许部署多达65,000 GPU或TPU作为一个单位。 - 估计改进:40%的吞吐量增加,60%的尾部潜伏期和最高30%的服务器成本节省。Google认为GKE是AI开发的关键,当前的顶级客户广泛用于AI/ML任务。