爱可可-爱生活 2020-01-24 12:10:57 发布的技术动态

爱可可-爱生活
2020-01-24 12:10:57 发布
*《Q-Learning in enormous action spaces via amortized approximate maximization》T V d Wiele, D Warde-Farley, A Mnih, V Mnih [DeepMind] (2020) 网页链接 view:网页链接

原文链接