手里有一个深度强化学习算法专利,可以模拟人类的兴趣机制,能够使AI自主拥有喜好以及无聊等情绪定义,也就是使得AI的情感能被观测且能被干预。
目前已经在简单环境下做过测试,该算法在躲避球游戏中表现劣于ICM算法,在迷宫生存游戏中表现优于ICM算法,且具有清晰的图示和数据能够判断AI的情绪状况,在情绪波动较大时,训练效率很高,情绪波动低时训练效率很差,可以通过施加干预手段提升训练效率。
打算用这个来做游戏里的战斗AI系统(目前不做非战斗环境下的聊天语音互动),需要技术合伙人会写游戏,对前后端都懂一些,并且能在游戏引擎里手撸深度强化学习代码的技术合伙人,最好可以懂一些CV和NLP,该算法是在ICM算法的基础上研发的,因此至少需要可以手撸ICM代码和A2C、A3C等执行模块。
目前手里有大量投资人渠道,需要先做个demo去拉投资,未来线下公司坐标北京。
本人联系方式:z65836966微信