你好,欢迎来到动视!
登录
注册
百科
科技
教育
生活
旅游
时尚
美容
美食
健康
体育
游戏
汽车
元宇宙
家电
财经
综合
马尔可夫决策过程,MDP,强化学习,智能体,状态空间,动作空间,状态转移概率,奖励函数,最优策略
Top