AI打爆贪吃蛇

目录索引

▶︎
all
running...

第一章:AI打爆贪吃蛇专题介绍

【观看视频解说】

大家好,本专题将带你快速入门如何通过强化学习训练AI玩儿游戏。

贪吃蛇游戏
图1. 贪吃蛇游戏

说起AI玩游戏,最有名的就是谷歌的AlphaGo围棋AI了。它最强版本AlphaGo Zero就是通过自我对抗的强化学习技术来训练的。那么,我们是不是也可以来训练AI来玩玩游戏呢?

答案是肯定的。 从这个专题开始,我会制作《AI玩儿游戏》系列,来为大家介绍如何使用强化学习(Reinforcement learning)来训练AI玩儿游戏。强化学习技术,可不仅仅可以用来游戏,它其实可以做很多的事情,比如ChatGPT模型的训练中,也是采用了强化学习。

1 为什么从贪吃蛇游戏开始?

【观看视频解说】

原因是贪吃蛇游戏规则简单,又足够好玩儿。

最主要的是,我入坑强化学习就是从这个游戏开始的。我之所以对这个感兴趣,是看了林亦LYi老师制作的视频(视频链接: https://youtu.be/jTVMxJBtmFs?si=R3CcrjI1P1kK1aoE ),看了以后,我觉得特别有意思,因此也对强化学习产生了兴趣。

作为一个从事AI工作的技术宅,我觉得当前的AI能给我们带来的快乐并不多。总不能天天面对着一堆代码,一堆参数傻笑吧?

但是游戏就不一样了,有画面,还有挑战。 如果能将AI与游戏结合起来,我们的AI工作就会更有乐趣了。因此,用强化学习玩儿游戏就是一个很好的选择。 快快乐乐的学技术,就是我制作这个专题的初衷。

2 通过本专题可以学到什么?

【观看视频解说】

通过本专题,你不仅可以学习到一些关于强化学习的知识。还可以学会如何来实际训练AI来玩儿游戏。

那么,强化学习玩游戏可以做到什么程度呢?

第一,就是训练一个满分AI贪吃蛇

满分贪吃蛇
图2. 满分贪吃蛇

贪吃蛇游戏规则相对比较简单,要让贪吃蛇得满分其实很简单。网上有很多通过写一些算法都可以做到这一点。但是这些算法都是基于人类经验的,而我们的这里满分AI贪吃蛇是AI自己学习出来的。
可以认为一个是通过人设计的规则实现的,一个是通过AI自主学习达成的。
今后,我会介绍一个高概率满分模型的训练方法。

第二,通过贪吃蛇游戏的训练,来理解奖励和惩罚
使用强化学习训练AI,我们最主要的工作是对AI的动作做出反馈,这个反馈就是对它奖励,还是惩罚。那么在AI训练时该如何设置奖励和惩罚呢? 他们都有哪些影响呢?

另外,我也发现,奖励和惩罚不仅影响AI模型的训练,还可以促进我们进一步思考奖励和惩罚在我们生活中的影响,比如在教育孩子,员工管理等等。

3 还可以用来做什么?

爱心贪吃蛇
图3. 爱心贪吃蛇

除了训练AI贪吃蛇取得满分,是否还可以用来做其他的事情呢? 我会为你展示我的一个小尝试,就是让贪吃蛇摆一个爱心。

这个对于我们很多不善表白的IT男很有用途呢? 你是不是也可以训练自己的爱心AI,去向自己心爱的女生去表白呢。

4 专题包含那些内容?

【观看视频解说】

本专题希望可以帮你快速入门RL强化学习,并体会到学习AI并不枯燥,一样有很多的乐趣。

今后的内容将分为两个部分:入门和进阶。
入门:主要介绍基本知识,有趣的内容,比如环境安装,模型的使用,模型训练相关的概要介绍。
进阶:模型训练,强化学习的相关内容。

专题的内容将包括视频以及其对应的文档,方便你实战时参考使用。



第一章:AI打爆贪吃蛇专题介绍