【[354星]ttt-rl:用C语言实现的强化学习示例,教你用不到400行代码让Agent学会玩井字棋。亮点:1. 仅用随机对手对弈150k局后,Agent就能学会完美对局;2. 代码简洁,无外部依赖,注释丰富,学习门槛低;3. 仅用100个隐藏神经元,就能实现对游戏状态的精准记忆】
'Reinforcement Learning example in C, playing tic tac toe'
'Reinforcement Learning example in C, playing tic tac toe'