专栏名称: 爱可可-爱生活

知名互联网资讯博主北邮PRIS模式识别实验室陈老师

相关文章推荐

宝玉xp · 同意原推观点（以下内容为转译）：有些热衷于“ ... · 昨天

爱可可-爱生活 · 【[843星]building-llm-ap ... · 昨天

宝玉xp · //@同声翻译樱桃羊:优秀的科学家不会看轻人 ... · 昨天

人工智能那点事 · 代订海底捞却遭遇“小便门”，补偿款要给黄牛2 ... · 2 天前

爱可可-爱生活 · //@爱可可-爱生活:今日开奖，欢迎参与！/ ... · 3 天前

51好读 › 专栏 › 爱可可-爱生活

【[354星]ttt-rl：用C语言实现的强化学习示例，教你用不-20250319220619

爱可可-爱生活 · 微博 · AI · 2025-03-19 22:06

正文

2025-03-19 22:06
本条微博链接

【[354星]ttt-rl：用C语言实现的强化学习示例，教你用不到400行代码让Agent学会玩井字棋。亮点：1. 仅用随机对手对弈150k局后，Agent就能学会完美对局；2. 代码简洁，无外部依赖，注释丰富，学习门槛低；3. 仅用100个隐藏神经元，就能实现对游戏状态的精准记忆】
'Reinforcement Learning example in C, playing tic tac toe'