准备接着手搓一个文学小模型

王路在隐身 · 公众号 · 热门自媒体 · 2025-04-02 08:51

正文

请到「今天看啥」查看全文

在手搓阿毗达磨AI告一段落之后，灵活就业的我闲着无聊，准备再接着手搓一个文学小AI。目标和上次类似：写的文章比大模型好。具体来说，比DeepSeek-R1，Grok3，Claude 3.7 Sonnet写得好。

这当然更不现实了。我做好了再次失败的准备。文学和阿毗达磨AI不一样的地方在于，阿毗达磨的很多问题是有标准的，有答案的，“不染非六生，色定非见断”，“六”到底是什么，很明确，不是你说666就能给分的。但是文学，你说它没标准吧，好的东西和坏的东西，读者的感受到底是不同的。说有标准吧，每个人的感受又千差万别，难以量化。从这意义上看，搞文学AI比阿毗达磨AI要难得多。

但要是换个标准，也可以说它更简单。阿毗达磨AI，不行就是不行，谁说行都没有用，像下围棋，胜负在那儿摆着。但是文学，行和不行没有那么分明。

在去年10月的Claude 3.5 Sonnet出来之前，我没见哪个AI写的文章能用的。但最近手搓阿毗达磨AI的时候，我顺便发现，其实32B模型写的东西倒也没有比R1这样671B的模型差太远。所以，我打算试试。很多人搞模型，都是在榨模型的数学、编程等潜力，虽然也评估语言能力，但语言能力和文学能力是两码事。

举个最简单的例子，我用任何一个大模型生成的文章，在80%的情况下，我要手动砍掉它的头和脚。——这和我以前教人写作是一样的。很多文章为什么差？——该开头的时候没开头，该结束的时候不结束。如果一个人写了篇3000字的文章，你把开头1000字砍掉，结尾500字砍掉，剩下1500字，在90%的情况下，文学性比之前强。剩下10%的情况，是那些有文学素养或者嗅觉的人。

你看AI写的文章，最后一段在90%的情况下都是废话。——当然它不知道这是废话，因为绝大多数的人类向来都是这么写文章：要开头不开头，先“简单讲几句”“做个开场白”，该结尾不结尾，再“做几句总结”。所以，哪怕我们只是简单地对AI的输出做个处理，砍掉头尾，就提高了它的文学水平。当然，你去手搓的话，不是要等它输出了你再处理，而是让它自行知道那样。

所以，我先试试吧。

如果谁有兴趣一起试，可以申请加我的群。我不建新群了，还用之前的“手搓阿毗达磨AI群”。“手搓阿毗达磨AI群”并不成功，虽然加了十几个人，绝大多数都是来“学习”“交流”的。真正动手去做的，加上我一共3个人；到目前出结果的，只有两个人，其中一个还是我自己。我觉得，一个群里如果没有3个人在做体现群宗旨的事，这个群就失去了它的意义。所以，入群的标准要严格。这次入群的标准是：

1、邮件中有简单的自我介绍。（这个不过分吧？我之前建群从来不明写这一点，但明写出来可能真的有必要。不需要复杂，两三句就可以。）

2、介绍你用什么样的数据、模型和方法，并附上训练主代码。（这是要保证群确实是手搓AI群，不是闲聊群。所以，有微调经验是个必要条件。之前有人要进群，我让他给微调代码，他发来一段平衡车游戏的代码。应该是跑去让deepseek“给我写个代码”得来的吧。这没有必要。之前有人申请进“尊重毗昙”群，也是拿着我的题目去问AI。同样没有必要。我不可能出AI都能答对的题目。）

微调不是一件很难的事情。它只是开头。重要的是，你选取什么样的数据，用什么样的力所能及的基础模型，以什么样的方法来达到超越原模型乃至同参数量级的其余模型的结果。

符合标准的人如果申请进群，请发邮件到：

[email protected]。

手搓阿毗达磨AI失败后，我嫌弃AI太不智能

《俱舍九题》《俱舍万字》《俱舍英译百瑕》《阿毗达磨理校百例》PDF（20250401）