专栏名称: 机器之心
目录
相关文章推荐
爱可可-爱生活  ·  FFT的逆袭: ... ·  17 小时前  
爱可可-爱生活  ·  优化思维:探索大模型推理能力的最佳计算规模 ... ·  17 小时前  
黄建同学  ·  我的担心暂时是多余的 Cursor ... ·  昨天  
爱可可-爱生活  ·  【[172星]Prompt-Kit:为AI应 ... ·  昨天  
爱可可-爱生活  ·  【[1.5k星]Wan2.1:阿里开源的大规 ... ·  昨天  
51好读  ›  专栏  ›  机器之心

阁下可知文言编程之精妙?CMU本科生开源文言文编程语言,数天2K星

机器之心  · 掘金  · AI  · 2019-12-19 02:17

正文

机器之心报道

参与:思、一鸣

「昔者苍颉作书,而天雨粟,鬼夜哭」,汉字的出现,诞生了世界上一个伟大的文明。 而编程语言的出现,让人类和计算机产生了真正的联系,推动了现代文明的发展。
那么,将古代汉语和编程语言结合又会产生怎样的火花?最近,GitHub 上出现了一个文言文做代码的项目,几乎是世界上第一门文言文编程语言(当然,底层还是转换成 Python 或 JavaScript 运行)。

如果中文是编程语言中使用的主要语言,我们中国人学习编程是否会更简单?
这是知乎上讨论非常火热的话题。很多接触过编程的人都知道「易语言」,这是一种使用中文代替编程语言中的英文的编程语言,同样可以实现程序功能。近日,一位卡内基梅隆大学(CMU)的大四学生开发了基于文言文的编程语言,高中语文三大怕的文言文终于找上程序员了。
项目地址:https://github.com/LingDong-/wenyan-lang
这一项目并不是简单的将程序中的英文字符换成了中文,而是利用 NLP 的一些技术,将文言文程序语法转换到 JavaScript 或 Python 运行,有一定的技术难度。项目问世几日即获赞 2.2K,还得到了很多人的微博转发。

作为横跨媒体和 AI 的机器之心也测试了这一项目,项目作者的脑洞、文采和创意着实令人惊讶。
如果读者想快速试一试,你也可以玩一玩在线 IDE,上面有很多预定义的函数。即使在手机上,我们也能编辑并运行「文言文代码」。
在线地址:http://wenyan-lang.lingdong.works/ide.html
序言
作者在项目开篇使用了一段文言文,介绍了建立这个项目的初衷。
翻译如下:

在尧舜时代,人们使用结绳和数手指来计算。当时怎么能够预料到,几百代人之后计算机的巧妙呢!计算机比鲁班(公输盘)的木鸢更加精巧,比诸葛亮(武侯)的木牛流马更好。此外,编程语言数量众多,如同《天官书》记录的星宿一般多,又比《山海经》中记录的飞禽走兽还要奇特。 Go (鼠)、 Rust (蟹)、 Ruby (鑽)、 Fishshell (鱼)因速度而出名。 Python (蛇)、 Php (象)、 Perl (骆)和 JavaScript (犀)则各有独特之处。我这才理解到,为什么鬼会夜哭,天上会下粟雨。

(注: 传仓颉造字后,鬼神啼哭,天降粟雨)

但以往从未有人使用过文言文进行编程。这并不是传承文脉、保护文心的好方法,所以我才产生了用文言文编程的想法。我目前还太年轻,读过的书也没有破万卷。如今身处遥远的国家(美国),也很久没有接触中文了。 但是我一直对文学很有兴趣,编写的程序有时候也得到人们的一些肯定。正如王希孟和庄子一般,并不因为年轻或者知识的浩瀚无涯而退缩,于是写下了这些话。

(注: 王希孟,北宋画家,18岁画成传世名作《千里江山图》)

我既没有像李贺那样呕心沥血,也没有像李商隐那样口角流沫(形容读书勤奋)。项目完成后,我将继续以 干将铸剑 的精神勉励自己,带着越王 卧薪尝胆 的精神继续向前。我自己虽想效仿《算经十书》的笔法,只是遗憾没有唐宋八大家那样淋漓的文笔。正如庾信在《哀江南赋》所写:「陆机听了心甘情愿地拍掌;张衡见了将轻视它也是理所当然」(意指如果被人嘲笑,也是理所当然,我不会太过介意)。

尽管这项目只有覆瓮的价值(一点微小的工作),但是还有完善的空间。虽然没有像吕不韦那样有一字千金的本钱,但是我对交流的渴望是一样的。

这也正是开源的精神内核,我们以此互相勉励吧。

作者是谁?
Lingdong Huang 目前是 CMU 计算机专业大四学生,明年就本科毕业了。我们可以看到他曾在迪士尼研究实验室、纽约时报等大厂实习过。而且从个人网站中,很明显可以发现他高中就开始做各种小项目,包括视觉和自然语言的都有。
写得了代码、读得了文言文,文化底蕴还这么强,现在的本科生已经这么厉害了。
个人网站:https://lingdong.works
文言文编程是什么情况
用文言文编程是什么样一种体验?是不是既能学习文言文,又能搞定编程逻辑?介绍不如演示,我们先看看编程世界里的第一段代码,广大程序员学习的第一句「HelloWord」是什么样的。如果读者们文言文比较溜,或者了解一点程序思维,那么可以了解,下面一段文言文代码就是输出三遍「问天地好在」,也就是「HelloWord」的文言文版。
吾有一數。曰三。名之曰「甲」。為是「甲」遍。    吾有一言。曰「「問天地好在。」」。書之。云云。
具体而言,先定义一个数「3」,并命名为「甲」,现在循环「甲」次,每次在屏幕上打印出「問天地好在。」。作者会将其翻译成对应的 Javascript 代码,从而帮助我们理解。
var n = 3;for (var i = 0; i < n; i++) {    console.log("問天地好在");}
当然,按照我们的习惯,改写成 Python 代码也是没问题的:
a = 3for i in range(a):    print("問天地好在")
为了更贴近文言文的表达习惯,Lingdong Huang 在项目表示各种标点和换行都是可以去掉的,上面的文言文代码可以等价写为:
吾有一數曰三名之曰「甲」為是「甲」遍吾有一言曰「「問天地好在」」書之云云
突然感觉,好像没了符号的文言文代码更容易懂了?
这样看起来似乎很简单?那你就小瞧了文言文编程的魅力。比如说程序员入门必修课「斐波那契数列」,每一项都是前两项的和,第一项是 0、第二项是 0+1、第三项是 1+1 等等。
如果用文言文来写斐波那契数列,我们需要建立一个函数,函数的输入是斐波那契项数,输出是该项具体的值。如果用文言文来写,画风是这样的:
最后一句「施「斐氏列」於七。書之。」是调用函数,并输出第 7 个结果。虽然看上去比较麻烦,但我们还是可以细细阅读,例如「吾有一術。 名之曰「斐氏列」。」很明显定义了一个函数,函数名是「斐氏列」;「若「因」等於零者。昔之「果」者。今「因」是矣云云。 」表示如果「因」这个变量等于 0,那么就将「因」这个变量的值赋值到「果」变量。
如果阅读上还有困难,那么也可以看看项目作者提供的对应 Javascript 代码。不过我们可以尝试把它翻译成 Python 语言,翻译结果如下所示:
def fei_seq(yin):    tou = 0    wei = 1    ji = 1    guo = 0    if yin == 0:        guo = yin    if yin == 1:        guo = yin    while True:        if ji >= yin:            break        ans_ = tou +wei        guo = ans_        tou = wei        wei = guo        ans_ = ji + 1        ji = ans_    return guoprint(fei_seq(7))






请到「今天看啥」查看全文