专栏名称: OSC开源社区
OSChina 开源中国 官方微信账号
目录
相关文章推荐
程序猿  ·  “彻底放弃 ... ·  4 天前  
程序猿  ·  偷偷浏览小网站,被问候了。。。 ·  4 天前  
程序猿  ·  离开1620天,Redis创始人antire ... ·  5 天前  
程序员小灰  ·  我的项目,彻底爆了! ·  6 天前  
OSC开源社区  ·  KaiwuDB ... ·  5 天前  
51好读  ›  专栏  ›  OSC开源社区

日本中学生创造了一门“类似中文”的编程语言

OSC开源社区  · 公众号  · 程序员  · 2025-01-11 21:00

正文

natsuakane 是一名日本的中学生(13 岁),他创造了一门类似中文的编程语言 Wei-lang(https://github.com/natsuakane/Wei-lang)。用他自己的日式汉语来介绍就是“我制作偽中国語之機械言語”。

Wei 是“伪”的拼音,lang 是 language 的缩写。下面我们就通过一段计算斐波那契数列第 n 项的代码,来看看 Wei-lang 的特点。

  1. 関数「普伊墓那値」引数「数」行
  2. 「結果」是「数」
  3. 「数」大一場合「結果」是「普伊墓那値」(「数」引二)足「普伊墓那値」(「数」引一)
  4. 「結果」
  5. 「表示」(「普伊墓那値」(「入力」(『整数』)))
  6. 「表示」(「新行」)

将这段代码存储到文件 fibonacci.wei 中,然后用 weilang 命令解析这个文件,并输入 10,

  1. ./weilang fibonacci.wei
  2. 10
  3. 55

这段代码输出了 55,这正是斐波那契数列的第 10 项。

Wei-lang 与主流编程语言最大的不同点就是代码中充满了汉字,所有标点符号也都是全角符号(使用半角空格作缩进反而会出错)。

若将这段代码翻译成 Python 代码,大概是这样,

我们注意到,在 Wei-lang 的代码中,有些汉字括在了「」之中。这些汉字构成了函数、参数和变量的名字。

例如 「数」 相当于 Python 代码中名为 num 的参数; 「結果」 相当于名为 result 的局部变量。 「表示」 和 「入力」 后面都带有 (),应该不难猜出它们是函数名。“表示”和“入力”这两个日文单词的含义分别是“显示”和“输入”,所以对应 print() 和 input() 函数。

在主流编程语言中,函数名和变量名等标识符要么是英文和数字的组合(如 C、Java、Go 等),要么是以特殊的符号开头,比如 PHP 中的 $var,MySQL 中的 @var。像 「数」 这种前后都需要特殊符号的写法从未出现过。不过,用一对括号将参数括起来也有好处,这样在函数的参数列表中,就可以省略 , 分隔符了,例如 (「甲」「乙」),中间就不需要再加逗号了。

「普伊墓那値」 这个函数名中的每个汉字我们都认识,但合在一起就完全不知道什么意思了。这其实是日语中的借用字(当て字),即不考虑汉字原本的含义,仅使用汉字来表示外来语读音的现象。类似咱们小时候刚学英语时,用汉字标注单词读音的做法。

Wei-lang 在函数返回值方面还有点 Rust 的风格,最后一个表达式,即 「結果」 的值就是函数的返回值。

代码中还有些汉字没有括在「」之中,除了表示数字的零一二三四五六七八九,剩下的那些汉字相当于运算符和关键字。如 関数 相当于 Python 中的 def,表示开始定义函数。  相当于赋值的 =;  相当于比较运算符 >;  和  来自日语的引く和足す,分别表示减法和加法; 場合 一词多出现在日语中表示”如果……就……“的句子中,正好对应 if 语句。

 和  从出现位置上可以判断出分别对应 C、Java 等语言中的 { 和 }。从含义上看,用  作为表示结束的 } 还挺合适的,不过  和表示开始的 { 有什么关联暂时没有想到。

另外,“行”字可以拆开成“彳”“亍”(chì chù)两个字,其实这两个字本身就有左右的含义。彳表示左步;亍表示右步, 彳亍合在一起指缓步慢行。这两个字曾用于翻译量子力学中也有左右之分的狄拉克符号。


虽然作者 natsuakane 自称 Wei-lang 是类似中文的编程语言,但很多汉字的用法并不符合汉语习惯,所以更准确的说法可能是"Wei-lang 是一门汉字编程语言”。

Wei-lang 是用 C++实现的,源代码只有不到 1800 行。尽管代码量不大,Wei-lang 依然具备了基本的编程语言功能,而且采用了编译原理中的 LL(1) 自顶向下分析法,并利用了多态、组合设计模式等编程技巧,很难相信这些代码竟出自一位中学生之手。

natsuakane 曾表示,思考如何才能写出像中文一样的代码很有意思。