挚友梁博一直表达了要离开北京的想法,想不到,会来得这么快。匆忙之下,也没什么好准备,谨以此文记录一些他的故事。
相识微博
我和梁博最早相识是在微博上,一天,突然发现我们都对网页搜索,信息检索,机器学习感兴趣,又是清华校友,还都是人工智能实验室的,他还是我在清华时熟知的马少平老师的博士生。相见恨晚。
THUIRDB
这是我知道的梁博研发出来的第一个产品,让我认识到他是一个geek。这是一个C++语言实现的基础库,用于在单机上实现高性能key-value持久化存储和高速查询,是一个大数据处理工具,用了很多黑科技。但是,据说Google的levelDB开源之后给了梁博一点小小的刺激,能看上去他有些沮丧。
西瓜大会
梁博有一个梦想,就是想把码农们联合起来,互相帮助,互相提高,切磋技术,畅想人生,于是他发起了西瓜大会这个活动,而且成功的举办了很多次,帮助不少码农找到了女朋友,找到了更好的工作,认识了更多的朋友。或是赞助,或是自掏腰包,每次聚会,不管春夏秋冬,都有西瓜。聚会一般在晚上十点,原因是码农喜欢夜深人静的时候工作。他是最了解码农的码农之一,但是,他现在已经是梁厂长了。
微博寻人
梁博和我都对微博的数据挖掘有兴趣,这也是我们讨论的很多的话题之一。有清华的网络资源,梁博做了最早的微博爬虫,有了海量的微博数据,做出了让人impressed的微博寻人产品,比如,你输入“机器学习”,系统能给出这个方面的很多专家的微博账号。据说,很多的猎头受益于这个产品,发现和成交了很多的候选人。很显然,梁博很早发现了这种需求,但是,后来基本被微信的各种专家群解决了。
爬盟
爬盟是梁博发起的公益组织,目的是通过众包的形式,解决大家对爬虫的需求。需要网上语料的个人,单位,贡献自己的爬虫资源,然后共享爬取的成果。他们搭建了一个中控系统,负责控制成员管理,任务分配,资料共享。我的两个至好的朋友,贺志明和张成,就是当中的主力成员。
科学上网
用过这个服务的人都知道它的好,没用过的也没必要知道了,因为服务已经停止了,用他的话说,就是不想惹麻烦,不想被请喝茶。科学上网,一个目的是给码农提供刚需服务,一个是为了采样数据完成他的科学研究。他还专门为这个服务搭建了一套机器管理系统,一键管理所有的机器和服务,也为他之后的智能爬虫打下了坚实基础。
智能爬虫
梁博对系统的底层有深入的研究,对黑科技有浓厚的兴趣和投入。他的爬虫,能穿透任何的防爬手段。微信的反爬技术是很厉害的,但是也逃不过梁博的高科技。据说他购买了成千上万的手机,开发了人工智能模拟技术,在手机上模拟人类行为,注册,登录,触摸,点击,键入,能爬取任何App内的数据。确实,他是市场上为数不多的能提供微博,微信,Facebook,Twitter,等社交网络数据的团队之一。
论文烦恼
做系统对梁博来说是小菜,可是,为了博士,论文一直是他的烦恼。每次,梁博发表了一篇博士要求的会议会是期刊的论文,他就会高兴的像个小孩,一定会请我们大搓一顿。记得还差半年就要毕业了,可是还差一篇学位要求的论文,这可急煞了他,这时,他放下手头的一切工作,断绝了一切的外部交往,闭门一个月,终于大功告成。
谋福利献爱心
每次做成一个项目,梁博会把大部分的收入分给团队的成员,他说,成事靠朋友,有钱大家一起赚。他懂得“带着兄弟们发财”的重要性。他还会花一些钱给老婆买个礼物,给小孩买个玩具,然后还会给一些公益基金捐献一些。然后,老是幽默跟我们说,苦呀,这个月的饭钱又不知道去哪弄了。毕业以后,梁博租了个地下室,开始了自己做厂长的道路,据说冬天暖气不足,靠一个军大衣避寒。
大搓一顿
每次见到梁博,都要请我“大搓一顿”,就是去清华食堂,每人一个小火锅,吃的满身是汗,但是不亦乐乎。请梁博吃饭的人很多,我是有幸被梁博请吃饭的人。后来,请梁博吃饭都得出价了,据他说,很多老板没有诚意,都被他的高价给吓跑了。
大老板
梁博认识的大老板很多,他常挂在口头上的,和某个大老板吃饭了,和某个大老板谈成了一笔生意,某个大老板给他捐了几台机器,某个大老板给了一朵云服务,等等。细问他具体是那个老板,他呵呵一乐。
炒股
梁博不时的会告诉大家,哪个股票现在值得买,因为根据他的数据分析,这个股票该涨了。他还会自己付诸行动,不时报道战果。我还真按照他的建议,操作过一个,结果,亏了。梁博,我还没找你麻烦呢。
跑步
梁博是我们奥森十公里跑步群的成员。可最早的时候,他跑一公里都有问题,但是,慢慢坚持,最后,他也能轻松的跑下十公里。他特别喜欢在清华的东大操场跑圈圈,不知他有什么企图。
聊天
梁博的讲座和聊天都是非常幽默的,段子很多,包袱很多,而且善于自嘲。参加过几次他的讲座,每次除了学到知识,还会心情大好,笑的前仰后合。
梁博的故事还有很多,以后再给大家慢慢道来。更有一些劲爆的故事,没有得到他的首肯,不敢乱说。
大家可能还感兴趣:
谢谢。