大家可能注意到,我们的公众号很久没有更新了……先跟大家说一声抱歉。
但这绝对不是因为我们偷懒哦!事实上,我们最近在和数卜信息的小伙伴们一起做一个好玩的实验——做一个算命机器人,建立数据模型以探究人的性格特征,以及人与人之间的关系。
我们为什么要做这个实验呢?
大家知道,城市数据团最关心的就是生活在城市里的人。我们关心城市居民的数量规模、流动趋势、职住通勤,以及生活状态。这些研究中,城市中形形色色的人群被我们抽象成同质化的数据对象;而这次的实验则是反其道而行之——我们希望从数据中还原人的多姿多态,还原城市中人际关系的无限可能。
我们猜测,如果能获得足够的真实的人的性格特征、真实的人际关系作为训练样本,在此基础上利用机器学习算法模拟构建人的心理状态,就有可能真正帮助人认识自己,并对他的生活和社交方式给出符合实际且个性化的建议,而不是像许多流行的八卦理论一般,遵循一些模棱两可的固有套路。
这便是我们研发这个算命机器人的初衷。其中一大关键,便是收集到大量的、真实的训练样本。
因此,我们发起了这次算命机器人的训练样本众筹实验,邀请城市数据团的读者作为我们的首批用户,为我们贡献真实的数据、并对算命机器人1.0版给出的初步预测结果给予评价(点赞或点踩)。也欢迎大家邀请好友共同参与我们的实验(数据将被严格保密,我们不会未授权分享或用作模型训练以外的其他用途)。
我自己(团支书)也贡献了一点点数据,摘录部分结果如下:
看到这里,你是不是已经摩拳擦掌想要参与实验了呢?如果你已经迫不及待,可以直接跳到本文结尾看“参与方式”;如果你想了解更多算命机器人的训练过程,请继续往下看。
“算命”本质上是一类心理学或社会学研究。在学术界,类似研究往往通过问卷和访谈的方式获取研究样本,再通过研究者的深入洞察总结出规律。而在民间,星座、塔罗、风水等各种理论层出不穷、似是而非。作为数(ba)据(gua)研(ai)究(hao)者(zhe),我们猜测,这些问题或许也可以用数据和算法来解决。
说干就干。这个模型的训练,始于名师引路,成于数据积累,不断优化,没有终点。具体而言是这样的:
第一步,模型设计。我们请了多位心理学和情感专家,在他们的指导下选取个人特征建立画像模板,同时定义了描述个人特质以及两人关系的数据指标作为目标结果,并确定了各指标的数据类型。第二步,初始样本生成。研究各种特征在人群中的分布,建立了数千人次规模的初始样本。第三步,数据标定。我们建立了单人和双人的两种场景,由专家根据单人的生日、所在地和日常行为等信息将样本归入不同的性格类型,并在双人场景下对二人当前关系与发展趋势进行类型和数值的标定。第四步,建立对应的统计学习模型。
当真实有效的样本数量达到一定规模以后,这个模型便可以脱离专家,完全依靠不断积累的数据和不断优化的算法独立完成预测。
大致的流程如下图所示:
我们目前已经完成了这个流程的前半部分,可利用“专家知识+初级算法”进行预测。然而,现在的真实样本还不够多、预测结果还不够准,我们还需要让更多、更多、更多的人参与进来,不断优化模型。
为了让大家快乐参与,我们把现有的模型封装成一个小游戏,希望大家多多来玩,并对模型给出的结果提供反馈(点赞或点踩)。当我们的众筹实验达到预期,就可以推出更好的模型、更多的新功能新玩法给大家~
在小小算命机器人的成长之路上,希望有你。
参与方式
1.长按识别下图中的二维码开始游戏,可获得个人解码报告、生成邀请函与好友一同玩耍。
2.关注微信公众号“城市数据团”点击子菜单“算命”,可以开始游戏、生成邀请函、查看好友匹配榜。
3.戳“彩蛋”二字进入算命机器人研发团队邀请函页面,与小伙伴配对~与团支书先天匹配度100%的小伙伴请将截图发送给公众号“城市数据团”,将有机会获得数据团赠书一本~数量有限,先到先得~
4.通过以上3种方式参与活动的用户才享有“点赞点踩”的反馈特权,通过其他用户的分享页面(邀请函/配对结果)进来的次级用户虽然也可以正常游戏,但不享有反馈特权哦~
5.数据将被严格保密,我们不会未授权分享或用作模型训练以外的其他用途。