行业调整,激烈竞争,互金深浅不试怎知?
真实数据,真实环境,真实投资人如何打动?
10万美金,创新应用,谁是未来的互金引导者?
把握未来十年的价值风口,让技术的力量不再沉默,拍拍贷魔镜杯再度启动:10万美金奖金池,500万美金创投基金,邀你与全国优秀选手同台竞技。不论你是专业的数据分析师、精湛的应用开发者、还是超强的产品设计师,抑或是技能全通的的实力全才,魔镜杯数据应用大赛都可为你提供挑战的舞台。
为帮助参赛选手更好理解赛题,由科赛网优秀选手、拍拍贷技术专家组成技术分享团,为你出炉全方位参赛指南!
苗富,上海交通大学管理科学工程研究生,IBM Spark 全球数据应用大赛最佳学生奖,中国区第一名;拍拍贷魔镜杯数据产品开发大赛铜奖获得者。
朱杰,法国雷恩一大博士学位,博士期间研究方向为时间序列分析,拍拍贷高级数据工程师。在机器学习领域有着较深的理论造诣和丰富的实践经验。拍拍贷人工智能项目主要负责人之一。
1.组建一个高产出的团队
人是第一生产力,一个有共同目标,知识结构多样化,互补的团队是成功的一大半。
2.在开发产品比赛中,要做好调查
这些调查帮助团队明确自己的产品属于行业中的什么生态位,包括产品面向的上下游,同行业公司的竞争产品,目标用户的状况。要把你产品的故事置于一个背景之下,有好的故事,才有好的产品。把你开发的产品放在一个合适的行业痛点之上,往往可以撬动更大的金子。另外,在做行业调查的时候,你会为你的产品开发提供了丰富的素材和思路。
3.跨学科交叉,多种思维交叉
产品开发往往是要解决一个复杂的问题,这就需要多方面的人才。比如在IBM数据比赛中,我们需要整体的金融产品设计,然后按照这个设计图,寻找或者爬取相关的数据,Hadoop,Spark工程师,自然语言处理以及数据分析,金融量化研究,可视化web开发。无论是在算法比赛,产品开发比赛中,综合多背景,多思维,考察同一个问题,往往可以产生新的视角。
4.封装自己
web可视化是一个非常好的工具,目前网上也有很多优秀开源的前端可视化工具。这一点在产品开发比赛尤为重要。
5.持续迭代和坚持
在参加算法比赛的时候,后期的特征工程,新的模型框架设计,模型融合都是可能产生新的提升。在产品比赛中,从用户的角度重新审视你产品的可用性,设计更加完善的产品规划等也是要反复提升的。你会发现你的能力也在反复的迭代过程中开始慢慢提升的。纸上得来终觉浅,团队在不断挑战自己的过程,会把一个问题看得更深,也会把团队成员的过去孤立的知识点全部链接起来。这个也是我从参加比赛中收获最大的一个方面。
拍拍贷为本次赛事提供丰富的业务场景、真实脱敏的数据及多种功能的可调用接口,参赛选手将直面投资者需求,打造数据应用,结合过往的经验,比赛可以从以下三个数据方向来展开角逐:
1.投标类:开发一款投标工具,帮助投资人实现投资收益的优化,并自动高效地完成从选标到投标的全过程。可能包括部分策略开发等分析相关工作,更重要的是能够调用投标接口完成投标功能。
2.分析类:基于拍拍贷平台的整体数据(类比上交所大盘)或投资者个人的投资历史数据(经授权),运用数据科学技术进行分析或挖掘,为投资人提供有价值的信息、建议等个性化服务。比如建立拍拍贷资产大盘,设计指数反映成交速度、资金资产匹配程度等;针对投资者授权的个人数据,进行收益、逾期等情况全面分析,帮助投资人了解自己的风险偏好,流动性偏好等投资倾向,提供有效建议如规划未来的现金流等,使投资人得到更加个性化的体验。尽管也可能需要调用投标接口,但重点是提供信息、建议等服务。
3.创意类:不包含在前两类内容中的有价值的产品或服务。创意类方向不设任何限制,基于现有的数据与资源,发挥创造力,做出一个让自己满意、也被市场认可的有价值的作品。可以是提供投资收益排行榜、粉丝互动的金融社交类应用平台,也可以是供新手练手的模拟交易平台等。
初赛和复赛阶段,评委们会在这三个方向分别按照一定的比例来选拔优秀参赛作品进入下一轮比赛。而决赛阶段将不分方向,所有参赛作品会放在一起进行评选。因此,巧妙选择比赛的切入点,不失为一条进入决赛的捷径。
1.投标小工具
纯粹的抓标投标功能很难引起投资人的兴趣,一般会配合上相应的投资策略。此类小工具可通过以下思路来搭建:
(1)获取公开数据集,进行资产分析,设置投标策略;
(2)实时调用LoanList接口,获取当前可投标的;
(3)实时调用BatchListingInfos接口,获取标的详情信息,并根据策略条件进行筛选;
(4)实时调用Bidding接口,完成投标。
2.基于拍拍贷平台整体的数据分析
除了LCLP数据集,通过调用接口,也可以对拍拍贷大盘进行分析,简单思路如下
(1)按一定的频次调用LoanList接口,获取不同时间点的可投标的情况;
(2)调用BatchListingInfos接口,获取标的详情信息;
(3)调用BatchListingBidInfos接口,获取标的投标信息(投标用户、投标金额、投标时间);
(4)综合以上信息,进行大盘分析。
3.用户资产分析
下图是拍分析网站所提供的众多功能中的一种,资产评级分析:
类似的功能也可以通过调用OpenAPI接口来实现,思路如下:
(1)调用BidList接口,获取用户投标记录;
(2)调用BatchListingInfos接口,获取标的详情信息,根据多个维度进行用户资产分析;
(3)根据公开数据集进行风险分析,并应用于用户的资产分析。
通过对数据和开放平台接口的结合,我们可以实现很多功能,以上只是简单的示例,更加精彩的功能有待参赛者去挖掘。
投资人在工具方面的需求是多种多样的,投标和分析两类小工具并不一定能完全满足,因此主办方在初赛和复赛中设立了创新类产品这一方向。该方向的要求如下:
1.不只是为投资人提供投标、分析服务;
2.能被市场认可。
除此之外,无任何其他限制,大家可以尽情地施展想象力,开发出更多的精彩功能。下面举
两个简单例子来说明,
(1)投资交流平台:提供可供投资人分享自定义策略、风险偏好分析、投资心得等的信息平台,平台可以设置策略跟投、积分体系、收益PK等功能;
(2)金融产品设计:围绕拍拍贷散标、债权设计金融产品,并能吸引市场上的投资人。
为了保证比赛的顺利进行,主办方可提供:
1.OpenAPI
拍拍贷开放平台(http://open.ppdai.com/)提供了功能丰富的各种接口供开发者使用。参加本届魔镜杯比赛的选手,首先要按照“新手指南”上的步骤,在拍拍贷开放平台上注册开发者账号:
下图是投标类的几个接口:
值得一提的是,拍拍贷开放平台的开发者文档对于接口除了有详细的说明之外,还提供了简单易懂的例子,因此对新手开发者非常友好。
2.开放数据集
本次比赛所提供的开放数据均为脱敏后的拍拍贷真实业务数据,分为LCLP和LCIS两部分。
(1) LCLP数据集
LCLP数据集为信用标的一个样本,数据集包含LC(标的特征表数据)和LP(标的还款计划和还款记录表)两部分。
其中,LC (Loan Characteristics) 表为标的特征表,每支标一条记录,共有21个字段,包括一个主键(listingid)、7个标的特征和13个成交当时的借款人信息,全部为成交当时可以获得的信息。
而LP (Loan Periodic) 表为标的还款计划和还款记录表,每支标每期还款为一条记录,共有10个字段,包括两个主键(listingid和期数),3个还款计划字段和4个还款状态字段。
基于LCLP数据集可以做非常多有意思的分析,例如,结合LP表中分析得出的是否逾期label,我们就可以对LC表中的标的进行建模,从而预测当前平台上标的逾期风险,为投资提供可靠依据。
(2)LCIS数据集
LCIS数据集是一个客户投标数据的展示,包括这些标成交时的特点(Loan Characteristics)、该客户投资的金额以及截至当天的收款情况(Investment Status)。每一个文件对应一个recorddate,提供了该客户投资的从2015年1月1日起到recorddate当天成交的所有标的数据,包括这些标成交时的特点(Loan Characteristics)、该客户投资的金额以及截至当天的收款情况(Investment Status)。
LCIS数据集的LC部分与LCLP数据集中的LC表一样,有相同的21个字段。IS部分有15个字段,包括截至recorddate当天标的还款状态,针对这位客户的已还和待还金额,最近的还款情况和下一期还款计划。
针对LCIS数据进行分析,我们也可以得出不少有趣的结果,比如分析投资人的投资偏好,从而得出适合该投资人的投资策略。
由于版面所限,这里无法一一列举相关字段以及对应的数据预览,想获得更多信息请访问比赛官网上的数据集页面。
(3)学习材料
涉及公司业务、贷前把关、贷后管理以及OpenAPI调用,报名比赛后可加群610095869领取。
需要大家注意的是,本次比赛分三个阶段,在初赛阶段大家宜从简单功能着手,做出一个可供投资人使用的小工具,在此基础上逐步添加新功能,从而避免因系统实现过于复杂,在有限时间内未能完成而影响进入下一轮的比赛。
赛事详情请点击阅读原文
↓↓↓