不
知不觉中,私募登记备案月报已经出到第30期了,其实应该是第31期,因为少了2016年2月底的那期。
竟然没有人发现这个“漏洞”,这要是放到IT界,早就被黑客攻击了。
今天这篇文章,不是写市场的,而是我最近get到一个新技能——Python,拿出来嘚瑟下。
Python,是一门简单、便捷的入门编程。很多初学者喜欢把Python作为数据分析、机器学习的首选。
某日,我大脑灵光一闪:
2万多家私募管理人,起名最爱用到什么字?
于是,我就用 Python 抓取了基金业协会官网上,总共两万余家管理人,近30万字的公司名称,做了一些数据分析的工作。
(点击查看清晰大图)
数据源选的是基金业协会,毕竟是官网,数据最全、最真实。
选定数据源后,写了好一会代码,爬虫终于开始蹭蹭工作了。
爬虫一般会面对两个问题:
代理和效率。
1、代理
频繁地抓取网站的页面,IP 很容易被封。于是写了个抓免费代理的爬虫,抓了五十多个代理 IP,够用了。
2、效率
2万家私募管理人,即使是1秒一个请求,那也得5个半小时,小编可等不了。
于是我决定开10个线程,半个多小时程序就能跑完。
然后在半个多小时之后,我收获一个约6M,2万家私募管理人的数据库。
看着这满满的记录,感受到蜜蜂辛勤搬运后看着蜂蜜的喜悦,相信关于私募管理人名字的秘密全部都包含在里边了。
接下来,就是一些数据清洗、处理、分析的工作。
我想要的只是私募管理人的名字,所以得把法人、注册地、登记编号、成立时间、登记时间等信息除去。
即便是私募管理人的名字,也不是直接可以用的,需要去掉括号、地名,以及类似资产管理、有限公司等字样。
总之,都搞定了,以下就是分析结果:
在前十大常用字中,“中”、“金”二字占据首位,“华”、“信”、“汇”、“富”、“天”、“创” 、“融”、“德”等字排名其后。
这里有个小插曲,之前不少私募为了“套近乎”,取名时特意加上了“中”、“金”二字。
为此,中金公司还特意发了公告,做了澄清:某某机构与中国国际金融有限公司无关联关系。
不过,这并非是“中”、“金”二字居首的主要原因,毕竟“傍大腿”的公司只有63家,
真相只有一个。
没有谁给公司取名的时候,愿意用”亏“、”赔“之类的字吧。
作为私募行业的重镇,北上深的偏好是否会有所不同呢?
过程不再描述,此处省略一万字,直接看结果。
结果就是:
1、北京——爱用”泰“,不爱用”德“;
2、上海——爱用”银石鼎“,不爱用”天创融“;
3、深圳——爱用”泰“,不爱用”融“。
能带来财运的字都用上了,可以坐等收钱了吧?
如果真是这样,我也去注册一家私募,名字都想好了,就把最火的十个字串起来:中金华信汇富天创融德。
很显然,事情没这么简单。
为了证实自己的判断,我将最近一年、三年、五年、以及成立至今排名前十的产品,在不区分投资策略的情况下,做了个统计。
最火的十个字,并没有“高频”地出现,看来名字和业绩没啥太大关系。
即便如此,每位私募管理人在公司成立之初,取名之时,也还是会煞费苦心。
因为好的名称不仅是与其他私募相区分的符号,还有深刻的寓意,同时也容易给人留下深刻的印象。