随着人们生活水平的不断提高,在节假日中越来越多的人都会选择外出旅游,在此背景下,各个旅游网站之间的竞争也越来越激烈,那么什么样的旅游网站可以脱颖而出呢。我们从某网站中获得了1748条关于旅游网站数据,尝试对这些数据进行分析,找出影响网站评论数的因素,为旅游网站负责人提供一个思路。
评论数:连续变量,取值范围[0,2139]。
网站名称:文本数据;
公司名称:文本数据,介绍网站所属公司;
网址:文本数据,介绍网站的网址;
营业地址:文本数据,介绍网站所属公司的所在地;
是否入驻:分类变量,分为商家已入驻、商家未入驻两大类;
好评率:连续变量,取值范围[20%,100%] ;
投诉数:连续变量,取值范围[0,3];
新闻报道数:连续变量,取值范围[0,24847];
成立时间:时间变量,取值范围[1981/4/8,2015/10/23] 。
本数据中以搜狐旅游为例,搜狐旅游这个网站(网址为travel.sohu.com)属于北京搜狐互联网信息服务有限公司,该网站成立于2003/7/31,营业地址为北京市海淀区科学院南路2号院3号楼11层1101,搜狐旅游网站在某网站(抓取数据的网站)完成商家入驻(向某网站提交企业注册名称和资质照片就可以完成商家入驻),网友对搜狐旅游共有93条评论,好评率为79%,有0个网友对搜狐旅游进行了投诉,有1篇关于搜狐旅游的新闻报道。
建立回归模型,解释影响评论数因素,找出受欢迎的旅游网站特征,为旅游网站负责人提供一个思路。
识别下方二维码进入狗熊会案例平台