专栏名称: 狗熊会
狗熊会,数据产业的高端智库!狗熊会帮助合作伙伴制定数据战略,培养数据人才,研究数据业务,发现数据价值,推动产业进步! 狗熊会使命:聚数据英才,助产业振兴!
目录
相关文章推荐
EETOP  ·  探索 AI 时代的核心:嵌入式 SRAM ... ·  2 天前  
ZOL中关村在线  ·  重磅!荣耀 MagicOS 9.0正式发布 ·  4 天前  
51好读  ›  专栏  ›  狗熊会

基础案例 | 世界这么大,你怎么去看呢?

狗熊会  · 公众号  ·  · 2017-11-08 06:59

正文

背景介绍

随着人们生活水平的不断提高,在节假日中越来越多的人都会选择外出旅游,在此背景下,各个旅游网站之间的竞争也越来越激烈,那么什么样的旅游网站可以脱颖而出呢。我们从某网站中获得了1748条关于旅游网站数据,尝试对这些数据进行分析,找出影响网站评论数的因素,为旅游网站负责人提供一个思路。

因变量

评论数:连续变量,取值范围[0,2139]。

自变量

网站名称:文本数据;

公司名称:文本数据,介绍网站所属公司;

网址:文本数据,介绍网站的网址;

营业地址:文本数据,介绍网站所属公司的所在地;

是否入驻:分类变量,分为商家已入驻、商家未入驻两大类;

好评率:连续变量,取值范围[20%,100%] ;

投诉数:连续变量,取值范围[0,3];

新闻报道数:连续变量,取值范围[0,24847];

成立时间:时间变量,取值范围[1981/4/8,2015/10/23] 。

样本解释

本数据中以搜狐旅游为例,搜狐旅游这个网站(网址为travel.sohu.com)属于北京搜狐互联网信息服务有限公司,该网站成立于2003/7/31,营业地址为北京市海淀区科学院南路2号院3号楼11层1101,搜狐旅游网站在某网站(抓取数据的网站)完成商家入驻(向某网站提交企业注册名称和资质照片就可以完成商家入驻),网友对搜狐旅游共有93条评论,好评率为79%,有0个网友对搜狐旅游进行了投诉,有1篇关于搜狐旅游的新闻报道。

业务理解

建立回归模型,解释影响评论数因素,找出受欢迎的旅游网站特征,为旅游网站负责人提供一个思路。



识别下方二维码进入狗熊会案例平台

点击“阅读原文”,即可下载数据!