专栏名称: 表哥有话讲
国内最大的R语言专业学习平台| R官方认证学习实践社区--校企实践交流、名企内推和成果分享,立即关注-掌握R语言全球最新资讯与成果!
目录
相关文章推荐
古典文献学微刊  ·  会议 | ... ·  昨天  
打坐站桩  ·  站桩 循序渐进,假以时日,必有所成 ·  昨天  
葡萄酒商业观察  ·  全球首发单一年份黄酒,「慢宋」开启国际化新里程 ·  4 天前  
葡萄酒商业观察  ·  全球首发单一年份黄酒,「慢宋」开启国际化新里程 ·  4 天前  
古典文献学微刊  ·  新书 | ... ·  1 周前  
51好读  ›  专栏  ›  表哥有话讲

NBA投篮选择:什么样的方式投篮命中率最高?

表哥有话讲  · 公众号  ·  · 2017-10-26 11:50

正文

作者:韩琦儿  算法工程师R语言中文社区专栏作者。知乎专栏:https://www.zhihu.com/people/han-qi-er-11/posts


前言

最近注册了Kaggle,发现里面有很多数据集可以玩,比如NBA投篮数据。

数据概览

数据囊括了14,15年nba所有场次共128069条投篮记录

主要字段解释:

LOCATION : 主场H/客场W
W :W赢/ L输
FINAL_MARGIN:最终分差
SHOT_NUMBER :第几次投篮
PERIOD :第几节
SHOT_CLOCK:投篮时,篮板显示的时间即还剩几分钟该节结束
DRIBBLES :投篮前运球数
TOUCH_TIME:持球时间
SHOT_DIST:投篮距离
PTS_TYPE:2分/3分
CLOSE_DEF_DIST:最近防守人距离
FGM:1投进/0没投进
PTS :得分
SHOUT_RESULT;made投进/missed没投进

目的

1. 是否真的有主场优势

2. 什么样的方式投篮命中率最高

分析

df = pd.read_csv('C:/Users/Desktop/shot_logs.csv')
pd.crosstab(df.LOCATION ,df.W ,normalize = True)
W                  L         W
LOCATION
A                35496  28639
H                27978  35956

显然主场胜率 56.23% 比客场 44.65%高!

#决策树R语言(因为R语言可以直接画图)
library(party)
myFormula 

得到两个显而易见的结论

  1. 当投篮距离小于4.8英尺(1.46米),距离最近防守人超过4.5英尺(1.37),投篮命中率几近90%,ps:勇士队的无球跑动冠绝联盟。当投篮距离大于19.3英尺(5.88米),投篮命中率不到40%

  2. 持球时间大于1.5s相比持球时间小于1.5s,命中率会降低很多

总结

  • 确实有所谓的主场优势

  • 投篮距离对命中率影响很大

  • 持球时间短(比如接球就投篮)的命中率比持球时间长的要高


公众号后台回复关键字即可学习

回复 R              R语言快速入门免费视频 
回复 统计          统计方法及其在R中的实现
回复 用户画像   民生银行客户画像搭建与应用 
回复 大数据      大数据系列免费视频教程
回复 可视化      利用R语言做数据可视化
回复 数据挖掘   数据挖掘算法原理解释与应用
回复 机器学习   R&Python机器学习入门