专栏名称: 表哥有话讲
国内最大的R语言专业学习平台| R官方认证学习实践社区--校企实践交流、名企内推和成果分享,立即关注-掌握R语言全球最新资讯与成果!
目录
相关文章推荐
重庆日报  ·  重庆楼市迎来“开门红”! ·  昨天  
重庆日报  ·  重庆楼市迎来“开门红”! ·  昨天  
重庆市文化和旅游发展委员会  ·  重庆春节哪里人气最旺?这些地方排名前5→ ·  4 天前  
重庆市文化和旅游发展委员会  ·  重庆春节哪里人气最旺?这些地方排名前5→ ·  4 天前  
重庆市政府网  ·  春节假期前4天 ... ·  4 天前  
重庆市政府网  ·  春节假期前4天 ... ·  4 天前  
重庆之声  ·  重庆之声丨‍‍四天热销近9000万元 ... ·  4 天前  
第1眼新闻  ·  启动黄色预警!洪崖洞景区发布最新公告 ·  5 天前  
第1眼新闻  ·  启动黄色预警!洪崖洞景区发布最新公告 ·  5 天前  
51好读  ›  专栏  ›  表哥有话讲

NBA球员身体数据及位置分析

表哥有话讲  · 公众号  ·  · 2017-10-13 11:50

正文

作者: 韩琦儿 算法工程师 R语言中文社区专栏作者。 知乎专栏:https://www.zhihu.com/people/han-qi-er-11/posts


前言

让我们先来看则新闻,元旦联盟爆炸出一惊人记录,就是绿军与热火的比赛中,凯尔特人后卫小托马斯爆砍52分,其中第四节一人独揽29分,且命中杀死比赛的三分球。但小托马斯身高仅仅175cm。不禁会想身高会限制位置吗,还有现在的NBA为什么后卫闪耀中锋却凤毛麟角?

数据获取

从NBA中国官方网站获取449名现役NBA球员的位置,身高,体重,国籍等数据。

数据分析

球员身高分布

library(ggplot2)

ggplot(hy0209,aes(x=Position,y=Height,col=Position))+geom_dotplot(binaxis = "y",binwidth=0.5,stackdir="center")

几个有意思的异常值

  • NBA运动员最矮的人

> hy0209[hy0209$Height==min(hy$Height),]
           Player         player     team Position Height Weight years country
44 Thomas, Isaiah 托马斯, 以赛亚 凯尔特人     后卫    175   83.9     5    美国

78    Felder, Kay     菲尔德, 凯     骑士     后卫    175   79.8     0    美国

意外发现联盟里 有两名175cm的球员 ,这给那些热爱篮球的身高不够的骚年们多大的鼓励啊!!

  • NBA运动员最高的人

> hy0209[hy0209$Height==max(hy$Height),]
                 Player                   player   team Position Height Weight years  country
146   Marjanovic, Boban         马亚诺维奇, 鲍班   活塞     中锋    221  131.5     1 塞尔维亚

326 Porzingis, Kristaps 波尔津吉斯, 克里斯塔普斯 尼克斯     前锋    221  108.9     1 拉脱维亚

看到也有两个人身高同时达到了221cm,而且还都不是美国人。

可以发现,NBA中锋球员明显少于后卫及中锋,中锋的数量不及后卫及前锋的三分之一,近几年NBA缺少中锋的言论确实不少,

  • NBA球员国籍分布

hy020912),]
hy02091

NBA里容纳43个国家的顶级球员,还有4名球员国籍不详。75.5%的球员是来自美国,6.5%来自法国,加拿大,巴西。

各个球队的中锋配置

hy02092

在中锋匮乏的NBA,有8个球队只配备了一名中锋,黄蜂队却配置了4个中锋,快攻见长的勇士也配有3名中锋,根据市场供给原则,大胆的预测下,在今年球员交易日截止前, 黄蜂队必有中锋被交易

1. 位置水平下的方差分析

将篮球队员的7个位置(我也不知道为何官方这样划分: 后卫, 后卫-前锋 , 前锋, 前锋-后卫, 前锋-中锋,中锋,中锋-前锋)看成7个水平,将7个位置下的身高看成该水平下的观测值

我们看不同水平下的观测值是否一样

> lamp lamp.aov summary(lamp.aov)
             Df Sum Sq Mean Sq F value Pr(>F)    
A             1  25918   25918    1277 <2e-16 ***
Residuals   447   9073      20                   
---

Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

看到P值 <2e-16, 所以不同位置下的身高明显不同

数据探讨

先看下球员身高体重的分布

既然身高对位置有影响,不妨按身高体重进行聚类,用kmeans聚成3类,看聚类的效果好不好







请到「今天看啥」查看全文