2020 年 NBA 各队数据整体分析,采用 seaborn 绘图库,仅供粉丝参考
这个周末有空,我很喜欢篮球,也很喜欢勒布朗詹姆斯和德维恩韦德。我们对2020年NBA各支球队的数据做了一个整体的分析,在去掉了一些重复数据和有问题的数据后,数据量有所缩减,所以本次分析纯属娱乐,分析结果仅供NBA球迷参考。
这次分析没有完全依赖和来实现,而是用了这个方便的绘图库。又或许是懒得去记那些繁多的API。
步骤 1:加载数据
数据 = pd.('./data/.csv')
数据.head()
当我拿到这个数据的时候,作为一名资深的NBA球迷,我一度怀疑这是否是2020年的数据,看上去很像17-18赛季的数据。
第 2 步:简单数据分析
根据获取的数据,共有342名NBA球员,38项统计数据。
以下是数据中的一些重要信息:
球员平均年龄26.4岁,年龄范围19-40岁;
球员平均年薪为730万美元,当时最大的合同为每年3000万美元;
第三步:先看明星球员的效率
在众多的数据中nba球队,分布图,有一项叫做“RPM”,它标识的是球员的效率值,这项数据体现的是球员在场上时对球队胜利的贡献,最能体现球员的综合实力。
我们来看一下RPM与其他数据的相关性:
关联 API:corr()
热图呈现相关信息:()
解释一下:图中我圈出了一个数据,annot=False,意思是热力图中不显示该数据,原因是我原来建立的画布太小了,显示出来的数据会比较乱。
如果需要展示数据,可以使用plt.()通过设置参数创建合适大小的画布,并调整annot=True来展示热力图数据。
第三步:分析球员薪水、效率、年龄等数据
3.1 收入最高的 10 位运动员
3.2 效率最高的10名球员
分析:詹姆斯是联盟薪水最高的,而且打得非常好,效率值第一,保罗和库里紧随其后,前10名榜单勇士占据3席,我们的勇士很厉害。
3.3 出场时间最多的10名球员
分析:“钢铁侠”——勒布朗·詹姆斯
3.4 接下来我们来看看数据中NBA全体球员的效率和年龄分布情况。
分析:基本符合正态分布特征
球员薪水:
分析:不满足正态分布,明显偏态分布,高薪球员占比偏小。
3.5 在NBA,并不是年龄越大越值钱,接下来我们看一下高斯核密度分布图。
分析:25-30岁年龄段的球员普遍薪水较高,而联盟绝大多数球员年薪不到1000万美元。真羡慕他们的国家,每年收多少税啊?哈哈
3.6 我有一个业余的想法,球员薪水,效率值,年龄,场均得分四个变量之间有相关性吗?
分析:也许我太肤浅了,实在看不出有什么联系。
3.7 我们来看看NBA各支球队球员的年龄结构,我按照球员人数和效率值进行了排名:
分析:我真的很羡慕波士顿凯尔特人队、迈阿密热火队和金州勇士队的老板nba球队,分布图,他们拥有一群年轻而优秀的球员。
3.8 NBA球队综合实力分析(重点关注球员薪资、效率值、球员平均得分、三分球命中率等)
分析:勇士队(GS)和骑士队(CLE)占据前两位,效率值体现了球队的实际实力。
老资格的热刺(南非)排在第三位,平均年龄29.5岁排名第一nba球队,分布图,补血在即。
3.9 使用小提琴图查看NBA三分球和球员效率值
分析:从三分命中率来看,勇士是毫无争议的冠军,其次是骑士;从球员效率值来看,勇士和骑士显然是最大的两大赢家。