在 faraway 包中包含一个名为 worldcup 的数据集(加载 faraway 包后,可通过代码“head(worldcup)”查看数据的前 5 行,该数据集是 2010 年世界杯上球员的信息数据,每个变量所表示的信息如下:
Team: 国家
Position:位置,包括后卫、前锋、守门员、中场
Time: 上场总时间
Shots: 射门的次数
Passes:传球次数
Tackles:铲球次数
Saves: 救球次数
数据概况:
该数据集中,数据集包含595个样本,共有7个特征。其中Team,Postition是分类变量,后面的都是数值型变量,其中行名是球员名字。
导入需要的包和数据集 ,导入需要的包和数据集;
上场时间和传球数量的关系
运行结果
由图形可看出,各球员上场时间多集中于 400 以内,传球次数也对应集中于 200以内,其中 Midfifielder 位置的上场时间和传球次数较为出众。同时一定程度上,上场时间越长,传球数越大。
3. 不同位置射门次数直方图
运行结果
由图可发现,大部分球员射门次数集中于 5 个以内,其中 Defender 射门次数较少,而 Forward 射门表现较为优异,符合常理。
4. 不同队伍射门次数直方图
运行结果
5. 不同队伍射门次数直方图
运行结果
由图可知 Brazil 队射门次数平均较高,但无极端异常高的值,可推测其与队伍战术风格有关,以进攻为主,但各队员水平相近,表现稳定,而 Ghana 等队虽然整体平均还行,但是有一个极端高值,可推测是有球员表现尤为优异,带动队伍射门进攻。
6. 绘制球员分布国家地图可视化
运行结果
可通过地理信息数据发现,球队主要来源于西半球,各队伍成员数量较为相近,无过于显著的差异。
其中,安装REmap时,常规方式安装会报错,可利用下面方式解决:
绘制球员人数分布直方图
运行结果
可发现人数分布服从近似正态分布。
8. 对不同位置人员进行上场时间与射门次数的分析
运行结果
由图可发现,Forward 的射门次数都较高于其他位置,符合常理。
9. 国家与射门次数之间的关系
运行结果
从整体来看,Spain 总的射门次数最多,可看出在比赛中处在上风。Honduras 较少处于劣势。
10. 每个运动员上场时间及射门次数关系
运行结果
图形宽度代表上场时间,颜色深浅代表射门次数。可发现 Gyan,Villa 球员上场时间多,射门次数也多,是团队核心成员,而 Jong Tae-Se 上场时间中等,但射门次数较多,是很有潜力的成员。通过这个图寻找核心成员,同时挖掘潜力成员。
11. 球员上场时间分布图
运行结果
12. #位置、射门、救球、传球、铲球之间的关系(散点矩阵图)
运行结果
由这个图可以得到许多信息。可发现后卫数量是最多的,而门卫是数量最少的。同时可看出,四个位置的传球数,射门数等都服从偏态分布。Tackles 后卫表现突出,Shots 前锋表现突出.符合常理。
文章声明:以上内容(如有图片或视频在内)除非注明,否则均为雨燕体育直播_雨燕无插件体育直播_雨燕直播体育_雨燕体育直播nba原创文章,转载或复制请以超链接形式并注明出处。
本文作者:admin本文链接:https://123wssy.com/post/1478.html
还没有评论,来说两句吧...