回顾林丹的职业生涯用python看看粉丝都说了些什么

2020-07-06 12:00 Python爱好者社区

转自:数据分析与统计学之美

人民日报

前段时间《人民日报》发文称,37岁中国羽毛球名将林丹宣布退役,告别国家队,无缘第五次出征奥运会。

英雄林丹

林丹发文称:由于体能和伤痛已不再允许自己和队友并肩作战。之后的日子,希望有更多的时间陪伴家人,也会去寻找新的赛场。

PS:这个和马云正式宣布卸任阿里巴巴集团董事局主席的措辞有点像哈!他们都是英雄,致敬他们。

回顾林丹的职业生涯

林丹,1983年生人;1988年,5岁开始接触羽毛球;2000年进入国家队;2002首次登上羽毛球世界排名第一的位置。

林丹的职业生涯,共计获得两届奥运会羽毛球男单金牌,五届世锦赛男单冠军,也是目前唯一一位完成双满贯的羽毛球运动员。同时,林丹也帮助中国羽毛球队6度拿下汤姆斯杯冠军,5次捧起苏迪曼杯。其职业生涯共获得60多个国际大赛的男单冠军,如果加上团体赛的话,大大小小共获得80多个冠军头衔。

2008年北京奥运会,林丹在家门口战胜李宗伟拿到人生第一个奥运冠军;

2010年广州亚运会,林丹获得羽毛球男单冠军,实现全满贯;

2012年伦敦奥运会,林丹再次击败杨宗纬卫冕奥运会男单冠军;

2013年,林丹第五次获得羽毛球世锦赛男单冠军,连续三年在世界大赛的决赛中,击败杨宗纬卫冕冠军;

2016年,林丹在里约热内卢奥运会只获得了第4名,这也是他第四次征战奥运会;

2018年,林丹凭借汤姆斯杯获得第20个世界冠军;

粉丝都说了些什么

不用说,林丹绝对是我们90后这一代的记忆。我们就是喜欢林丹在赛场上拼搏的那股子坚韧的劲儿。现在林丹退役了,我们看看粉丝到底对他说了些什么?

粉丝对林丹说的话

上图主要有三层意思,下面我带大家好好缕一缕!

第一层意思主要还是致敬。词云图中更多的是粉丝对于林丹的道别,像后会有期致敬再见永远,林丹精神毕竟影响了一代人,那股子拼搏顽强的劲儿值得我们学习。相信大家还看到一个新词:爷青结,这个词我们在分析周杰伦新歌的时候出现过,不过那个是爷青回,这些都属于网络流行词。

第二层意思主要是说他和李宗伟的相爱相杀。词云图中也可以看到粉丝还是比较关心超级丹和李宗伟的。林丹和李宗伟可谓是亦敌亦友,2008和2012年的奥运会,李宗伟都是在决赛被林丹打败,只得到了亚军。好不容易到了2016年,林丹得到了第四名,李宗伟又不敌中国选手谌龙。李宗伟仿佛是一个坎儿,在世锦赛中李宗伟同样也是多次进入决赛,结果惊人的相似,都是失败!所以李宗伟一直被称作万年老二。但是不得不说,林丹有今天的成就,也离不开这样一位劲敌。

第三层意思主要是说林丹出轨。从词云图中也可以看出有像出轨妻子怀孕这样的词语,2016年11月17号,林丹被爆出在在老婆孕期出轨嫩模,并且曝出两人在酒店激吻的视频,爆料一出,瞬间引爆了网络。不得不说那次的事儿对林丹的声誉影响挺大的,但是就事论事,过去的事儿就当过去了,人非圣贤,孰能无过!这次林丹退役,我们更应该讲述林丹精神,发扬林丹精神,而不是一味的纠结过去。

总之不管怎么样,江湖虽远,精神长流,我们希望林丹未来能够过得更好,有缘江湖再见。

弹幕爬取说明

上图是我们专门爬取了B站上面的弹幕数据,最终制作的词云图,关于B站弹幕数据的爬取,大家可以参考http://suo.im/5HAUAg这篇文章的讲解。今天我们只是讲述:本视频在弹幕爬取弹幕上有哪些不同的地方。

今天的这个视频分为2集播放(以前的那个视频只有1集),说这个有什么用呢?因为每一集上的弹幕不同呀,我们既要获取第一页上面的弹幕数据,也要获取第2页弹幕上的数据。

打开谷歌开发者工具,根据图中操作我们找到关于页面新的url地址,可以发现这里存在两个cid,cid=208742119的代表第一页,cid=208842636的代表第二页,我们也可以看到这里的标题和上面显示的标题,是完全一致的。

得到这个cid后,我们利用B站弹幕数据的接口拼接上这个cid,就是我们最终得到的数据信息了。以前的文章我们已经介绍过了,B站的接口数据已经找不到了,但是我以前爬过,保留了这个网址,B站弹幕数据的接口url如下。

爬取B站弹幕数据的API:https://api.bilibili.com/x/v1/dm/list.so?oid=XXX

注意:上面网址的oid就是我们最开始获取到的cid。

感谢阅读

推荐阅读:

1真实的上海IT圈:张江男vs漕河泾男

2:真实的北京IT圈:后厂村姑 vs 后厂村花?

3:为什么你的提问没人解答?

4:Python爱好者社区历史文章合集



重磅!Python交流已成立


公众号运营至今,离不开小伙伴们的支持。
为了给小伙伴们提供一个互相交流的技术平台,特地开通了Python交流群。
群里有不少技术大神,不时会分享一些技术要点,更有一些资源收藏爱好者不时分享一些优质的学习资料。(免费,不卖课!)

需要进群的朋友,可长按扫描下方二维码。


▲长按扫码

本文章转载自公众号:python_shequ

首页 - Python 相关的更多文章: