登陆

3天2100万!周杰伦的说好不哭,20万点评Python来剖析

admin 2019-11-01 222人围观 ,发现0个评论

原创: 菜3天2100万!周杰伦的说好不哭,20万点评Python来剖析鸟小编 菜鸟学Python



最近今日,小编被周杰伦的新歌刷屏了,朋友圈纷繁晒出周杰伦的新歌,即使不是周杰伦的歌迷,可是提起他的新歌,想必咱们应该都会知道,那便是《说好不哭》。不得不说,周董的号召力仍是很强的。看到这首歌如此的遭到咱们的重视,小编不由得想要对其剖析一下,看一下咱们关于这首歌的点评终究怎么。

1爬取QQ音乐点评

这次小编找的是QQ音乐的谈论,看这周董的英俊的封面,音乐文人名不虚传,短短3天现已卖了700万张,看一下谈论数有21W的点评数,这人气太旺了!

已然有20万的点评,这个数据量仍是很大的。二话不说,用Python敏捷爬取。如下图所示,咱们能够依照下图箭头所指的方位,找到咱们的谈论。



经过查验发现,当恳求的时分,需求咱们不断改动的是pagenum和lastcommentid这两个参数。谈论爬取的部分程序如下图所示。


这儿,经过不断的更新页面数值,并依据爬取的commentid数值来更新lastcommentid的数值,便能够连绵不断的爬取到咱们的谈论,这儿,小编爬取了咱们的谈论和谈论时刻,昵称以及commentid四个参数,爬取了20万+条谈论,如下图所示。



得到数据之后,接下来是关于数据的处理咱们首要来看一下,谈论数现在十名的谈论有哪一些,如下图所示,很简单的一句程序,便能够得到咱们需求的成果。


在所爬取的数据中,点赞第3天2100万!周杰伦的说好不哭,20万点评Python来剖析一名有14100+的点赞数量,他的谈论是这样的:



点评很专业,很走心,一看便是铁粉干的,而且仍是很有层次很懂音乐的funs。

2看一下点评的数据

下面咱们看一下,咱们的谈论数目跟着时刻的改变状况,如下图所示。

如上图所示,歌曲是16号23点正式上线与咱们碰头,马上引起了咱们的点评,能够看见,在歌曲出来的短短一两个3天2100万!周杰伦的说好不哭,20万点评Python来剖析小时内,谈论数目激增,然后跟着天黑咱们睡去,谈论数目略有下降。而第二天的谈论数目虽有小起伏的提高,到新八唧那时提高的起伏并不是很大。

这部分的程序如下图所示:



程序使用的是seaborn库,程序将柱状图与折线图结合起来,愈加立体的为咱们呈现出谈论数目与时刻的联系。

3词云看20W的点评

最终为咱们展现的是咱们谈论的词云制造,看看咱们对该首歌的形象。

首要,需求对咱们的谈论进行预处理,因为爬取到的成果中包括很多的字符,这些字符需求去除3天2100万!周杰伦的说好不哭,20万点评Python来剖析。程序如下图所示。


上述程序中,咱们匹配中文字符和中文标点符号,然后写入指定的文件内,最终使用wordcloud库来制造词云即可:




看一下咱们都说了点啥



由上图能够看出,咱们关于周董的新歌是十分喜爱的,而且都十分的高兴,因为信的参加,导致咱们在谈论的时分会参加五月天的元素。

以上便是本次小编带来的关于周董新歌的剖析,小编也预备去买个vip听一下,好好的赏识周董的新歌曲啦。

最终,我自己是一名从事了多年开发的Python老程序员,辞去职务现在在做自己的Python私家定制课程,今年年初我花了一个月整理了一份最适合2019年学习的Python学习干货,能够送给每一位喜爱Python的小伙伴,想要获取的能够重视我的头条号并在后台私信我:01,即可免费获取。

请关注微信公众号
微信二维码
不容错过
Powered By Z-BlogPHP