页面长啥样,爬取B站视频弹幕信息

2019-12-07 20:55 来源:未知

盛名网址的 404 页面长啥样?

2017/09/21 · HTML5 · 1 评论 · 404

初藳出处: Muzli   译文出处:众成翻译   

图片 1

图片 2图片 3google.com

.

图片 4

youtube.com

.

图片 5

facebook.com

.

图片 6

reddit.com

.

图片 7

muz.li

.

图片 8

.

图片 9

amazon.com

.

图片 10

vk.com

.

图片 11

linkedin.com

.

图片 12

imgur.com

.

图片 13

aliexpress.com

.

图片 14

bing.com

.

图片 15

图片 16图片 17tumblr.com

.

图片 18

.

图片 19

stackoverflow.com

.

图片 20

github.com

.

图片 21

dropbox.com

.

图片 22

craigslist.org

.

图片 23

dribbble.com

.

图片 24

awwwards.com

.

图片 25

csswinner.com

.

图片 26

producthunt.com

.

图片 27

coolhunting.com

.

图片 28

codyhouse.co

.

图片 29

mailchimp.com

.

图片 30

slack.com

.

图片 31

mashable.com

.

图片 32

bloomberg.com

.

图片 33

airbnb.com

.

图片 34

bitly.com

.

图片 35

virgin.com

1 赞 2 收藏 1 评论

图片 36

得到B站录制弹幕,相对来讲非常粗大略,须求运用的知识点有requests、re多少个库。requests用来获得网页音讯,re正则相配获得你须求的音信,当然还应该有其余的点子,例如Xpath。
跻身你所见到的摄像的页面,F12走入开辟者工具,选取网络。查找我们需求的音信,发掘域名那列有comment.bilibili.com 格式为xml ,文件名即为cid号。点击它后,在侧边的音信头中复制乞请网站,在浏览器中开发,就能够得到摄像全方位弹幕消息。

图片 37   图片 38

代码如下:

图片 39图片 40

 1 import requests
 2 import re
 3 def getHTML(av):
 4     url='https://comment.bilibili.com/'+av+'.xml'
 5     html=requests.get(url)
 6     comments=html.text
 7     res=r'>(.+?)</d>'
 8     rescom=re.compile(res)
 9     comment=re.findall(rescom,comments)
10     for row in comment:
11         print(row)
12 av=input("input your av:")
13 getHTML(av)

弹幕代码

运转代码,弹幕就全体打字与印刷到窗口中,此外关于获取切磋以致用商议内容制作词云可查看博客。

 

原创不易,尊重版权。转发请评释出处:http://www.cnblogs.com/xsmile/

TAG标签:
版权声明:本文由金沙澳门唯一官网发布于前端开发,转载请注明出处:页面长啥样,爬取B站视频弹幕信息