爬取视频的时候发现,现在的视频都是经过加密(m3u8),不再是mp4或者avi链接直接在网页显示,都是经过加密形成ts文件分段进行播放。
今天就教大家如果通过python爬取下载m3u8加密视频。
http://www.caisetv.com/
http://www.caisetv.com/dongzuopian/chaidanzhuanjia/0-1.html
在视频播放的页面,通过F12可以查看网络数据包
https://xigua-cdn.haima-zuida.com/20210219/19948_fcbc225a/1000k/hls/index.m3u8
这里的ts就电影的加密分段视频
https://xigua-cdn.haima-zuida.com/20210219/19948_fcbc225a/1000k/hls/
上面的m3u8链接掉index.m3u8后,在拼上075a34cccdd000000.ts等ts名称就是分段视频的链接
如下所示:
https://xigua-cdn.haima-zuida.com/20210219/19948_fcbc225a/1000k/hls/075a34cccdd000000.ts
通过浏览器把这个分段视频下载后打开:
所以只要把所有的ts下载并合并就是完整的电影视频!!!
刚刚已经把ts的所有名称下载下来了
接下来通过python代码去读取这个文件,提取出名称,拼接链接后下载保存到一个文件夹里!
headers={'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; Win64; x64; rv:84.0) Gecko/20100101 Firefox/84.0',}
###下载ts文件
def download(url,name):
r=requests.get(url, headers=headers)
with open(name+"", "wb") as code:
code.write(r.content)
with open("index.m3u8","r") as f:
ts_list=f.readlines()
#去掉前面没用的信息
ts_list=ts_list[5:]
urlheader="https://xigua-cdn.haima-zuida.com/20210219/19948_fcbc225a/1000k/hls/"
count=0
for i in ts_list:
if "#" not in i:
i=i.replace("\n","")
download(urlheader+""+i,"cdzj2/"+str(count)+".ts")
count=count+1
print(count)
这样就可以把ts文件全部下载下来,但是一个一个下载很慢,下面通过多线程下载,提升下载速度!!!
for i in ts_list:
if "#" not in i:
i=i.replace("\n","")
n=i[-7:]
threading.Thread(target=download, args=(urlheader+""+i,"cdzj2/"+str(n),)).start()
#download(urlheader+""+i,"cdzj2/"+str(count)+".ts")
通过多线程很快就可以将这些ts文件下载到本地!!!
copy /b *.ts new.mp4
通过这个命令(cmd终端中运行),在含有ts文件的文件夹中就可以将ts文件合并(按名称顺序进行排列合并),并保存成new.mp4
1.分析m3u8加密文件
2.python下载ts文件
3.cmd合并ts保存成mp4格式
私信小编01即可获取Python学习资料
(https://jx.618g.com/?url=)
import requests
url='https://jx.618g.com/?url=https://v.qq.com/x/cover/mzc00200lpxf8uq.html'
res=requests.get(url).text
print(res)
ffmpeg -i 'https://youku.cdn7-okzy.com/20191107/15684_c052aa3a/index.m3u8'-vcodec copy -acodec copy ship.mp4
requests的安装:ctrl+R—>输入cmd—.>pip install requests
ffmpeg的安装:ctrl+R—>输入cmd—.>pip install ffmpeg
如果出现拒绝访问则用管理员模式运行CMD。加载超市time read out 则采用换源安装,我的下一篇文章会有介绍换源安装,或者在pycharm的终端terminal下载,不过一般不会出现那么多问题,有问题想解决留言找我啊
You-Get 是一个命令行工具, 用来下载各大视频网站的视频, 是我目前知道的命令行下载工具中最好的一个, 之前使用过 youtube-dl, 但是 youtube-dl 吧, 下载好的视频是分段的, 然后程序还不自动帮你合并, 后来遇到了 You-Get , 可以自动合并, 最重要的是可以下载爱奇艺的视频, 这是我唯一知道的可以下载爱奇艺视频的工具. GitHub 主页 : https://github.com/soimort/you-get
装方法:
先安装 Python3, 自行去 Python 官网下载去
安装好 Python3 后, 在命令行中输入pip3 install you-get
, 如果你只安装了一个版本的 Python, 命令应该是pip install you-get
升级方法:
pip3 install --upgrade you-get
, 同上, 只装了 Python3 的应为pip install --upgrade you-get
使用方法:
在命令行中切换到需要保存视频的目录
输入you-get 视频地址
, 例如you-get http://www.iqiyi.com/v_19rrktylpk.html
, 过一会就下载好了, 速度很快的.
注意事项:
终止下载可以使用快捷键ctrl + C
, 继续下载可以再次执行you-get 刚才暂停的视频地
You-Get的一些其他用法
You-Get仅用来下载视频显得有些大材小用了,作者也给出了You-Get的一些其他用法,这里着重介绍几个。
1.选择视频下载格式和清晰度
通常网页视频的格式为.flv,但部分网站会提供好几种视频格式,我们可以使用You-Get下载这些视频。
e.g.下载一段优酷视频
1.查看当前视频的清晰度和格式
you-get -i http://v.youku.com/v_show/id_XMTQ2NzQyMjY1Ng.html
2.选择需要下载的清晰度及格式
you-get --format=hd2 http://v.youku.com/v_show/id_XMTQ2NzQyMjY1Ng.html
关注小编获得更多python的玩法,评论获取跳一跳辅助。
*请认真填写需求信息,我们会在24小时内与您取得联系。