<video class="mudu-video" preload="auto" x5-video-player-type="h5-page" webkit-playsinline="true" playsinline="" x-webkit-airplay="allow" mtt-playsinline="true" loop="false" src="blob:https://mudu.tv/8e5f4ff4-b78b-486f-9647-5b0d9225122a" poster="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAAAABCAYAAAAfFcSJAAAAC0lEQVQYV2NgAAIAAAUAAarVyFEAAAAASUVORK5CYII=" style="object-fit: contain;"></video>
https://mudu.tv/watch/6818092
html5中blob对象在赋给video标签后生成的一串标记,blob对象对象包含的数据,浏览器内部会解析。相当于指引你找到各个分片文件的目录,然通过这个文件,浏览器可以不断的请求到下一个切片文件。
Blob对象隐藏真实的资源路径,在一定程度上可以起到数据的加密性,更多的是为了干扰爬虫。
比如日常使用的一些音频,视频,图片,我们都可以使用其 Blob 二进制数据流来表征数据,而非使用uri,就像经常用到的 image src 的 dataUrl。
所以重要是要获取到m3u8文件,然后爬取其各个ts分片文件,通过ffmpeg进行合并。
可以通过M3u8 Downloader或者浏览器插件Adobe HDS / HLS Video Saver工具进行处理
晚点发布可直接爬取的代码(对加密的无效)
文章评论