介绍
这个可以爬取API站点接口内容,能爬取视频、音频、图片并且保存到本地,自己写出来的
可以设置爬取页数,延时什么的。
下面代码都注释了,自己看看吧,不会的联系博主!?
ps:爬取的文件都是按数字顺序的
如果你中断爬取,再次爬取的时候会覆盖之前的文件
所以文件名是时间戳
如需按数字顺序保存,请去掉这个注释,添加这个注释即可
效果图
代码
import requests
import datetime
import time
import os
data_url =input('请输入你要爬取的API接口:')
#输入api接口站点
page =int(input('设置你要爬取的个数:'))
#输入你想要爬取的个数
type = input('请输入你爬取的媒体类型(jpg/png/gif/mp4/mp3):')
#保存类型
print('爬取中,请稍后~')
headers ={
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36 Edg/110.0.1587.50'
#请求头
}
if not os.path.exists('D:/demo/'):
os.mkdir(('D:/demo/'))
#定义文件名字
for t in range(page):
url = data_url
time.sleep(1)
name = datetime.datetime.now().strftime("%Y-%m-%d-%H_%M_%S.%f")[:-3]
# name = 1
#时间延迟,可自己设置
data = requests.get(url,headers=headers).text
image =requests.get(url,headers=headers)
print('第',t,'个下载成功!')
#打印提示
with open(f'D:/demo/{name}'+'.'+type,mode='wb')as f:
f.write(image.content)
# name +=1
[...]原文: http://blog.521r.cn/705.html 在此基础上修改,加了一个人文字类型 0赞 网络教程Python 发布作者: 小沐 百度收录: 正在检测是否收录... 本文链接: https://blog.mxob.cc/archives/48/ 作品采用: 《 署名-非商业性使用-相同方式共享[...]