Python爬取API接口内容保存

枫

2023-02-25 / 1 评论 / 156 阅读 / 耗时 126ms / 正在检测是否收录...

02/25

介绍

　　这个可以爬取API站点接口内容，能爬取视频、音频、图片并且保存到本地，自己写出来的
可以设置爬取页数，延时什么的。
下面代码都注释了，自己看看吧，不会的联系博主！?

ps：爬取的文件都是按数字顺序的
如果你中断爬取，再次爬取的时候会覆盖之前的文件
所以文件名是时间戳

如需按数字顺序保存，请去掉这个注释，添加这个注释即可
ON}PDDSMW25YF~M@ZK1B[VY.png

效果图

J$H~]ZDPWA{AG`3YG8~$JTS.png

Test

代码

import requests
import datetime
import time
import os

data_url =input('请输入你要爬取的API接口：')
#输入api接口站点
page =int(input('设置你要爬取的个数：'))
#输入你想要爬取的个数
type = input('请输入你爬取的媒体类型（jpg/png/gif/mp4/mp3）：')


#保存类型
print('爬取中，请稍后~')

headers ={
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36 Edg/110.0.1587.50'
#请求头
}


if not os.path.exists('D:/demo/'):
    os.mkdir(('D:/demo/'))
#定义文件名字
for t in range(page):
    url = data_url
    time.sleep(1)
    name = datetime.datetime.now().strftime("%Y-%m-%d-%H_%M_%S.%f")[:-3]
    # name = 1
    #时间延迟，可自己设置
    data = requests.get(url,headers=headers).text
    image =requests.get(url,headers=headers)


    print('第',t,'个下载成功！')
    #打印提示

    with open(f'D:/demo/{name}'+'.'+type,mode='wb')as f:
     f.write(image.content)
     # name +=1

版权属于：枫

本文链接： http://blog.521r.cn/705.html

文章转载：

作品采用：本文版权内容属于《枫》转载请标明出处

Python爬取API接口内容保存

介绍

效果图

代码

评论 (1)

枫

绿水本无忧，因风皱面

青山原不老，为雪白头