Python爬取API接口内容保存

Python爬取API接口内容保存

枫
2023-02-25 / 1 评论 / 127 阅读 / 耗时 155ms / 正在检测是否收录...

介绍

  这个可以爬取API站点接口内容,能爬取视频、音频、图片并且保存到本地,自己写出来的
可以设置爬取页数,延时什么的。
下面代码都注释了,自己看看吧,不会的联系博主!?

ps:爬取的文件都是按数字顺序的
如果你中断爬取,再次爬取的时候会覆盖之前的文件
所以文件名是时间戳

如需按数字顺序保存,请去掉这个注释,添加这个注释即可
ON}PDDSMW25YF~M@ZK1B[VY.png

效果图

J$H~]ZDPWA{AG`3YG8~$JTS.png

Test

代码

import requests
import datetime
import time
import os

data_url =input('请输入你要爬取的API接口:')
#输入api接口站点
page =int(input('设置你要爬取的个数:'))
#输入你想要爬取的个数
type = input('请输入你爬取的媒体类型(jpg/png/gif/mp4/mp3):')


#保存类型
print('爬取中,请稍后~')

headers ={
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36 Edg/110.0.1587.50'
#请求头
}


if not os.path.exists('D:/demo/'):
    os.mkdir(('D:/demo/'))
#定义文件名字
for t in range(page):
    url = data_url
    time.sleep(1)
    name = datetime.datetime.now().strftime("%Y-%m-%d-%H_%M_%S.%f")[:-3]
    # name = 1
    #时间延迟,可自己设置
    data = requests.get(url,headers=headers).text
    image =requests.get(url,headers=headers)


    print('第',t,'个下载成功!')
    #打印提示

    with open(f'D:/demo/{name}'+'.'+type,mode='wb')as f:
     f.write(image.content)
     # name +=1

5

海报

正在生成.....

评论 (1)

取消
  1. 头像
    Python爬取API接口内容保存 - 小沐”blog
    XX ·Linux · Google Chrome
    美国 美国 沙发

    [...]原文: http://blog.521r.cn/705.html 在此基础上修改,加了一个人文字类型 0赞 网络教程Python 发布作者: 小沐 百度收录: 正在检测是否收录... 本文链接: https://blog.mxob.cc/archives/48/ 作品采用: 《 署名-非商业性使用-相同方式共享[...]

    Other System   Other Browser  回复 删除 垃圾