python爬虫下载文件-【Py大法系列--03】Python如何自动下载文件

weixin_37988176

于 2020-11-01 12:55:09 发布

阅读量1.2k

点赞数 1

本文介绍了当Python遇到需要登录的下载链接时，如何通过获取并携带Cookie来实现文件的自动下载。首先，展示了利用urllib、urllib2和requests库的下载方法，然后讨论了在遇到Earthdata Login登录墙的情况下，手动登录获取Cookie，再通过headers或直接在requests中传递Cookie成功下载文件的两种方式。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

问题描述

Python自动下载文件，通用文件，包括但不限于压缩文件、图片等。

解决方法

一般情况下，Python下载文件的方式有以下几种：

利用urllib、urllib2，即Python爬虫用的最多的库；

import urllib

import urllib2

import requests

url = "你的下载链接"

urllib.urlretrieve(url, demo.zip)

urllib.urlretrieve(url, demo.zip)这个函数还可以接受另外一个参数，比如这样用：

urllib.urlretrieve(url,local,Schedule)，其中Schedule为：

def Schedule(a,b,c):

'''''

a:已经下载的数据块

b:数据块的大小

c:远程文件的大小

'''

per = 100.0 * a * b / c

if per > 100 :

per = 100

print '%.2f%%' % per

这样程序可以即时打印出下载的进度。

利用urllib2.urlopen(url);

import urllib2

print downloading with urllib2

url = "您的链接"

f = urllib2.urlopen(url)

data = f.read()

with open ("demo2.zip", "wb" ) as code:

code.write(data)

利用requests，划重点，我女神推荐的！

import requests

url = "您的链接"

r = requests.get(url)

with

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。