python爬虫下载文件-【Py大法系列--03】Python如何自动下载文件

本文介绍了当Python遇到需要登录的下载链接时,如何通过获取并携带Cookie来实现文件的自动下载。首先,展示了利用urllib、urllib2和requests库的下载方法,然后讨论了在遇到Earthdata Login登录墙的情况下,手动登录获取Cookie,再通过headers或直接在requests中传递Cookie成功下载文件的两种方式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

问题描述

Python自动下载文件,通用文件,包括但不限于压缩文件、图片等。

解决方法

一般情况下,Python下载文件的方式有以下几种:

利用urllib、urllib2,即Python爬虫用的最多的库;

import urllib

import urllib2

import requests

url = "你的下载链接"

urllib.urlretrieve(url, demo.zip)

urllib.urlretrieve(url, demo.zip)这个函数还可以接受另外一个参数,比如这样用:

urllib.urlretrieve(url,local,Schedule),其中Schedule为:

def Schedule(a,b,c):

'''''

a:已经下载的数据块

b:数据块的大小

c:远程文件的大小

'''

per = 100.0 * a * b / c

if per > 100 :

per = 100

print '%.2f%%' % per

这样程序可以即时打印出下载的进度。

利用urllib2.urlopen(url);

import urllib2

print downloading with urllib2

url = "您的链接"

f = urllib2.urlopen(url)

data = f.read()

with open ("demo2.zip", "wb" ) as code:

code.write(data)

利用requests,划重点,我女神推荐的!

import requests

url = "您的链接"

r = requests.get(url)

with

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值