python爬虫案例——5行代码爬取音乐资源

原创已于 2024-07-12 15:09:43 修改 · 4.3k 阅读

33 ·

CC 4.0 BY-SA版权

文章标签：

#python #开发语言 #爬虫 #音频 #测试用例 #网络爬虫 #pycharm

于 2024-07-12 12:11:25 首次发布

python爬虫专栏收录该内容

1 篇文章

订阅专栏

声明：本文章仅用于网络爬虫教学，请遵守Robots.txt爬虫协议，严禁用于非法途径。若读者因此作出任何危害网络（互联网）的行为，后果自负，与博主无关！

都2024年了，不会还有人在花钱用VIP下载音乐吧~

每天一个小妙招，教你5行代码轻松白嫖资源

小白须知

电脑需配备python解释器、安装一款编程软件，例如Visual Studio Code、pycharm等

Visual Studio Code官网：https://code.visualstudio.com/

pycharm社区版：https://www.jetbrains.com.cn/pycharm/

以下介绍以pycharm展开

案例：从酷狗爬取歌曲《天下》

一、获取音频URL地址

1、酷狗音乐搜索歌曲天下

入口：https://www.kugou.com/mixsong/4fql9xab.html?fromsearch=%E5%A4%A9%E4%B8%8B

2、检查网页，获取信息

进入该页面点击F12或鼠标右键进入网页检查页面，点击下方菜单栏中的network（网络），再点击media（音频），刷新页面，即出现目标音频资源，点击该音频即会出现音频URL地址。如下图

复制该音频URL地址，可在浏览器呈现

《天下》https://webfs.hw.kugou.com/202407121044/a9c6ce922ebb74e7c7ea6286efa11cd7/v2/17b11c65674378ca43995537331e1d9c/part/0/960119/G226/M08/12/13/clip_gocBAF8YSxaAZb1jADYY7e5XcDo154.mp3

二、进入pycharm，编写程序

1、创建项目，新建python文件

2、导入爬取音频所需的请求资源包

或者使用终端命令行创建 pip instll requests

3、编写程序

# pip install requests
import requests

#音乐URL地址
music_url="https://webfs.hw.kugou.com/202407121044/a9c6ce922ebb74e7c7ea6286efa11cd7/v2/17b11c65674378ca43995537331e1d9c/part/0/960119/G226/M08/12/13/clip_gocBAF8YSxaAZb1jADYY7e5XcDo154.mp3"

#伪装成浏览器用户访问爬取
#请查看下方注意
headers={
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML,         
    like Gecko) Chrome/109.0.0.0 Safari/537.36 SLBrowser/9.0.3.5211 SLBChan/105'
}

# 发送请求到服务器，获取音乐资源
m_resp = requests.get(music_url, headers=headers)

#服务器响应后返回数据进行保存
with open('music.mp3', 'wb') as f:
    f.write(m_resp.content)

注意：headers中的用户代理user-agent是浏览器所提供的，在上述讲的F12页面检查中，获取音频url最下面，复制粘贴过去即可。music.mp3为自定义的音频文件名。