- python获取网站内容
- 获取百度网站上文章和地图模块的内容可以使用soup.find查找对应的属性
import requests
from bs4 import BeautifulSoup
base_url = 'http://www.baidu.com'
res = requests.get(base_url) # 发送GET请求
# 获取响应状态码
print("响应状态码:{}".format(res.status_code))
# 获取响应内容的编码方式
print("编码方式:{}".format(res.encoding))
# 更新响应内容的编码方式为utf-8
res.encoding = 'utf-8'
soup = BeautifulSoup(res.text,'lxml')
a_all = soup.find_all('a')
print(a_all)
a_attrs = soup.find('a',attrs={'href':'http://news.baidu.com'})
print(a_attrs.contents[0])
a_string = soup.find_all('a',string='地图')
print(a_string)
python获取网站内容
于 2024-09-27 22:52:52 首次发布