python获取网站内容

速易达网络

已于 2024-09-27 22:53:10 修改

阅读量126

点赞数

CC 4.0 BY-SA版权

分类专栏： python与人工智能实训课程文章标签： python 开发语言

于 2024-09-27 22:52:52 首次发布

59 篇文章 ¥9.90 ¥99.00

订阅专栏

python获取网站内容
获取百度网站上文章和地图模块的内容可以使用soup.find查找对应的属性
import requests from bs4 import BeautifulSoup base_url = 'http://www.baidu.com' res = requests.get(base_url) # 发送GET请求 # 获取响应状态码 print("响应状态码：{}".format(res.status_code)) # 获取响应内容的编码方式 print("编码方式：{}".format(res.encoding)) # 更新响应内容的编码方式为utf-8 res.encoding = 'utf-8' soup = BeautifulSoup(res.text,'lxml') a_all = soup.find_all('a') print(a_all) a_attrs = soup.find('a',attrs={'href':'http://news.baidu.com'}) print(a_attrs.contents[0]) a_string = soup.find_all('a',string='地图') print(a_string)