【python】本地加载加利福尼亚住房数据集

Z_W_H_

于 2025-07-09 09:16:22 发布

阅读量108

点赞数 2

CC 4.0 BY-SA版权

分类专栏： python 文章标签： python 开发语言

本文链接：https://blog.csdn.net/qq_39397927/article/details/149215958

python 专栏收录该内容

102 篇文章

订阅专栏

import pandas as pd
# 定义特征名称
# ['经度'， '纬度'， '住房年龄中位数'， '房间总数'， '卧室总数'， '人口'， '住户'， '收入中位数'， '房屋价值中位数']
column_names = ['longitude', 'latitude', 'housingMedianAge', 'totalRooms', 'totalBedrooms', 'population', 'households', 'medianIncome', 'medianHouseValue']
# 读取数据文件
data_path = r"E:\地理探测器\SHAP\CaliforniaHousing\cal_housing.data"  # 根据实际情况修改路径
data = pd.read_csv(data_path, sep=',', header=None, names=column_names)
# 分离特征矩阵X和目标向量Y
X = data.drop('medianHouseValue', axis=1)
y = data['medianHouseValue']