Airbnb北京地区探索数据分析(1)

Airbnb北京地区探索数据分析(1)

背景

本次主要对Airbnb在北京地区2020年10月的部分数据,由于数据内容较少,本次仅进行的数据探索,点击可下载数据
数据共计16列2万7千余条。其中字段包括房源ID,房源姓名,房主ID,房主姓名,社区组,区域,纬度,经度,房间类型,价格,最低入住时常,最近一条评论,月评论占比,可出租房数量,可出租天数。

数据清洗

导入常用库

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from matplotlib.font_manager import FontProperties
from pylab import *
plt.rcParams['font.family']=['Heiti TC']
font = FontProperties(fname = '/System/Library/Fonts/STHeiti\ Medium.ttc')
%matplotlib inline
# 设置数据路径
path = '/Users/valkyrja/Documents/dataanalysis/taobao/aibiying.csv'
data_1 = pd.read_csv(path)
data_1.info()

经过查看社区组全部为空,考虑进行删除。
id, host_id类型转化为字符串。
last_reviews 转换为时间类型

在这里插入图片描述

data_1.isnull().sum()
# 存在缺失值,房主姓名和社区组的列进行删除操作

在这里插入图片描述

#  进行删除列
data_1.drop('host_name', axis = 1, inplace = True)
data_1.drop(<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值