Airbnb北京地区探索数据分析（1）

最新推荐文章于 2022-12-11 13:57:49 发布

valkyrja110

最新推荐文章于 2022-12-11 13:57:49 发布

阅读量891

点赞数 1

CC 4.0 BY-SA版权

分类专栏： pandas 文章标签： python 数据分析

本文链接：https://blog.csdn.net/valkyrja110/article/details/109665010

Airbnb北京地区探索数据分析（1）

背景
数据清洗
数据探索
总结

背景

本次主要对Airbnb在北京地区2020年10月的部分数据，由于数据内容较少，本次仅进行的数据探索，点击可下载数据。
数据共计16列，2万7千余条。其中字段包括房源ID，房源姓名，房主ID，房主姓名，社区组，区域，纬度，经度，房间类型，价格，最低入住时常，最近一条评论，月评论占比，可出租房数量，可出租天数。

数据清洗

导入常用库

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from matplotlib.font_manager import FontProperties
from pylab import *
plt.rcParams['font.family']=['Heiti TC']
font = FontProperties(fname = '/System/Library/Fonts/STHeiti\ Medium.ttc')
%matplotlib inline

# 设置数据路径
path = '/Users/valkyrja/Documents/dataanalysis/taobao/aibiying.csv'
data_1 = pd.read_csv(path)
data_1.info()

经过查看社区组全部为空，考虑进行删除。
id, host_id类型转化为字符串。
last_reviews 转换为时间类型

在这里插入图片描述

data_1.isnull().sum()
# 存在缺失值，房主姓名和社区组的列进行删除操作

在这里插入图片描述

#  进行删除列
data_1.drop('host_name', axis = 1, inplace = True)
data_1.drop(<

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

valkyrja110

关注关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【项目实战】Airbnb爱彼迎-数据分析与建模

风口IT猪的成长录

11-19

3463

Airbnb数据分析与建模Calendar数据集分析对price价格数据进行处理处理时间序列可视化分析listings数据集分析对价格数据进行预处理处理价格缺失值新增字段获取详细数据数据可视化Reviews数据集分析预测房间价格评论数量的预测 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns from pylab import mpl # 设置显示中文字体 mpl.rcPa

数据分析airbnb案例

Reedw1023的博客

03-15

1223

Task:预测NYC的房屋价格 airbnb['price'].describe 对price字段的理解： min为0，是真实数据抑或错误数据 max为10000，是真实数据抑或错误数据中位数比平均值要小用describe函数观察所有字段并对字段具体表示内容进行了解先粗略分析price与哪个字段相关：猜测：neighbourhood,room_type,minin...

参与评论您还未登录，请先登录后发表或查看评论

Airbnb 北京地区数据可视化——用户篇

HM的个人项目记录

05-08

1953

1 项目摘要 Airbnb成立于2008年8月，是一个旅行房屋租赁社区，用户可发布、搜索度假房屋租赁信息并完成在线预定。2015年，Airbnb正式进入中国市场，在国内掀起了一波城市民宿的热潮。本项目基于Airbnb公开数据集，从用户角度出发，对Airbnb在北京地区的运营数据进行可视化处理，制作数据面板以探索北京地区的房源分布、价格趋势以及用户评价。 2 分析思路需求理解——发掘用户关注点假...

airbnb北京民宿运营情况分析

kasiko的博客

07-11

2651

airbnb运营状况分析airbnb北京民宿运营状况分析导入数据step1查看数据结构，处理缺失值#查看各个数据结构step2 统计民宿分布情况step3 去除离群值，做相关性分析step4 查看价格分布情况step5 找出运营状况良好的民宿并分析原因词云分析运营状况最好的民宿分布图一个简单的svm分类器，预测房屋的运营状况, 标签列：good为1， worse为0总结 airbnb北京民宿运营状况分析导入数据 import numpy as np import matplotlib.pyplot as

北京短租2021年Airbnb数据分析(探索性数据分析+简单建模尝试)

qq_29114159的博客

12-11

1611

北京短租Airbnb2021年数据分析(探索性数据分析+简单建模尝试)

airbnb:Airbnb 爬虫

07-16

== 自述文件 airbnb 刮板 - 仅示例

北京短租数据集.zip

07-30

包含了汇总和明细双版本数据，可大致分析也可深入挖掘。具体数据情况如下： listings为短租房源信息，包括房源、房东、位置、价格、评论数量、可租时间等。明细版中包含更多房源信息细节。 calendar为短租房源时间信息，包括房源、时间、可租状态、租金、可租天数等。 reviews为评论信息，汇总版包括房源、评论日期、可用时间序列和数据可视化分析。明细版还包括评论内容和作者信息。 neighbourhood为北京行政区划数据。数据来源：Airbnb公开信息，不包含涉及个人隐私的数据。

短租数据分析--Airbnb短租数据集-数据集

03-27

标题 "短租数据分析--Airbnb短租数据集-数据集" 涉及的是对Airbnb平台上的短租房源进行分析的数据集。这个数据集包含了关于房源、房东以及评价等多方面的信息，是进行大数据分析、市场研究或者机器学习模型构建的...

阿里天池：Airbnb短租房数据集分析

热门推荐

lam_yx的博客

08-07

1万+

共享，通过让渡闲置资源的使用权，在有限增加边际成本的前提下，提高了资源利用效率。随着信息的透明化，越来越多的共享发生在陌生人之间。短租，共享空间的一种模式，不论是否体验过入住陌生人的家中，你都可以从短租的数据里挖掘有趣的信息。基于Airbnb 2019 年 4 月 17 日公开的北京地区数据，进行行政区划和短租房类型的维度拆分，对短租房供给、需求等进行探索性分析。

Airbnb 新用户的民宿预定预测-数据集

07-09

Airbnb 新用户的民宿预定预测 kaggle比赛完整数据集主要包含5个csv文件

Airbnb短租房源数据分析

u013788252的博客

04-09

5350

文章目录1 数据集背景2 分析思路3 短租房价格分析4 短租房地理位置分布分析5 房屋类型分析6 结论 1 数据集背景本数据集来自 Airbnb 于 2019 年 4 月 17 日公开的北京地区数据（总共包含了28449家短租房的信息）。数据均来源于 Airbnb 网站的公开信息，不包含任何个人隐私数据。该数据集包含listings，calendar，reviews等数据集，本次主要分析lis...

数据分析项目实战——Airbnb数据分析

potterwand的博客

10-12

6876

数据源：https://www.kaggle.com/dgomonov/new-york-city-airbnb-open-data/code 导入模块并读取数据： import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns calendar = read_csv("./data/calendar.csv") calendar.head() ...

【用pyecharts做地理图】（airbnb租房数据分析）（天池竞赛）

weixin_42225122的博客

04-08

1782

项目介绍项目来源：天池大数据平台项目思路：针对airbnb中listings表做数据处理，探索分析以及针对经纬度以及价格做地理价格图（pyecharts） python：3.7.1 pyecharts：1.2.0 模块导入 #数据处理包导入 import pandas as pd import numpy as np from scipy import stats #画图包导入 import...

Airbnb产品运营分析报告

好玩的大数据的博客

10-15

3061

目前Airbnb作为一款社区平台类产品，其业务遍布了191个国家，并且经常出现在商业分析的优秀案例中。Airbnb在做好了产品体验、房源美感、民宿共享服务之后，这款产品和背后的业务是否存在可以改进的地方？我们用用户画像，推广渠道，转化漏斗三个方面来分析 •数据集名称：Airbnb顾客预订数据•数据集来源：https://www.kaggle.com/c/airbnb...

Airbnb数据分析（数据来源：kaggle）

weixin_73499598的博客

09-25

2939

对Airbnb进行数据分析，数据来源kaggle

短租listing数据分析(探索性数据分析+简单建模尝试)

微信公众号（年更选手）：数据闲逛人 | Github开源项目：数分/数挖study路线 https://github.com/jc-dian/python_data_analysis

11-06

223

Xmind文件下载链接：https://pan.baidu.com/s/1jDgGsL2Zp1Cv8ZOlslJyZg 提取码：oyqf

Airbnb短租房源数据可视化

Evonnehyf的博客

03-29

4994

前言数据集链接：https://tianchi.aliyun.com/competition/entrance/231715/information 以下主要分成三个部分： Part one:数据集简明介绍 Part two:数据预处理 Part three:数据可视化分析 Part one：数据集介绍 1.1 活动背景共享，通过让渡闲置资源的使用权，在有限增加边际成本的前提下，提...

数据挖掘项目之Airbnb 新用户的民宿预定结果预测

weixin_40547993的博客

05-11

3013

摘要本文主要根据对Airbnb 新用户的民宿预定结果进行预测，完整的陈述了从数据探索到特征工程到构建模型的整个过程。其中： 1.数据探索部分主要基于pandas库，利用常见的:head()，value_counts()，describe()，isnull()，unique()等函数以及通过matplotlib作图对数据进行理解和探索； 2. 特征工程部分主要是通过从日期中提取年...