可视化图形的选择
线型图(line)
线型图可以用来表示具有相关性的两个变量的关系,表示一个变量随另一个变量(比如:时间)变化的情况。
注:Pandas 中的 Series 和 Dataframe 都是默认生成的这种图形(使用plot函数)。
柱状图(bar)
柱状图/条形图适合用于少数类别(<10)的分类数据的可视化,用来反映不同类别数据之间的差异。
直方图(histogram)
直方图可以展现数据点的分布情况,是一种可以对值频率进行离散化显示的柱状图。
与此相关的一种图表类型是密度图,它是通过计算“可能会产生观测数据的连续概率分布的估计”而产生的。密度图也被称为 KDE(Kernel Density Estimate,核密度估计)图。
注:直方图和柱状图的区别
- 柱状图用于分类数据变量,一般条形呈分开排列;直方图用于数值变量,通常是连续排列(直方图的X轴代表将定量变量的数据划分为若干等宽度的区间)
- 条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频