我有一个具有大量特征的数据集,因此分析相关矩阵变得非常困难。我想绘制一个相关矩阵,我们使用pandas库中的dataframe.corr()函数得到它。熊猫图书馆是否提供任何内置函数来绘制该矩阵
您可以使用matplotlib中的pyplot.matshow():
将matplotlib.pyplot导入为plt
plt.matshow(dataframe.corr())
plt.show()
编辑:
在评论中,有一个关于如何更改轴刻度标签的请求。这是一个豪华版,绘制在更大的图形尺寸上,具有轴标签以匹配数据帧,以及颜色条图例以解释颜色比例
我包括了如何调整标签的大小和旋转,我使用了一个图形比率,使颜色条和主图形显示出相同的高度
编辑2:
由于df.corr()方法忽略非数字列,因此在定义x和y标签时,应使用.select_dtypes(['number')),以避免标签发生不必要的移动(包含在下面的代码中)
f=plt.图(figsize=(19,15))
plt.matshow(df.corr(),fignum=f.number)
plt.xticks(范围(df.select_数据类型(['number'])).shape[1]),df.select_数据类型(['number'])。列,fontsize=14,旋转=45)
plt.yticks(范围(df.select_数据类型(['number'])).shape[1]),df.select_数据类型(['number'])。列,fontsize=14)
cb=plt.colorbar()
cb.ax.tick_参数(labelsize=14)
plt.title('相关矩阵',fontsize=16);