今天要介绍两个一行代码就可以生成数据分析报告的库,分别是sweetviz和pandas_profiling。
首先我们从码云上下载测试数据:
import pandas as pd
import numpy as np
titanic = pd.read_csv("https://gitee.com/hyesc/machine-learning-stu/raw/master/titanic.csv")
titanic.head()
sweetviz
参考:https://github.com/fbdesignpro/sweetviz
sweetviz需要使用pip进行安装:
pip install sweetviz
然后就可以进行分析了:
import sweetviz as sv
my_report = sv.analyze(titanic)
my_report.show_html()
几秒钟后便会自动打开相应的网页:
pandas_profiling
参考:https://github.com/pandas-profiling/pandas-profiling
安装:
pip install pandas-profiling
使用:
import pandas_profiling
pfr = pandas_profiling.ProfileReport(titanic)
pfr.to_file('report.html')
等待10秒左右可以看到结果:
需要手动打开页面:
在jupyter环境中直接访问pfr,会直接在notebook输出中显示网页。