Pandas Profiling
- это библиотека для генерации интерактивных отчетов на основе пользовательских данных: можем увидеть распределение данных, типы, возможные проблемы.
Библиотека очень проста в использовании: можем создать отчет и отправить его кому угодно!
# Colab включает старую версию pandas-profiling, поэтому необходимо обновиться:
#!pip3 install pandas-profiling==2.11
import numpy as np
import pandas as pd
from pandas_profiling import ProfileReport
df = pd.DataFrame(
np.random.rand(100, 5),
columns=['a', 'b', 'c', 'd', 'e']
)
profile = ProfileReport(df,
title='Pandas Profiling Report')
profile.to_widgets()
# или отобразить во фрейме блокнота:
#profile.to_notebook_iframe()
profile.to_file("report.html")
HTML-версия отчета доступна по ссылке
Авторы библиотеки приводят результаты анализа данных про Титаник.
При работе с большими данными можно включать минимальный режим конфигурирования (minimal=True
).
Разобраться во внутренностях можно через чтение исходных текстов.
Подписка на онлайн-обучение