Анализ данных на языке Python

Введение в pandas на русском языке


Этапы анализа данных на языке Python:

telegram Посмотреть [все видеоуроки Python для анализа данных]
01. Какие данные обрабатывает pandas? [HTML] [CoLab]
02. Как мне читать и записывать табличные данные? [HTML] [CoLab]
03. Как выбрать подмножество из DataFrame? [HTML] [CoLab]
04. Как строить график в pandas? [HTML] [CoLab]
05. Как создать новые столбцы? [HTML] [CoLab]
06. Как рассчитать сводную статистику? [HTML] [CoLab]
07. Как изменить раскладку таблиц? [HTML] [CoLab]
08. Как объединить данные из нескольких таблиц? [HTML] [CoLab]
09. Как легко обрабатывать данные временных рядов? [HTML] [CoLab]
10. Как манипулировать текстовыми данными? [HTML] [CoLab]

Уроки по работе с pandas на русском языке


Pandas за 10 минут [HTML] [CoLab] [original doc]
Типичные задачи Excel, продемонстрированные в pandas (часть 1) [HTML] [CoLab] [original]
Типичные задачи Excel, продемонстрированные в pandas (часть 2) [HTML] [CoLab] [original]
Советы по выбору столбцов в DataFrame с помощью iloc и filter [HTML] [CoLab] [original]
Обзор типов данных pandas [HTML] [CoLab] [original]
Использование типа данных категории в pandas [HTML] [CoLab] [original]
Руководство по кодированию категориальных значений в Python [HTML] [CoLab] [original]
Очистка данных о валюте с помощью pandas [HTML] [CoLab] [original]
Эффективная очистка текста с помощью pandas [HTML] [CoLab] [original]
Excel процедуры Filter и Edit, продемонстрированные в pandas [HTML] [CoLab] [original]
Сводная таблица (pivot_table) в pandas [HTML] [CoLab] [original]
Подробное руководство по группировке и агрегированию с помощью pandas [HTML] [CoLab] [original]
Объяснение функций Grouper и agg в pandas [HTML] [CoLab] [original]
Понимание функции transform в pandas [HTML] [CoLab] [original]
Объяснение кросс-таблицы (crosstab) в pandas [HTML] [CoLab] [original]
Биннинг (разделение) данных с помощью qcut и cut в pandas [HTML] [CoLab] [original]
Моделирование Монте-Карло с помощью Python [HTML] [CoLab] [original]
Аккуратные данные (tidy data) в Python [HTML] [CoLab] [original]

Уроки по визуализации данных на русском языке


Эффективное использование Matplotlib [HTML] [CoLab] [original]
Взгляд на Plotly Express [HTML] [CoLab] [original]
Введение в визуализацию данных с помощью Altair (часть 1) [HTML] [CoLab] [original] и [doc]
Введение в визуализацию данных с помощью Altair (часть 2) [HTML] [CoLab] [doc]
Введение в визуализацию данных с помощью Altair (часть 3) [HTML] [CoLab] [doc]
Делаем сетевые графы интерактивными с помощью pyvis [HTML] [CoLab] [original doc]
Визуализация с помощью HoloViz (hvplot) [HTML] [miniconda] [original doc]

Полезные модули и сервисы для анализа данных


Шаблон Cookiecutter на русском языке: позволяет автоматизировать создание структуры файлов и каталогов для проекта по анализу данных.
Создание простых сводных таблиц в pandas с помощью модуля sidetable [HTML] [CoLab]
Используем модуль folium для рисования карт [HTML] [CoLab]
Использование модуля Pandas Profiling для профилирования [HTML] [CoLab]
Проверка статистических данных с помощью модуля pandera [HTML] [CoLab]
Pandas Tutor визуализирует, как код Python преобразует DataFrames [сайт]

Открытая наука и разработка программного обеспечения для исследований


Исследовательская разработка программного обеспечения (перевод книги)
  1. Введение [HTML]
  2. Структура проекта [HTML]
  3. Создание инструментов с помощью командной оболочки [HTML] [CoLab]
Полезные материалы по открытой науке

Элементы науки о данных на русском языке (Elements Of Data Science, professor Allen Downey)


Исследуем средний вес новорожденных (+упражнения) [HTML] [CoLab] [original (07)]
Исследуем отношение между переменными (+упражнения) [HTML] [CoLab] [original (09)]

Введение в байесовскую статистику с использованием Python на русском языке (Bite Size Bayes, professor Allen Downey)


Законы вероятности (+упражнения) [HTML] [CoLab] [original (01)]
Теорема Байеса (+упражнения) [HTML] [CoLab] [original (02)]
Проблема с печеньками (+упражнения) [HTML] [CoLab] [original (03)]

Кейсы и упражнения по pandas

Шпаргалки по pandas и Python

Учебники по анализу данных на Python / bash в оригинале

Справочники и учебники по визуализации в Python в оригинале

Шпаргалки по Matplotlib

Источники данных

Модульные тесты для специалистов по данным на русском языке

Python и кибербезопасность