Анализа IP- и MAC-адресов с помощью модуля cyberpandas

Open in Colab

Обычно при анализе сетевого трафика используются наборы данных, содержащие IP-адреса.

В стандртном Python для этого есть:

Но мы помним про объемы памяти, которые выделяет стандартный Python в момент создания объектов.

Основываясь на ExtensionArray интерфейсе, cyberpandas предоставляет два новых типа данных: для IP-адреса и для MAC-адреса, совместимые с типами данных pandas.

Создадим Series на основе массива IPArray:

Обратите внимание на dtype.

Данные по-прежнему хранятся в формате IPArray. Это обеспечивает высокопроизводительный рабочий процесс, который будет естественным для пользователей pandas.

Рассмотрим пример анализа сетевого трафика:

Посмотрим на типы данных:

Преобразуем столбцы Source и Destination в тип данных IPArray:

Или еще один способ для преобразования в IPArray:

Различные атрибуты по ссылке: