Онлайн курс
Манипулирование данными с пандами
Используйте самый популярный в мире пакет данных Python для обработки данных и вычисления сводной статистики.
Цена за месяц
1 990₽
Продолжительность
4 недели
О курсе
pandas - самая популярная в мире библиотека Python, используемая для всего, от манипулирования данными до анализа данных. В этом курсе вы узнаете, как манипулировать DataFrames при извлечении, фильтрации и преобразовании реальных наборов данных для анализа. Используя панды, вы изучите все основные концепции науки о данных. Используя реальные данные, в том числе данные о продажах Walmart и глобальные временные ряды температуры, вы узнаете, как импортировать, очищать, рассчитывать статистику и создавать визуализации, используя панд для расширения возможностей Python!
План курса
Преобразование данных
Давайте освоим основы панд. Узнайте, как проверять фреймы данных и выполнять фундаментальные манипуляции, включая сортировку строк, поднаборы и добавление новых столбцов.
Агрегирование данных
В этой главе вы будете рассчитывать сводную статистику по столбцам DataFrame, а также сводную сводную статистику и сводные таблицы.
Поворот по одной переменной
Расчеты с .groupby ()
Заполните пропущенные значения и значения сумм с помощью сводных таблиц
Несколько сгруппированных саммари
Сгруппированная сводная статистика
Среднее и медианное
Counting
Эффективные саммари
Накопительная статистика
Сводные статистические данные
Суммирование дат
Сводные таблицы
Подсчет категориальных переменных
Удаление дубликатов
Какой процент продаж произошел в каждом типе магазина?
Нарезка и индексация
Индексы - это перегруженные имена строк и столбцов. Узнайте, как они могут быть объединены с нарезкой для мощного поднабора DataFrame.
Подмножество с .loc []
Установка и удаление индексов
Явные индексы
Установка многоуровневых индексов
Сортировка по значениям индекса
Нарезка и подмножество с .loc и .iloc
Сводная температура по городу и году
Нарезка в обоих направлениях
Срезание временных рядов
Создаем подмножества по номеру строки/столбца
Работа с сводными таблицами
Нарезка значений индекса
Поднабор сводных таблиц
Расчет на сводной таблице
Создание и визуализация фреймов данных
Научитесь визуализировать содержимое ваших DataFrames, обрабатывать пропущенные значения данных, а также импортировать данные и экспортировать данные в файлы CSV.