Интерактивный курс
Основы pandas
Узнайте, как использовать стандартную библиотеку pandas для импорта, создания и управления DataFrames.
О курсе
pandas DataFrames — наиболее широко используемое решение для работы со сложными вычислениями в Python. Работаете ли вы с финансами, в научной сфере или в Data Science, знакомство с pandas крайне важно. На этом курсе вы научитесь работать с реальными наборами данных, содержащими как строковые, так и числовые данные, часто структурированные вокруг временных рядов. В этом курсе вы изучите мощные методы анализа, отбора и визуализации.План занятий
Временные ряды в pandas
В этой главе вы узнаете, как манипулировать и визуализировать данные временных рядов с помощью pandas. Вы познакомитесь с такими понятиями, как повышающая дискретизация, понижающая выборка и интерполяция. Вы будете практиковаться в использовании цепочки методов для эффективной фильтрации ваших данных и выполнения анализа временных рядов. От цен на акции до времени полета, данные временных рядов можно найти в самых разных областях, и возможность эффективно работать с ними — бесценный навык.
Метод цепочки и фильтрации
Повторная выборка и частота
Создание и использование DatetimeIndex
Управление данными временных рядов
Частичная индексация и нарезка строк
Построение временных рядов, индексирование даты и времени
Разделение и повторная выборка
Индексирование временных рядов
Графики дат, частичная индексация
Визуализация временных рядов
Время чтения и нарезки
Отсутствующие значения и интерполяция
Скользящяя средняя и частота
Ресемплирование
Часовые пояса и конверсия
Повторная выборка данных временных рядов
Переиндексирование индекса
Исследовательский анализ данных
Теперь, когда вы научились принимать и проверять свои данные, вы узнаете, как исследовать их визуально и количественно. Этот процесс, известный как исследовательский анализ данных (EDA), является важнейшим компонентом любого проекта по data science. У pandas есть мощные методы, которые помогают со статистической и визуальной EDA. В этой главе вы узнаете, как и когда применять эти методы.
Pandas Hist, PDF и Cdf
Фильтрация и подсчет
Визуальный анализ данных
Разделяй и строй график
Стандартное отклонение температуры
Степени бакалавра присужденные женщинам
Медиана против среднего
Разделяй и суммируй
Статистический исследовательский анализ данных
Квантили
Эффективность топлива
Линейные графики pandas
Разделение населения
Точечные диаграммы pandas
Ящичные диаграммы в Pandas
Прием данных и проверка
В этой главе вы познакомитесь с pandas DataFrames. Вы будете использовать pandas для импорта и проверки различных наборов данных, начиная с данных о населении, полученных от Всемирного банка, до ежемесячных данных об акциях, получаемых через Yahoo Finance. Вы также будете практиковаться в создании DataFrames с нуля и познакомитесь с внутренними возможностями визуализации данных pandas.
Создание DataFrames с вещанием
Zip-списки для построения DataFrame
Маркировка ваших данных
Типы данных DataFrame
Обзор pandas DataFrames
Импорт и экспорт данных
NumPy и pandas работают вместе
Чтение Flat-файлов
Разделители, заголовки и расширения
Проверка ваших данных
Построение DataFrames
Построение серии с использованием pandas
Построение графиков в pandas
Создание DataFrames с нуля
Тематическое исследование — Солнечный свет в Остине
Работая с реальными данными о погоде и климате, эта глава позволит вам применить все навыки, которые вы приобрели по ходу курса. Вы будете использовать pandas для работы с данными в удобной для анализа форме и систематического изучения их с использованием техник, которые вы изучили.