Интерактивный курс
Улучшение визуализации ваших данных в Python
Вы научитесь создавать понятные и красивые визуализации, которые помогают эффективно и результативно представлять результаты.
О курсе
Великолепная визуализация данных — одна из важнейших задач эффективной науки о данных. Визуализация помогает вам понимать данные и делиться этими знаниями со своей аудиторией. Каждый учится составлять обычную точечную диаграмму или гистограмму, чтобы стать специалистом по анализу данных, но истинный потенциал визуализации данных раскрывается, когда вы задумываетесь о том, зачем и как вы визуализируете свои данные. В этом курсе вы узнаете, как создавать понятные и красивые визуализации, которые помогут вам эффективно и результативно сообщать результаты вашего анализа. Мы рассмотрим сравнение данных, важности цвета, демонстрации неопределенности и того, как создать правильную визуализацию для конкретной аудитории путем изучения наборов данных о загрязнении воздуха в США и на фермерских рынках. Мы закончим курс изучением данных о фермерских хозяйствах в открытом доступе, чтобы создать наглядный и эффективный визуальный отчет.План занятий
Визуализация в процессе обработки данных
Часто визуализация преподается отдельно, а примеры использования обсуждаются только в общих чертах. В действительности вам нужно будет изменить правила для разных сценариев. От грубой исследовательской визуализации до подбора размера шрифта конечного продукта; в этой главе мы углубимся в то, как оптимизировать ваши визуализации на каждом этапе рабочего процесса в науке о данных.
Какой штат наиболее приспособлен для торговли?
Работа с данными о рынке фермеров
Тонкая настройка ваших графиков
Очистка фона
Связана ли широта с месяцами?
Улучшение читаемости диаграм
Складывание данных для выявления тренда
Поздравляем!
Сделайте ваши визуализации эффективными
Использование графика в качестве легенды
Изучение закономерностей
Популярность проданных товаров штатом
Матрица рассеяния числовых столбцов
Перемешивание графика
Углубляемся в основные преобразования
Первые исследования
Подсветка важных данных
Как показать все свои данные, чтобы зрители не пропустили важный момент или моменты? Здесь мы обсудим, как направить вашего зрителя через данные с помощью цветной подсветки и текста. Мы также представляем датасет по общим значениям загрязняющих веществ в Соединенных Штатах.
Использование цвета в визуализациях
Цвет — это мощный инструмент для зашифрованных значений в визуализации данных. Однако с этой возможностью приходят и трудности. В этой главе мы поговорим о том, как выбрать подходящую цветовую палитру для вашей визуализации в зависимости от типа отображаемых данных.
Избавляемся от ненужного цвета
Настройка палитры-градиента
Использование пользовательской категориальной палитры
Выбор правильной переменной для кодирования цветом
Раскрашивание порядковых категорий
Настройка вашей палитры в соответствии с контекстом
Исправление гистограмм Seaborn
Настройка расходящейся палитры для тепловой карты.
Цвет в визуализациях
Работа с большим количеством категорий
Палитры для категорий
Сплошные цветовые палитры
Отображение неопределенности
Неопределенность часто встречается в науке о данных, но часто остается за пределами визуализаций, где она должна отображаться. Здесь мы рассмотрим, что такое доверительный интервал и как его визуализировать как для отдельных оценок, так и для непрерывных функций. Кроме того, мы обсудим метод повторной выборки при начальной загрузке для оценки неопределенности и как правильно ее визуализировать.