Интерактивный курс

Улучшение визуализации ваших данных в Python

Вы научитесь создавать понятные и красивые визуализации, которые помогают эффективно и результативно представлять результаты.

О курсе

Великолепная визуализация данных — одна из важнейших задач эффективной науки о данных. Визуализация помогает вам понимать данные и делиться этими знаниями со своей аудиторией. Каждый учится составлять обычную точечную диаграмму или гистограмму, чтобы стать специалистом по анализу данных, но истинный потенциал визуализации данных раскрывается, когда вы задумываетесь о том, зачем и как вы визуализируете свои данные. В этом курсе вы узнаете, как создавать понятные и красивые визуализации, которые помогут вам эффективно и результативно сообщать результаты вашего анализа. Мы рассмотрим сравнение данных, важности цвета, демонстрации неопределенности и того, как создать правильную визуализацию для конкретной аудитории путем изучения наборов данных о загрязнении воздуха в США и на фермерских рынках. Мы закончим курс изучением данных о фермерских хозяйствах в открытом доступе, чтобы создать наглядный и эффективный визуальный отчет.

План занятий

Визуализация в процессе обработки данных

Часто визуализация преподается отдельно, а примеры использования обсуждаются только в общих чертах. В действительности вам нужно будет изменить правила для разных сценариев. От грубой исследовательской визуализации до подбора размера шрифта конечного продукта; в этой главе мы углубимся в то, как оптимизировать ваши визуализации на каждом этапе рабочего процесса в науке о данных.

Подсветка важных данных

Как показать все свои данные, чтобы зрители не пропустили важный момент или моменты? Здесь мы обсудим, как направить вашего зрителя через данные с помощью цветной подсветки и текста. Мы также представляем датасет по общим значениям загрязняющих веществ в Соединенных Штатах.

Отображение неопределенности

Неопределенность часто встречается в науке о данных, но часто остается за пределами визуализаций, где она должна отображаться. Здесь мы рассмотрим, что такое доверительный интервал и как его визуализировать как для отдельных оценок, так и для непрерывных функций. Кроме того, мы обсудим метод повторной выборки при начальной загрузке для оценки неопределенности и как правильно ее визуализировать.