Интерактивный курс

Упрощенный прием данных с помощью pandas

Научитесь получать данные из распространенных файловых форматов и систем, таких как файлы CSV, электронные таблицы, JSON, базы данных SQL и API.

О курсе

Прежде чем вы сможете анализировать данные, вы должны сначала получить их. На этом курсе вы научитесь создавать конвейеры для импорта данных, хранящихся в общих форматах хранения. Вы будете использовать pandas, основную библиотеку Python для аналитики, для получения данных из различных источников, от электронных таблиц ответов на опросы, до базы данных запросов на публичные услуги и API для популярного сайта обзора. Попутно вы узнаете, как точно настроить импорт, чтобы получить только то, что вам нужно, и решать такие проблемы, как неправильные типы данных. Наконец, вы соберете собственный набор данных из разных источников.

План занятий

Импорт данных из неструктурированных файлов

Потренируйтесь в использовании pandas, чтобы получать из неструктурированных файлов только те данные, которые вам нужны, узнайте, как разбираться в типах данных и обрабатывать ошибки, а также изучите различные налоговые данные США.

Импорт данных JSON и работа с API

Узнайте, как работать с данными JSON и веб-API, изучая общедоступный набор данных и получая рекомендации кафе от Yelp. Завершите изучение некоторых методов объединения наборов данных после их загрузки в датафреймы.