Интерактивный курс
Упрощенный прием данных с помощью pandas
Научитесь получать данные из распространенных файловых форматов и систем, таких как файлы CSV, электронные таблицы, JSON, базы данных SQL и API.
О курсе
Прежде чем вы сможете анализировать данные, вы должны сначала получить их. На этом курсе вы научитесь создавать конвейеры для импорта данных, хранящихся в общих форматах хранения. Вы будете использовать pandas, основную библиотеку Python для аналитики, для получения данных из различных источников, от электронных таблиц ответов на опросы, до базы данных запросов на публичные услуги и API для популярного сайта обзора. Попутно вы узнаете, как точно настроить импорт, чтобы получить только то, что вам нужно, и решать такие проблемы, как неправильные типы данных. Наконец, вы соберете собственный набор данных из разных источников.План занятий
Импорт данных из неструктурированных файлов
Потренируйтесь в использовании pandas, чтобы получать из неструктурированных файлов только те данные, которые вам нужны, узнайте, как разбираться в типах данных и обрабатывать ошибки, а также изучите различные налоговые данные США.
Обработка ошибок и пропущенных данных
Указывание типа данных
Получить данные из CSV
Установка пользовательских значений NA
Введение в неструктурированные файлы
Импорт подмножества столбцов
Импорт файла частями
Получить данные из других неструктурированных файлов
Изменение импорта неструктурированных файлов
Пропуск неверных данных
Импорт данных из Excel-файлов
Автоматизируйте импорт данных из основного продукта офисной жизни —Excel-файлов. Импортируйте часть или всю книгу и убедитесь, что логические данные и данные времени и даты правильно загружены, и все это при изучении того, как другие люди учатся кодить.
Работа с несколькими таблицами
Изменение импорта: анализ дат
Установка пользовательских значений true/false
Анализ простых дат
Загрузка части электронной таблицы
Анализ нестандартных форматов даты
Выбор одного листа
Получение даты и времени из нескольких столбцов
Введение в электронные таблицы
Выберите несколько листов
Получение данных из электронной таблицы
Установка логических столбцов
Изменение импорта: данные true/false
Получение данных из нескольких листов
Импорт данных JSON и работа с API
Узнайте, как работать с данными JSON и веб-API, изучая общедоступный набор данных и получая рекомендации кафе от Yelp. Завершите изучение некоторых методов объединения наборов данных после их загрузки в датафреймы.
Установка заголовков запроса
Установка параметров API
Объединение нескольких наборов данных
Добавление фдатафрейма
Введение в API
Завершение
Работа с вложенными JSON
Работа с форматом JSON
Введение в JSON
Обработка глубоко вложенных данных
Структурирование вложенных JSON
Объединение датафреймов
Получить данные из API
Загрузка данных JSON
Импорт данных из баз данных
Объедините pandas с возможностями SQL, чтобы узнать, сколько проблем у жителей Нью-Йорка с их жильем. В этой главе рассматриваются вводные темы SQL, такие как запросы WHERE, агрегатные функции и базовые объединения.