Интерактивный курс

Промежуточный импорт данных в Python

Совершенствуйте свои навыки импорта данных Python и научитесь работать с данными в Интернете и API.

О курсе

Как специалист по обработке данных, вам нужно будет чистить данные, разбирать и разбирать их, визуализировать, строить прогностические модели и интерпретировать эти модели. Однако прежде чем вы сможете это сделать, вам нужно знать, как получить данные в Python. В приквеле к этому курсу вы узнали много способов импорта данных в Python: из простых файлов, таких как .txt и .csv; из файлов, встроенных в другое программное обеспечение, таких как электронные таблицы Excel, файлы Stata, SAS и MATLAB; и из реляционных баз данных, таких как SQLite и PostgreSQL. В этом курсе вы расширите эту базу знаний, научившись импортировать данные из Интернета и извлекая данные из интерфейсов прикладного программирования - API-интерфейсов, таких как потоковый API-интерфейс Twitter, который позволяет нам транслировать твиты в реальном времени.

План занятий

Импорт данных из интернета

Сеть - это богатый источник данных, из которого вы можете извлекать различные виды идей и выводов. В этой главе вы узнаете, как получать данные из Интернета, хранятся ли они в файлах или в HTML. Вы также изучите основы очистки и анализа веб-данных.

Взаимодействие с API для импорта данных из Интернета

В этой главе вы получите более глубокое понимание того, как импортировать данные из Интернета. Вы изучите основы извлечения данных из API, узнаете о важности API и попрактикуетесь в извлечении данных, углубившись в API OMDB и Library of Congress.

Погружение вглубь Twitter API

В этой главе вы объедините свои знания о взаимодействии с API-интерфейсами и погрузитесь в потоковый API-интерфейс Twitter. Вы узнаете, как передавать данные Twitter в режиме реального времени, а также как анализировать и визуализировать их.