Интерактивный курс
Промежуточный импорт данных в Python
Совершенствуйте свои навыки импорта данных Python и научитесь работать с данными в Интернете и API.
О курсе
Как специалист по обработке данных, вам нужно будет чистить данные, разбирать и разбирать их, визуализировать, строить прогностические модели и интерпретировать эти модели. Однако прежде чем вы сможете это сделать, вам нужно знать, как получить данные в Python. В приквеле к этому курсу вы узнали много способов импорта данных в Python: из простых файлов, таких как .txt и .csv; из файлов, встроенных в другое программное обеспечение, таких как электронные таблицы Excel, файлы Stata, SAS и MATLAB; и из реляционных баз данных, таких как SQLite и PostgreSQL. В этом курсе вы расширите эту базу знаний, научившись импортировать данные из Интернета и извлекая данные из интерфейсов прикладного программирования - API-интерфейсов, таких как потоковый API-интерфейс Twitter, который позволяет нам транслировать твиты в реальном времени.План занятий
Импорт данных из интернета
Сеть - это богатый источник данных, из которого вы можете извлекать различные виды идей и выводов. В этой главе вы узнаете, как получать данные из Интернета, хранятся ли они в файлах или в HTML. Вы также изучите основы очистки и анализа веб-данных.
Превращение веб-страницы в данные с помощью BeautifulSoup: получение текста
Импорт плоских файлов из Интернета
HTTP-запросы на импорт файлов из Интернета
Разбор HTML с BeautifulSoup
Импорт неплоских файлов из Интернета
Превращение веб-страницы в данные с помощью BeautifulSoup: получение гиперссылок
Выполнение HTTP-запросов в Python с использованием urllib
Открытие и чтение плоских файлов из Интернета
Импорт плоских файлов из Интернета: ваша очередь!
Соскребая сеть в Python
Печать результатов HTTP-запроса в Python с использованием urllib
Выполнение HTTP-запросов в Python с использованием запросов
Взаимодействие с API для импорта данных из Интернета
В этой главе вы получите более глубокое понимание того, как импортировать данные из Интернета. Вы изучите основы извлечения данных из API, узнаете о важности API и попрактикуетесь в извлечении данных, углубившись в API OMDB и Library of Congress.
Погружение вглубь Twitter API
В этой главе вы объедините свои знания о взаимодействии с API-интерфейсами и погрузитесь в потоковый API-интерфейс Twitter. Вы узнаете, как передавать данные Twitter в режиме реального времени, а также как анализировать и визуализировать их.