Онлайн курс
Инструментарий Data Science в Python (часть 2)
Здесь вы продолжите развивать навыки в области наук о данных, изучая итераторы и составляя списки.
Цена за месяц
1 990₽
Продолжительность
4 недели
О курсе
На втором курсе «инструментария Data Science в Python» вы продолжите развивать свои навыки работы с данными в Python. Сначала вы узнаете об итераторах — объектах, с которыми вы уже сталкивались в контексте циклов for. Затем вы узнаете о списках, которые являются чрезвычайно удобными инструментами для всех исследователей данных, работающих в Python. По окончанию курса вы проведете тематическое исследование, в котором вы будете применять все методы, которые изучили в обеих частях этого курса.
План курса
Использование итераторов в PythonLand
Вы узнаете все об итераторах и итерируемых, с которыми вы ранее работали при написании циклов. Вы изучите несколько удобных функций, которые позволят вам эффективно работать с итераторами. И закончите главу на живом примере, относящемся к миру данных и имеющий дело с большими объемами данных — в данном случае это данные из Twitter, которые вы будете загружать частями, используя итераторы.
Использование перечисления
Итерация через итерируемое (2)
Пробуем функцию zip
Попрактикуемся с итераторами
Извлечение информации для больших объемов данных Twitter
Обработка больших объемов данных из Twitter
Итерация через итерируемые (1)
Использование «*» и zip для «распаковки»
Поздравляем!
Введение в итераторы
Итераторы как аргументы функции
Итераторы vs Итерируемые
Использование итераторов для загрузки больших файлов в память
Закрепляем пройденный материал!
Эта глава позволит вам применить свои недавно приобретенные навыки для сбора и извлечения значимой информации из реального набора данных — показателей мирового развития Всемирного банка. Вы напишете свои собственные функции и составите списковое включение, также будете работать с итераторами и генераторами, чтобы укрепить ваши знания в области данных Python.
Написание итератора для загрузки данных частями (4)
Написание итератора для загрузки данных частями(3)
Написание генератора для загрузки данных частями (3)
Словари в Data Science
Написание генератора для загрузки данных частями (2)
Использование списка включений
Заключение
Создание функции, которая упростит работу
Использование pandas итератора read_csv для потоковой передачи данных
Написание итератора для загрузки данных частями (2)
Преобразуем все в датафрейм
Обработка данных частями (1)
Добро пожаловать в тематическое исследование!
Написание итератора для загрузки данных частями (1)
Написание итератора для загрузки данных частями (5)
Использование генераторов Python для потоковой передачи данных
Списковое включение и генераторы
В этой главе вы будете опираться на свои знания итераторов и познакомитесь со списковыми включениями, которые позволят вам создавать сложные списки и списки списков в одной строке кода! Понимание списков значительно упростит ваш код и сделать его более эффективным, и станет важной частью вашего инструментария Data Science. Затем вы познакомитесь с генераторами, которые чрезвычайно полезны при работе с большими последовательностями данных, которые не нужно хранить в памяти, а вместо этого генерировать на лету.