Интерактивный курс
Регулярные выражения в Python
Вы узнаете как работать со строками и станете мастером в использовании регулярных выражений.
О курсе
Как специалист по Data Science, вы столкнетесь со многими ситуациями, когда вам потребуется извлекать ключевую информацию из огромного массива текста, очищать грязные данные, содержащие строки, или обнаруживать и сопоставлять шаблоны, чтобы найти полезные слова. Все эти ситуации являются частью интеллектуального анализа текста и являются важным шагом перед применением алгоритмов машинного обучения. Этот курс познакомит вас с убедительными понятиями о работе со строками и регулярными выражениями. Вы узнаете, как разбивать строки, объединять их вместе, интерполировать их, а также обнаруживать, извлекать, заменять и сопоставлять строки с помощью регулярных выражений. В процессе освоения этих навыков вы будете работать с наборами данных, содержащими обзоры фильмов или потоковые твиты, которые можно использовать для определения мнения, а также с необработанным текстом, извлеченным из Интернета.План занятий
Регулярные выражения для сопоставления с образцом
Время изучать основные понятия регулярных выражений! В этой ключевой главе вы научитесь понимать основные понятия синтаксиса регулярных выражений. Используя реальный набор данных с твитами, предназначенными для анализа настроений, вы узнаете, как применять сопоставление с образцом, используя обычные и специальные символы, а также жадные и ленивые квантификаторы.
Поиск файлов
Понимание разницы
Поиск чисел
Совпадение и разделение
Введение в регулярные выражения
Неправильный пароль
Жадный подход
Дайте мне вашу электронную почту
Все чисто
Получение токенов
Ленивый подход
Жадное против не жадного соответствия
Некоторое время назад
Повторы
Это боты?
Метасимволы регулярных выражений
Основные понятия в работе со строками
Начните свое путешествие в мир регулярных выражений! От нарезки и объединения, корректировки, удаления пробелов до поиска и замены строк. Вы узнаете, как справиться с основной операцией для работы со строками, используя набор данных обзора фильма.
Форматирование строк
По ходу обучения вы узнаете основные подходы, которые можно использовать для форматирования или интерполяции строк в Python с использованием набора данных, содержащего информацию, извлеченную из Интернета. Вы изучите преимущества и недостатки использования позиционного форматирования, встраивания выражений внутри строковых констант и использования класса Template.
Расширенные концепции регулярных выражений
На последнем этапе вашего обучения вы изучите более сложные методы сопоставления с образцом, используя скобки для группировки строк или для сопоставления того же текста, что и ранее. Кроме того, вы получите представление о том, как вы можете смотреть вокруг выражений.