Интерактивный курс

Регулярные выражения в Python

Вы узнаете как работать со строками и станете мастером в использовании регулярных выражений.

О курсе

Как специалист по Data Science, вы столкнетесь со многими ситуациями, когда вам потребуется извлекать ключевую информацию из огромного массива текста, очищать грязные данные, содержащие строки, или обнаруживать и сопоставлять шаблоны, чтобы найти полезные слова. Все эти ситуации являются частью интеллектуального анализа текста и являются важным шагом перед применением алгоритмов машинного обучения. Этот курс познакомит вас с убедительными понятиями о работе со строками и регулярными выражениями. Вы узнаете, как разбивать строки, объединять их вместе, интерполировать их, а также обнаруживать, извлекать, заменять и сопоставлять строки с помощью регулярных выражений. В процессе освоения этих навыков вы будете работать с наборами данных, содержащими обзоры фильмов или потоковые твиты, которые можно использовать для определения мнения, а также с необработанным текстом, извлеченным из Интернета.

План занятий

Регулярные выражения для сопоставления с образцом

Время изучать основные понятия регулярных выражений! В этой ключевой главе вы научитесь понимать основные понятия синтаксиса регулярных выражений. Используя реальный набор данных с твитами, предназначенными для анализа настроений, вы узнаете, как применять сопоставление с образцом, используя обычные и специальные символы, а также жадные и ленивые квантификаторы.

Основные понятия в работе со строками

Начните свое путешествие в мир регулярных выражений! От нарезки и объединения, корректировки, удаления пробелов до поиска и замены строк. Вы узнаете, как справиться с основной операцией для работы со строками, используя набор данных обзора фильма.

Форматирование строк

По ходу обучения вы узнаете основные подходы, которые можно использовать для форматирования или интерполяции строк в Python с использованием набора данных, содержащего информацию, извлеченную из Интернета. Вы изучите преимущества и недостатки использования позиционного форматирования, встраивания выражений внутри строковых констант и использования класса Template.

Расширенные концепции регулярных выражений

На последнем этапе вашего обучения вы изучите более сложные методы сопоставления с образцом, используя скобки для группировки строк или для сопоставления того же текста, что и ранее. Кроме того, вы получите представление о том, как вы можете смотреть вокруг выражений.