Get started learning Python with DataCamp's free Intro to Python tutorial. Learn Data Science by completing interactive coding challenges and watching videos by expert instructors. Start Now!

This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join 11 million other learners and get started learning Python for data science today!

Good news! You can save 25% off your Datacamp annual subscription with the code LEARNPYTHON23ALE25 - Click here to redeem your discount

Регулярные выражения


Регулярные выражения (иногда сокращенно называемые regexp, regex или re) — это инструмент для сопоставления шаблонов в тексте. В Python у нас есть модуль re. Применение регулярных выражений широко распространено, но они довольно сложны, поэтому, размышляя о использовании regex для определенной задачи, подумайте об альтернативах и используйте регулярные выражения как последний вариант.

Пример регулярного выражения: r"^(From|To|Cc).*[email protected]" Теперь объяснение: символ каретки ^ соответствует тексту в начале строки. Следующая группа, часть с (From|To|Cc) означает, что строка должна начинаться с одного из слов, которые разделены ор-оператором |. Это называется оператором OR, и регулярное выражение подойдет, если строка начинается с любого из слов в группе. .*? означает негладкое соответствие любому количеству символов, кроме символа новой строки \n. Негладкость означает соответствие по возможно меньшему числу повторений. Символ . означает любой символ, кроме символа новой строки, * означает повторение 0 или более раз, а символ ? делает его негладким.

Таким образом, следующие строки будут соответствовать этому регулярному выражению: From: [email protected] To: !asp]<,. [email protected]

Полная справка по синтаксису re доступна в документации python.

В качестве примера "правильного" регулярного выражения для сопоставления электронных писем (как в упражнении), смотрите здесь

# Example: import re pattern = re.compile(r"\[(on|off)\]") # Slight optimization print(re.search(pattern, "Mono: Playback 65 [75%] [-16.50dB] [on]")) # Returns a Match object! print(re.search(pattern, "Nada...:-(")) # Doesn't return anything. # End Example # Exercise: make a regular expression that will match an email def test_email(your_pattern): pattern = re.compile(your_pattern) emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"] for email in emails: if not re.match(pattern, email): print("You failed to match %s" % (email)) elif not your_pattern: print("Forgot to enter a pattern!") else: print("Pass") pattern = r"" # Your pattern here! test_email(pattern) # Exercise: make a regular expression that will match an email import re def test_email(your_pattern): pattern = re.compile(your_pattern) emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"] for email in emails: if not re.match(pattern, email): print("You failed to match %s" % (email)) elif not your_pattern: print("Forgot to enter a pattern!") else: print("Pass") # Your pattern here! pattern = r"\"?([-a-zA-Z0-9.`?{}]+@\w+\.\w+)\"?" test_email(pattern) test_output_contains("Pass") success_msg("Great work!")

This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join over a million other learners and get started learning Python for data science today!

Previous Tutorial Next Tutorial Take the Test
Copyright © learnpython.org. Read our Terms of Use and Privacy Policy