Get started learning Python with DataCamp's free Intro to Python tutorial. Learn Data Science by completing interactive coding challenges and watching videos by expert instructors. Start Now!
This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join 11 million other learners and get started learning Python for data science today!
Good news! You can save 25% off your Datacamp annual subscription with the code LEARNPYTHON23ALE25 - Click here to redeem your discount
Регулярні вирази
Regular Expressions
Регулярні вирази (іноді скорочуються до regexp, regex або re) — це інструмент для пошуку шаблонів у тексті. У Python ми використовуємо модуль re. Застосування регулярних виразів дуже широке, але вони є досить складними, тому, коли розглядаєте можливість використання regex для певного завдання, подумайте про альтернативи і звертайтеся до регулярних виразів як до останньої інстанції.
Приклад регулярного виразу: r"^(From|To|Cc).*[email protected]"
Тепер пояснення: каретка ^
відповідає тексту на початку рядка. Наступна група, частина з (From|To|Cc)
означає, що рядок має починатися з одного з цих слів, які розділені оператором |
. Це називається оператором АБО, і регулярний вираз буде відповідати, якщо рядок починається з будь-якого з цих слів у групі. Конструкція .*?
означає негрібний збіг будь-якої кількості символів, окрім символу нового рядка \n
. Негрібний означає, що буде співпадати якомога менша кількість повторень. Символ .
означає будь-який не-знак нового рядка, *
означає повторення 0 або більше разів, а ?
робить його негрібним.
Отже, наступні рядки будуть відповідати цьому регулярному виразу:
From: [email protected]
To: !asp]<,. [email protected]
Повну довідку по синтаксису re ви можете знайти у документації Python.
Як приклад "правильного" регулярного виразу для співпадання з адресою електронної пошти (як у вправі), дивіться тут.
Exercise--------
# Example:
import re
pattern = re.compile(r"\[(on|off)\]") # Slight optimization
print(re.search(pattern, "Mono: Playback 65 [75%] [-16.50dB] [on]"))
# Returns a Match object!
print(re.search(pattern, "Nada...:-("))
# Doesn't return anything.
# End Example
# Exercise: make a regular expression that will match an email
def test_email(your_pattern):
pattern = re.compile(your_pattern)
emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"]
for email in emails:
if not re.match(pattern, email):
print("You failed to match %s" % (email))
elif not your_pattern:
print("Forgot to enter a pattern!")
else:
print("Pass")
pattern = r"" # Your pattern here!
test_email(pattern)
# Exercise: make a regular expression that will match an email
import re
def test_email(your_pattern):
pattern = re.compile(your_pattern)
emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"]
for email in emails:
if not re.match(pattern, email):
print("You failed to match %s" % (email))
elif not your_pattern:
print("Forgot to enter a pattern!")
else:
print("Pass")
# Your pattern here!
pattern = r"\"?([-a-zA-Z0-9.`?{}]+@\w+\.\w+)\"?"
test_email(pattern)
test_output_contains("Pass")
success_msg("Great work!")
This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join over a million other learners and get started learning Python for data science today!