Get started learning Python with DataCamp's free Intro to Python tutorial. Learn Data Science by completing interactive coding challenges and watching videos by expert instructors. Start Now!
This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join 11 million other learners and get started learning Python for data science today!
Good news! You can save 25% off your Datacamp annual subscription with the code LEARNPYTHON23ALE25 - Click here to redeem your discount
Wyrażenia regularne
Regular Expressions (czasami skracane do regexp, regex lub re) to narzędzie do dopasowywania wzorców w tekście. W Pythonie mamy moduł re. Zastosowania wyrażeń regularnych są szeroko rozpowszechnione, ale są one dość skomplikowane, więc rozważając użycie wyrażeń regularnych do wykonania pewnego zadania, pomyśl o alternatywach i sięgaj po wyrażenia regularne jako ostateczność.
Przykładowe wyrażenie regularne to r"^(From|To|Cc).*[email protected]"
Teraz wyjaśnienie:
daszek ^
dopasowuje tekst na początku linii. Następująca grupa, część z (From|To|Cc)
oznacza, że linia musi zaczynać się od jednego z wyrazów rozdzielonych przez pionowy pasek |
. To jest tzw. operator OR, a wyrażenie regularne dopasuje, jeśli linia zaczyna się od dowolnego z wyrazów w grupie. .*?
oznacza nie-łapczywe dopasowanie dowolnej liczby znaków, z wyjątkiem znaku nowej linii \n
. Część nie-łapczywa oznacza dopasowanie jak najmniejszej liczby powtórzeń. Znak .
oznacza dowolny znak niebędący nową linią, *
oznacza powtórzenie 0 lub więcej razy, a znak ?
sprawia, że jest ono nie-łapczywe.
Tak więc, następujące linie byłyby dopasowane przez to wyrażenie regularne:
From: [email protected]
To: !asp]<,. [email protected]
Pełną referencję składni re można znaleźć w dokumentacji Python.
Jako przykład "poprawnego" wyrażenia regularnego do dopasowywania adresów email (takiego jak w ćwiczeniu), zobacz to
# Example:
import re
pattern = re.compile(r"\[(on|off)\]") # Slight optimization
print(re.search(pattern, "Mono: Playback 65 [75%] [-16.50dB] [on]"))
# Returns a Match object!
print(re.search(pattern, "Nada...:-("))
# Doesn't return anything.
# End Example
# Exercise: make a regular expression that will match an email
def test_email(your_pattern):
pattern = re.compile(your_pattern)
emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"]
for email in emails:
if not re.match(pattern, email):
print("You failed to match %s" % (email))
elif not your_pattern:
print("Forgot to enter a pattern!")
else:
print("Pass")
pattern = r"" # Your pattern here!
test_email(pattern)
# Exercise: make a regular expression that will match an email
import re
def test_email(your_pattern):
pattern = re.compile(your_pattern)
emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"]
for email in emails:
if not re.match(pattern, email):
print("You failed to match %s" % (email))
elif not your_pattern:
print("Forgot to enter a pattern!")
else:
print("Pass")
# Your pattern here!
pattern = r"\"?([-a-zA-Z0-9.`?{}]+@\w+\.\w+)\"?"
test_email(pattern)
test_output_contains("Pass")
success_msg("Great work!")
This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join over a million other learners and get started learning Python for data science today!