Get started learning Python with DataCamp's free Intro to Python tutorial. Learn Data Science by completing interactive coding challenges and watching videos by expert instructors. Start Now!
This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join 11 million other learners and get started learning Python for data science today!
Good news! You can save 25% off your Datacamp annual subscription with the code LEARNPYTHON23ALE25 - Click here to redeem your discount
Regulární výrazy
Regulární výrazy
Regulární výrazy (někdy zkráceně regexp, regex nebo re) jsou nástrojem pro shodu vzorů v textu. V Pythonu máme modul re. Aplikace regulárních výrazů jsou rozšířené, ale jsou poměrně složité, takže když uvažujete o použití regexu pro určitý úkol, přemýšlejte o alternativách a k regulárním výrazům se uchylujte jako k poslední možnosti.
Příklad regexu je r"^(From|To|Cc).*[email protected]"
Nyní k vysvětlení: Znak karetky ^
odpovídá textu na začátku řádku. Následující skupina, část s (From|To|Cc)
, znamená, že řádek musí začínat jedním ze slov oddělených svislítkem |
. To se nazývá operátor OR a regex se shoduje, pokud řádek začíná některým ze slov ve skupině. .*?
znamená nezávisle shodovat libovolný počet znaků, kromě znaku nového řádku \n
. Nezávislá část znamená shodovat co nejméně opakování. Znak .
znamená libovolný znak kromě nového řádku, *
znamená opakovat 0 nebo vícekrát a znak ?
činí šablonu nenažravou.
Takže následující řádky by odpovídaly tomuto regexu:
From: [email protected]
To: !asp]<,. [email protected]
Úplný odkaz na syntaxi re je k dispozici na dokumentaci Pythonu.
Jako příklad "řádného" regexu pro shodu e-mailu (podobně jako ten v cvičení), podívejte se na tento odkaz.
# Example:
import re
pattern = re.compile(r"\[(on|off)\]") # Slight optimization
print(re.search(pattern, "Mono: Playback 65 [75%] [-16.50dB] [on]"))
# Returns a Match object!
print(re.search(pattern, "Nada...:-("))
# Doesn't return anything.
# End Example
# Exercise: make a regular expression that will match an email
def test_email(your_pattern):
pattern = re.compile(your_pattern)
emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"]
for email in emails:
if not re.match(pattern, email):
print("You failed to match %s" % (email))
elif not your_pattern:
print("Forgot to enter a pattern!")
else:
print("Pass")
pattern = r"" # Your pattern here!
test_email(pattern)
# Exercise: make a regular expression that will match an email
import re
def test_email(your_pattern):
pattern = re.compile(your_pattern)
emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"]
for email in emails:
if not re.match(pattern, email):
print("You failed to match %s" % (email))
elif not your_pattern:
print("Forgot to enter a pattern!")
else:
print("Pass")
# Your pattern here!
pattern = r"\"?([-a-zA-Z0-9.`?{}]+@\w+\.\w+)\"?"
test_email(pattern)
test_output_contains("Pass")
success_msg("Great work!")
This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join over a million other learners and get started learning Python for data science today!