Get started learning Python with DataCamp's free Intro to Python tutorial. Learn Data Science by completing interactive coding challenges and watching videos by expert instructors. Start Now!
This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join 11 million other learners and get started learning Python for data science today!
Good news! You can save 25% off your Datacamp annual subscription with the code LEARNPYTHON23ALE25 - Click here to redeem your discount
Reguláris kifejezések
Regular Expressions (esetenként rövidítve regexp, regex vagy re) eszközök a szövegminták illesztésére. Pythonban az re modul áll rendelkezésünkre. A reguláris kifejezések alkalmazásai széles körben elterjedtek, de meglehetősen összetettek, ezért amikor mérlegeljük a regex használatát egy adott feladathoz, gondoljuk át az alternatívákat, és hagyjuk a regexeket legvégső megoldásként.
Egy példa a regexre: r"^(From|To|Cc).*[email protected]"
Most következik a magyarázat: a ^
karakt kezdetén illeszkedik a sor elején. Az ezt követő csoport, amely (From|To|Cc)
tartalmazza, azt jelenti, hogy a sornak az egyik szóval kell kezdődnie, amelyek a |
jellel vannak elválasztva. Ezt hívják OR operátornak, és a regex akkor illeszkedik, ha a sor a csoport bármelyik szavával kezdődik. A .*?
annyi karaktert próbál illeszteni szűkségtelenül, kivéve az új sort \n
. A szüntelen rész azt jelenti, hogy a lehető legkevesebb ismétlést próbálja meg illeszteni. A .
karakter bármely nem-új sor karaktert jelent, a *
jelenti 0 vagy több ismétlést, és a ?
karakter szűkségtelent jelent.
Tehát a következő sorok illeszkednek az adott regexhez: From: [email protected]
To: !asp]<,. [email protected]
A teljes re szintaxisra vonatkozó referencia elérhető a python docs oldalán.
Egy "helyes" email-egyező regex példájaként (mint a gyakorlatban), lásd ezt
# Example:
import re
pattern = re.compile(r"\[(on|off)\]") # Slight optimization
print(re.search(pattern, "Mono: Playback 65 [75%] [-16.50dB] [on]"))
# Returns a Match object!
print(re.search(pattern, "Nada...:-("))
# Doesn't return anything.
# End Example
# Exercise: make a regular expression that will match an email
def test_email(your_pattern):
pattern = re.compile(your_pattern)
emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"]
for email in emails:
if not re.match(pattern, email):
print("You failed to match %s" % (email))
elif not your_pattern:
print("Forgot to enter a pattern!")
else:
print("Pass")
pattern = r"" # Your pattern here!
test_email(pattern)
# Exercise: make a regular expression that will match an email
import re
def test_email(your_pattern):
pattern = re.compile(your_pattern)
emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"]
for email in emails:
if not re.match(pattern, email):
print("You failed to match %s" % (email))
elif not your_pattern:
print("Forgot to enter a pattern!")
else:
print("Pass")
# Your pattern here!
pattern = r"\"?([-a-zA-Z0-9.`?{}]+@\w+\.\w+)\"?"
test_email(pattern)
test_output_contains("Pass")
success_msg("Great work!")
This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join over a million other learners and get started learning Python for data science today!