Get started learning Python with DataCamp's free Intro to Python tutorial. Learn Data Science by completing interactive coding challenges and watching videos by expert instructors. Start Now!
This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join 11 million other learners and get started learning Python for data science today!
Good news! You can save 25% off your Datacamp annual subscription with the code LEARNPYTHON23ALE25 - Click here to redeem your discount
Reguliere Expressies
Reguliere expressies (soms afgekort als regexp, regex of re) zijn een hulpmiddel voor het matchen van patronen in tekst. In Python hebben we de module re. De toepassingen voor reguliere expressies zijn veelzijdig, maar ze zijn behoorlijk complex. Dus als je overweegt een regex voor een bepaalde taak te gebruiken, denk dan aan alternatieven en beschouw regexen als een laatste redmiddel.
Een voorbeeld van een regex is r"^(From|To|Cc).*[email protected]"
. Nu voor een uitleg: de dakje ^
matcht tekst aan het begin van een regel. De volgende groep, het deel met (From|To|Cc)
, betekent dat de regel moet beginnen met een van de woorden die zijn gescheiden door de pipe |
. Dat wordt de OF-operator genoemd, en de regex zal matchen als de regel begint met een van de woorden in de groep. De .*?
betekent dat je niet-gretig een willekeurig aantal tekens moet matchen, behalve het nieuwe regel \n
teken. Het niet-gretige deel betekent dat je zo weinig mogelijk herhalingen moet matchen. Het .
karakter betekent elk niet-nieuwe regel karakter, de *
betekent herhaal 0 of meer keer, en het ?
karakter maakt het niet-gretig.
Dus de volgende regels zouden worden gematcht door die regex:
From: [email protected]
To: !asp]<,. [email protected]
Een volledige referentie voor de re-syntaxis is beschikbaar bij de python docs.
Als een voorbeeld van een "juiste" email-matching regex (zoals degene in de oefening), zie dit.
# Example:
import re
pattern = re.compile(r"\[(on|off)\]") # Slight optimization
print(re.search(pattern, "Mono: Playback 65 [75%] [-16.50dB] [on]"))
# Returns a Match object!
print(re.search(pattern, "Nada...:-("))
# Doesn't return anything.
# End Example
# Exercise: make a regular expression that will match an email
def test_email(your_pattern):
pattern = re.compile(your_pattern)
emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"]
for email in emails:
if not re.match(pattern, email):
print("You failed to match %s" % (email))
elif not your_pattern:
print("Forgot to enter a pattern!")
else:
print("Pass")
pattern = r"" # Your pattern here!
test_email(pattern)
# Exercise: make a regular expression that will match an email
import re
def test_email(your_pattern):
pattern = re.compile(your_pattern)
emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"]
for email in emails:
if not re.match(pattern, email):
print("You failed to match %s" % (email))
elif not your_pattern:
print("Forgot to enter a pattern!")
else:
print("Pass")
# Your pattern here!
pattern = r"\"?([-a-zA-Z0-9.`?{}]+@\w+\.\w+)\"?"
test_email(pattern)
test_output_contains("Pass")
success_msg("Great work!")
This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join over a million other learners and get started learning Python for data science today!