Get started learning Python with DataCamp's free Intro to Python tutorial. Learn Data Science by completing interactive coding challenges and watching videos by expert instructors. Start Now!
This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join 11 million other learners and get started learning Python for data science today!
Good news! You can save 25% off your Datacamp annual subscription with the code LEARNPYTHON23ALE25 - Click here to redeem your discount
Reguljära uttryck
Inledning till vanliga uttryck --------
Regular Expressions (ibland förkortade till regexp, regex, eller re) är ett
verktyg för att matcha mönster i text. I Python har vi re-modulen. Användningsområdena för reguljära uttryck är vitt spridda, men de är ganska komplexa, så när du överväger att använda ett regex för en viss uppgift, tänk på alternativ och använd regex som en sista utväg.
Ett exempel på regex är r"^(From|To|Cc).*[email protected]"
Nu till en
förklaring:
karet ^
matchar text i början av en rad. Den följande
gruppen, delen med (From|To|Cc)
betyder att raden måste börja med
ett av orden som är åtskilda av röret |
. Det kallas
elleroperatorn, och regexet kommer att matcha om raden börjar med något
av orden i gruppen. .*?
betyder att ogirigt matcha valfritt
antal tecken, förutom radbrytningen \n
. Den ogiriga
delen betyder att matcha så få upprepningar som möjligt. .
-tecknet
betyder valfritt icke-radbrytande tecken, *
betyder att upprepa 0 eller fler
gånger, och ?
-tecknet gör det ogirigt.
Så, följande rader skulle matchas av det regex:
From: [email protected]
To: !asp]<,. [email protected]
En komplett referens för re-syntaxen finns tillgänglig i python docs.
Som ett exempel på en "korrekt" email-matchande regex (liknande den i övningen), se detta
# Example:
import re
pattern = re.compile(r"\[(on|off)\]") # Slight optimization
print(re.search(pattern, "Mono: Playback 65 [75%] [-16.50dB] [on]"))
# Returns a Match object!
print(re.search(pattern, "Nada...:-("))
# Doesn't return anything.
# End Example
# Exercise: make a regular expression that will match an email
def test_email(your_pattern):
pattern = re.compile(your_pattern)
emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"]
for email in emails:
if not re.match(pattern, email):
print("You failed to match %s" % (email))
elif not your_pattern:
print("Forgot to enter a pattern!")
else:
print("Pass")
pattern = r"" # Your pattern here!
test_email(pattern)
# Exercise: make a regular expression that will match an email
import re
def test_email(your_pattern):
pattern = re.compile(your_pattern)
emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"]
for email in emails:
if not re.match(pattern, email):
print("You failed to match %s" % (email))
elif not your_pattern:
print("Forgot to enter a pattern!")
else:
print("Pass")
# Your pattern here!
pattern = r"\"?([-a-zA-Z0-9.`?{}]+@\w+\.\w+)\"?"
test_email(pattern)
test_output_contains("Pass")
success_msg("Great work!")
This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join over a million other learners and get started learning Python for data science today!