Get started learning Python with DataCamp's free Intro to Python tutorial. Learn Data Science by completing interactive coding challenges and watching videos by expert instructors. Start Now!
This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join 11 million other learners and get started learning Python for data science today!
Good news! You can save 25% off your Datacamp annual subscription with the code LEARNPYTHON23ALE25 - Click here to redeem your discount
Regulære uttrykk
Regular Expressions (noen ganger forkortet til regexp, regex eller re) er et verktøy for å matche mønstre i tekst. I Python har vi re-modulen. Bruksområdene for regulære uttrykk er omfattende, men de er ganske komplekse, så når du vurderer å bruke et regex for en bestemt oppgave, tenk på alternativer, og bruk regex som siste utvei.
Et eksempel på regex er r"^(From|To|Cc).*[email protected]"
Nå følger en
forklaring:
caret ^
matcher tekst i begynnelsen av en linje. Den neste gruppen,
delen med (From|To|Cc)
betyr at linjen må starte med ett av ordene som er
separert med pipen |
. Det kalles OR-operatøren, og regexen vil matche
hvis linjen starter med et av ordene i gruppen. .*?
betyr å u-grådig matche
et hvilket som helst antall tegn, unntatt linjeskift \n
-tegnet. Den u-grådige
delen betyr å matche så få repetisjoner som mulig. Tegnet .
betyr ethvert tegn
som ikke er linjeskift, *
betyr å gjenta 0 eller flere ganger, og tegnet ?
gjør det u-grådig.
Så, følgende linjer ville blitt matchet av det regexet:
From: [email protected]
To: !asp]<,. [email protected]
En fullstendig referanse for re-syntaks finnes på python docs.
Som et eksempel på en "ordentlig" e-post-mat som regex (som den i øvelsen), se denne
# Example:
import re
pattern = re.compile(r"\[(on|off)\]") # Slight optimization
print(re.search(pattern, "Mono: Playback 65 [75%] [-16.50dB] [on]"))
# Returns a Match object!
print(re.search(pattern, "Nada...:-("))
# Doesn't return anything.
# End Example
# Exercise: make a regular expression that will match an email
def test_email(your_pattern):
pattern = re.compile(your_pattern)
emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"]
for email in emails:
if not re.match(pattern, email):
print("You failed to match %s" % (email))
elif not your_pattern:
print("Forgot to enter a pattern!")
else:
print("Pass")
pattern = r"" # Your pattern here!
test_email(pattern)
# Exercise: make a regular expression that will match an email
import re
def test_email(your_pattern):
pattern = re.compile(your_pattern)
emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"]
for email in emails:
if not re.match(pattern, email):
print("You failed to match %s" % (email))
elif not your_pattern:
print("Forgot to enter a pattern!")
else:
print("Pass")
# Your pattern here!
pattern = r"\"?([-a-zA-Z0-9.`?{}]+@\w+\.\w+)\"?"
test_email(pattern)
test_output_contains("Pass")
success_msg("Great work!")
This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join over a million other learners and get started learning Python for data science today!