Get started learning Python with DataCamp's free Intro to Python tutorial. Learn Data Science by completing interactive coding challenges and watching videos by expert instructors. Start Now!
This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join 11 million other learners and get started learning Python for data science today!
Good news! You can save 25% off your Datacamp annual subscription with the code LEARNPYTHON23ALE25 - Click here to redeem your discount
Säännölliset lausekkeet
Regular Expressions (joskus lyhennettynä regexp, regex tai re) ovat työkalu kuvioiden tunnistamiseen tekstissä. Pythonissa käytössämme on re-moduuli. Säännöllisten lausekkeiden sovelluksia on laajasti, mutta ne ovat melko monimutkaisia, joten, kun harkitset regexin käyttämistä tiettyyn tehtävään, ajattele vaihtoehtoja ja turvaudu regexiin vasta viimeisenä keinona.
Esimerkki regexistä on r"^(From|To|Cc).*[email protected]"
Selitys:
Hohtimerkki ^
vastaa tekstin alussa olevaa kohtaa. Seuraava
ryhmä, osa, jossa on (From|To|Cc)
, tarkoittaa, että rivin on alettava
jollakin sanoista, jotka on erotettu putki-merkillä |
. Sitä kutsutaan
JOKO-operaattoriksi, ja regex vastaa, jos rivi alkaa jollakin
ryhmän sanoista. .*?
tarkoittaa epäahneesti yhden tai useamman
merkin, pois lukien rivinvaihdon \n
merkin. Epäahneas
osuus tarkoittaa mahdollisimman vähäisten toistojen täsmäämistä. .
merkki
tarkoittaa mitä tahansa ei-rivinvaihtomerkkiä, *
tarkoittaa toistamista 0 tai enemmän
kertoja, ja ?
merkki tekee siitä epäahneen.
Joten seuraavat rivit vastaisivat sitä regexiä:
From: [email protected]
To: !asp]<,. [email protected]
Kattava viite re-syntaksista on saatavilla python docs.
Esimerkki "asianmukaisesta" sähköpostin täsmäävästä regexistä (kuten harjoituksessa), katso tämä
# Example:
import re
pattern = re.compile(r"\[(on|off)\]") # Slight optimization
print(re.search(pattern, "Mono: Playback 65 [75%] [-16.50dB] [on]"))
# Returns a Match object!
print(re.search(pattern, "Nada...:-("))
# Doesn't return anything.
# End Example
# Exercise: make a regular expression that will match an email
def test_email(your_pattern):
pattern = re.compile(your_pattern)
emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"]
for email in emails:
if not re.match(pattern, email):
print("You failed to match %s" % (email))
elif not your_pattern:
print("Forgot to enter a pattern!")
else:
print("Pass")
pattern = r"" # Your pattern here!
test_email(pattern)
# Exercise: make a regular expression that will match an email
import re
def test_email(your_pattern):
pattern = re.compile(your_pattern)
emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"]
for email in emails:
if not re.match(pattern, email):
print("You failed to match %s" % (email))
elif not your_pattern:
print("Forgot to enter a pattern!")
else:
print("Pass")
# Your pattern here!
pattern = r"\"?([-a-zA-Z0-9.`?{}]+@\w+\.\w+)\"?"
test_email(pattern)
test_output_contains("Pass")
success_msg("Great work!")
This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join over a million other learners and get started learning Python for data science today!