Get started learning Python with DataCamp's free Intro to Python tutorial. Learn Data Science by completing interactive coding challenges and watching videos by expert instructors. Start Now!

This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join 11 million other learners and get started learning Python for data science today!

Good news! You can save 25% off your Datacamp annual subscription with the code LEARNPYTHON23ALE25 - Click here to redeem your discount

Reguljära uttryck


Inledning till vanliga uttryck --------

Regular Expressions (ibland förkortade till regexp, regex, eller re) är ett

verktyg för att matcha mönster i text. I Python har vi re-modulen. Användningsområdena för reguljära uttryck är vitt spridda, men de är ganska komplexa, så när du överväger att använda ett regex för en viss uppgift, tänk på alternativ och använd regex som en sista utväg.

Ett exempel på regex är r"^(From|To|Cc).*[email protected]" Nu till en förklaring: karet ^ matchar text i början av en rad. Den följande gruppen, delen med (From|To|Cc) betyder att raden måste börja med ett av orden som är åtskilda av röret |. Det kallas elleroperatorn, och regexet kommer att matcha om raden börjar med något av orden i gruppen. .*? betyder att ogirigt matcha valfritt antal tecken, förutom radbrytningen \n. Den ogiriga delen betyder att matcha så få upprepningar som möjligt. .-tecknet betyder valfritt icke-radbrytande tecken, * betyder att upprepa 0 eller fler gånger, och ?-tecknet gör det ogirigt.

Så, följande rader skulle matchas av det regex: From: [email protected] To: !asp]<,. [email protected]

En komplett referens för re-syntaxen finns tillgänglig i python docs.

Som ett exempel på en "korrekt" email-matchande regex (liknande den i övningen), se detta

# Example: import re pattern = re.compile(r"\[(on|off)\]") # Slight optimization print(re.search(pattern, "Mono: Playback 65 [75%] [-16.50dB] [on]")) # Returns a Match object! print(re.search(pattern, "Nada...:-(")) # Doesn't return anything. # End Example # Exercise: make a regular expression that will match an email def test_email(your_pattern): pattern = re.compile(your_pattern) emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"] for email in emails: if not re.match(pattern, email): print("You failed to match %s" % (email)) elif not your_pattern: print("Forgot to enter a pattern!") else: print("Pass") pattern = r"" # Your pattern here! test_email(pattern) # Exercise: make a regular expression that will match an email import re def test_email(your_pattern): pattern = re.compile(your_pattern) emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"] for email in emails: if not re.match(pattern, email): print("You failed to match %s" % (email)) elif not your_pattern: print("Forgot to enter a pattern!") else: print("Pass") # Your pattern here! pattern = r"\"?([-a-zA-Z0-9.`?{}]+@\w+\.\w+)\"?" test_email(pattern) test_output_contains("Pass") success_msg("Great work!")

This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join over a million other learners and get started learning Python for data science today!

Previous Tutorial Next Tutorial Take the Test
Copyright © learnpython.org. Read our Terms of Use and Privacy Policy