Get started learning Python with DataCamp's free Intro to Python tutorial. Learn Data Science by completing interactive coding challenges and watching videos by expert instructors. Start Now!
This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join 11 million other learners and get started learning Python for data science today!
Good news! You can save 25% off your Datacamp annual subscription with the code LEARNPYTHON23ALE25 - Click here to redeem your discount
Expressões Regulares
Regular Expressions (às vezes abreviadas para regexp, regex ou re) são uma ferramenta para correspondência de padrões em texto. Em Python, temos o módulo re. As aplicações para expressões regulares são amplamente difundidas, mas são bastante complexas, então, ao considerar o uso de uma regex para uma determinada tarefa, pense sobre alternativas e recorra a regexes como último recurso.
Um exemplo de regex é r"^(From|To|Cc).*[email protected]"
. Agora, para uma explicação: o acento circunflexo ^
corresponde ao texto no início de uma linha. O grupo seguinte, a parte com (From|To|Cc)
, significa que a linha deve começar com uma das palavras separadas pelo pipe |
. Isso é chamado de operador OR, e a regex corresponderá se a linha começar com qualquer uma das palavras do grupo. O .*?
significa corresponder de modo não ganancioso a qualquer número de caracteres, exceto o caractere de nova linha \n
. A parte não gananciosa significa que deve corresponder ao menor número possível de repetições. O caractere .
significa qualquer caractere que não seja nova linha, o *
significa repetir 0 ou mais vezes, e o caractere ?
o torna não ganancioso.
Portanto, as linhas a seguir seriam correspondidas por essa regex:
From: [email protected]
To: !asp]<,. [email protected]
Uma referência completa para a sintaxe re está disponível nos docs do python.
Como exemplo de uma regex "adequada" para correspondência de emails (como a do exercício), veja este.
# Example:
import re
pattern = re.compile(r"\[(on|off)\]") # Slight optimization
print(re.search(pattern, "Mono: Playback 65 [75%] [-16.50dB] [on]"))
# Returns a Match object!
print(re.search(pattern, "Nada...:-("))
# Doesn't return anything.
# End Example
# Exercise: make a regular expression that will match an email
def test_email(your_pattern):
pattern = re.compile(your_pattern)
emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"]
for email in emails:
if not re.match(pattern, email):
print("You failed to match %s" % (email))
elif not your_pattern:
print("Forgot to enter a pattern!")
else:
print("Pass")
pattern = r"" # Your pattern here!
test_email(pattern)
# Exercise: make a regular expression that will match an email
import re
def test_email(your_pattern):
pattern = re.compile(your_pattern)
emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"]
for email in emails:
if not re.match(pattern, email):
print("You failed to match %s" % (email))
elif not your_pattern:
print("Forgot to enter a pattern!")
else:
print("Pass")
# Your pattern here!
pattern = r"\"?([-a-zA-Z0-9.`?{}]+@\w+\.\w+)\"?"
test_email(pattern)
test_output_contains("Pass")
success_msg("Great work!")
This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join over a million other learners and get started learning Python for data science today!