Get started learning Python with DataCamp's free Intro to Python tutorial. Learn Data Science by completing interactive coding challenges and watching videos by expert instructors. Start Now!
This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join 11 million other learners and get started learning Python for data science today!
Good news! You can save 25% off your Datacamp annual subscription with the code LEARNPYTHON23ALE25 - Click here to redeem your discount
Regular Expressions (บางครั้งย่อว่า regexp, regex, หรือ re) เป็นเครื่องมือในการจับคู่รูปแบบในข้อความ ใน Python, เรามีโมดูล re การใช้งาน regular expressions นั้นแพร่หลาย แต่มักจะซับซ้อน ดังนั้นเมื่อคิดจะใช้ regex สำหรับงานบางอย่าง ให้พิจารณาทางเลือกอื่นก่อน แล้วใช้ regex เป็นตัวเลือกสุดท้าย
ตัวอย่างหนึ่งของ regex คือ r"^(From|To|Cc).*[email protected]"
เครื่องหมาย ^
จับคู่ข้อความที่จุดเริ่มต้นของบรรทัด กลุ่มต่อไป (From|To|Cc)
หมายถึงว่าบรรทัดต้องเริ่มด้วยหนึ่งในคำที่แยกด้วยเครื่องหมาย pipe |
ซึ่งเรียกว่าโอเปอเรเตอร์ OR และ regex จะจับคู่ถ้าบรรทัดเริ่มด้วยคำใด ๆ ในกลุ่มนั้น .*?
หมายถึงการจับคู่ตัวอักษรใด ๆ ยกเว้นตัวอักษร newline \n
แบบไม่ตะกละ ส่วนแบบไม่ตะกละนั้นหมายถึงการจับคู่จำนวนครั้งให้น้อยที่สุด ตัวอักษร .
หมายถึงตัวอักษรใด ๆ ที่ไม่ใช่ newline *
หมายถึงการทำซ้ำ 0 ครั้งหรือมากกว่า และตัวอักษร ?
ดังนั้น บรรทัดต่อไปนี้จะถูกจับคู่ด้วย regex ดังกล่าว:
From: [email protected]
To: !asp]<,. [email protected]
การอ้างอิงทั้งหมดสำหรับไวยากรณ์ re มีอยู่ที่ python docs
ตัวอย่างของ regex ในการจับคู่ email ที่ "เหมาะสม" (เหมือนกับตัวอย่างในแบบฝึกหัด), ดูที่ this
# Example:
import re
pattern = re.compile(r"\[(on|off)\]") # Slight optimization
print(, "Mono: Playback 65 [75%] [-16.50dB] [on]"))
# Returns a Match object!
print(, "Nada...:-("))
# Doesn't return anything.
# End Example
# Exercise: make a regular expression that will match an email
def test_email(your_pattern):
pattern = re.compile(your_pattern)
emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"]
for email in emails:
if not re.match(pattern, email):
print("You failed to match %s" % (email))
elif not your_pattern:
print("Forgot to enter a pattern!")
pattern = r"" # Your pattern here!
# Exercise: make a regular expression that will match an email
import re
def test_email(your_pattern):
pattern = re.compile(your_pattern)
emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"]
for email in emails:
if not re.match(pattern, email):
print("You failed to match %s" % (email))
elif not your_pattern:
print("Forgot to enter a pattern!")
# Your pattern here!
pattern = r"\"?([-a-zA-Z0-9.`?{}]+@\w+\.\w+)\"?"
success_msg("Great work!")
This site is generously supported by DataCamp. DataCamp offers online interactive Python Tutorials for Data Science. Join over a million other learners and get started learning Python for data science today!