Page 89 - python
P. 89
63
Meta Character ความหมาย ตัวอยาง
{m,n} ระบุจํานวนการซ้ํามีเงื่อนไข "1{2,4}" เชน 11 111 1111
\w ตัวอักษร \wาร เชน การ ขาน คาน aาร bาร cาร ฯลฯ
ตัวอยางที่ 5.28 การสกัดอีเมลออกจากเอกสารดวย Regular Expression
s = """ในเอกสารนี้มีอีเมลประกอบดวย chakkrit@gmail.com และ kritsawan@yahoo.com และมี
เพมอีกหนึ่งรายชื่อ คือ woravit@chaiyo.com ขอขอบคุณ"""
ิ่
from re import findall
findall("\w+@\w+\.\w+", s)
ผลลัพธ :
['chakkrit@gmail.com', 'kritsawan@yahoo.com', 'woravit@chaiyo.com']
ตัวอยางที่ 5.28 ขอใชคําสั่ง findall() ภายในโมดูล re ดวยคําสั่ง from re import findall
เรียกใชคําสั่ง findall("\w+@\w+\.\w+",s) เมื่อตัวแปร s เปนขอมูลชนิดสตริง ผลลัพธจะสกัดเอารายชื่อ
อีเมลออกมาได ไดดังนี้ ['chakkrit@gmail.com', 'kritsawan@yahoo.com', 'woravit@chaiyo.com']
5.27 การอานขอมูลจาก Wikipedia เก็บไวในตัวแปรสตริง
ไลบรารี่ wikipedia-API ใชสําหรับสกดขอความ , สวนตาง ๆ ในหนาวิก, ลิงค, หมวดหม
ั
ิ
ู
ื่
(category), การแปลเนื้อหาภาษาอน ๆ จากเอกสารวิกพเดีย มีวิธีการใชงานดังนี้ การติดตั้ง ใชคําสั่ง
ี
ิ
ตอไปนี้
!sudo pip install wikipedia
!sudo pip install wikipedia-api
ตัวอยางที่ 5.29 การอานขอมูลจาก Wikipedia เก็บไวในตัวแปรสตริง
import wikipedia as wiki
wiki.set_lang("th")
s = wiki.summary("โลก", sentences=1)
print(s)
ผลลัพธ :
โลก (บาลี: loka; อังกฤษ: world) มีความหมายโดยปริยายหมายถึงหมูมนุษย รวมทั้งอารยธรรมมนุษย
โดยรวมทั้งหมด โดยเฉพาะในดานประสบการณ ประวัติศาสตร หรือสภาพของมนุษยโดยทั่ว ๆ ไป ทั้งนี้
คําวา ทั่วโลก หมายถึงสถานที่ใด ๆ บนดาวเคราะหโลกในทางปรัชญามองโลกอยู 2 แบบ
ตัวอยางที่ 5.29 เปนการสืบคนคําวา "โลก" จาก wikipedia ผลลัพธจะแสดงดังตัวอยางดานบน
โดยที่การใชงานจะตองเชื่อมตออินเตอรเน็ตเนื่องจากเปนการรองขอขอมูลจากแมขายของ wikipedia