Page 89 - python
P. 89

63




                     Meta Character           ความหมาย                            ตัวอยาง

                          {m,n}        ระบุจํานวนการซ้ํามีเงื่อนไข   "1{2,4}" เชน 11 111 1111
                           \w          ตัวอักษร                   \wาร เชน การ ขาน คาน aาร bาร cาร ฯลฯ


                   ตัวอยางที่ 5.28 การสกัดอีเมลออกจากเอกสารดวย Regular Expression
                    s = """ในเอกสารนี้มีอีเมลประกอบดวย chakkrit@gmail.com และ kritsawan@yahoo.com และมี
                    เพมอีกหนึ่งรายชื่อ คือ woravit@chaiyo.com ขอขอบคุณ"""
                      ิ่
                    from re import findall

                    findall("\w+@\w+\.\w+", s)

                   ผลลัพธ :

                    ['chakkrit@gmail.com', 'kritsawan@yahoo.com', 'woravit@chaiyo.com']
                          ตัวอยางที่ 5.28 ขอใชคําสั่ง findall() ภายในโมดูล re ดวยคําสั่ง from re import findall
                   เรียกใชคําสั่ง findall("\w+@\w+\.\w+",s)  เมื่อตัวแปร s เปนขอมูลชนิดสตริง ผลลัพธจะสกัดเอารายชื่อ

                   อีเมลออกมาได ไดดังนี้  ['chakkrit@gmail.com', 'kritsawan@yahoo.com', 'woravit@chaiyo.com']

                   5.27 การอานขอมูลจาก Wikipedia เก็บไวในตัวแปรสตริง
                          ไลบรารี่ wikipedia-API ใชสําหรับสกดขอความ , สวนตาง ๆ ในหนาวิก, ลิงค, หมวดหม
                                                           ั
                                                                                           ิ
                                                                                                         ู
                                                 ื่
                   (category), การแปลเนื้อหาภาษาอน ๆ จากเอกสารวิกพเดีย มีวิธีการใชงานดังนี้ การติดตั้ง ใชคําสั่ง
                                                                    ี
                                                                   ิ
                   ตอไปนี้
                          !sudo pip install wikipedia
                          !sudo pip install wikipedia-api

                                         
                                      
                   ตัวอยางที่ 5.29 การอานขอมูลจาก Wikipedia เก็บไวในตัวแปรสตริง
                    import wikipedia as wiki
                    wiki.set_lang("th")

                    s = wiki.summary("โลก", sentences=1)
                    print(s)


                   ผลลัพธ :
                    โลก (บาลี: loka; อังกฤษ: world) มีความหมายโดยปริยายหมายถึงหมูมนุษย รวมทั้งอารยธรรมมนุษย
                    โดยรวมทั้งหมด โดยเฉพาะในดานประสบการณ ประวัติศาสตร หรือสภาพของมนุษยโดยทั่ว ๆ ไป ทั้งนี้
                    คําวา ทั่วโลก หมายถึงสถานที่ใด ๆ บนดาวเคราะหโลกในทางปรัชญามองโลกอยู 2 แบบ

                          ตัวอยางที่ 5.29 เปนการสืบคนคําวา "โลก" จาก wikipedia ผลลัพธจะแสดงดังตัวอยางดานบน
                                                                         
                   โดยที่การใชงานจะตองเชื่อมตออินเตอรเน็ตเนื่องจากเปนการรองขอขอมูลจากแมขายของ wikipedia
                                                                            
   84   85   86   87   88   89   90   91   92   93   94