Page 88 - python
P. 88

62




                   สรางขึ้นมาใชงานกับตัวแปร s ดวยคําสั่ง s.translate(table) ผลลัพธการใชตารางจับคูตัวอักษรของคําวา

                   "Information Science" คือ " Inf4rm1t34n Sc32nc2"

                   5.25 การตรวจสอบสตริง
                          ประกอบดวยคําสั่ง isalpha isascii isdecimal isdigit islower isnumeric isprintable isspace

                   istitle และ isupper

                   ตารางที่ 5.3 แสดงฟงกชั่นการตรวจสอบสตริงแบบตาง ๆ

                                    คําสั่ง                                  คําอธิบาย
                    "information Science".isalpha()       เปนอักษร a-z A-Z หรือไม: False (เพราะมี space)
                    "Informåtion Science".isascii()       เปนแอสก (ASCII) หรือไม:False (เพราะมี å)
                                                                  ี้
                    "\u0033".isdecimal()                  เปนตัวเลข unicode 0-9 หรือไม: True

                    "1234567890".isdigit()                เปนตัวเลข 0-9 หรือไมใชกับ unicode: True
                                                                            
                    "information science".islower()       เปนตัวพิมพเล็กหรือไม: True
                    "84000".isnumeric()                   เปนตัวเลขหรือไม: True

                    "!@#$%^&*()".isprintable()            เปนตัวที่พิมพไดหรือไม: True
                                                                             
                    "\t\n ".isspace()                     เปน space bar หรือไม: True
                    "Information Science".istitle()       ตัวแรกของคําเปนตัวพิมพใหญหรือไม:True
                                                                                         
                    "INFORMATION SCIENCE".isupper()       เปนตัวพิมพใหญหรือไม: True

                                    
                   5.26 การสกดอีเมลออกจากเอกสารดวย Regular Expression
                              ั
                          Regular Expression คือ การตรวจจับคําที่มีรูปแบบ เชน อีเมล มีรูปแบบเปน อะไรก็ได@อะไรก็
                   ได.อะไรก็ได

                   ตารางที่ 5.4 แสดง Meta Charater ของ Regular Expression

                     Meta Character           ความหมาย                            ตัวอยาง
                            |          หรือ                       "คนไทย|ชาวไทย" เชน คนไทย ชาวไทย
                            .          อักขระใด ๆ จํานวน 1 ตัว    .าร เชน การ ขาน คาน aาร bาร cาร ฯลฯ

                            ^          คําเริ่มตน                ^พระ เชน พระจอมเกลา
                            $          คําสุดทาย                 เกลา$ เชน พระจอมเกลา
                           [ ]         อักษรภายในกามปู           "[bcr]at" เชน bat cat rat
                            -          จาก .. ถึง ..              "F[0-9]" เชน F0 F1 F2 … F9

                            *          ซ้ําไดหลายครั้ง           "01*" เชน 0 01 011 0111 ฯลฯ
                                                 ้
                                                 ึ
                                                                         
                                            ่
                                        ํ
                            +          ซ้าหนงครงขนไป              "01+" เชน 01 011 0111 ฯลฯ
                                            ึ
                                               ้
                                               ั
                            ?          ซ้ําไดเพียง 1 ครั้ง       "01?" เชน 0 01
                           { }         ระบุจํานวนการซ้ํา          "1{4}" เชน 1111
   83   84   85   86   87   88   89   90   91   92   93