Page 88 - python
P. 88
62
สรางขึ้นมาใชงานกับตัวแปร s ดวยคําสั่ง s.translate(table) ผลลัพธการใชตารางจับคูตัวอักษรของคําวา
"Information Science" คือ " Inf4rm1t34n Sc32nc2"
5.25 การตรวจสอบสตริง
ประกอบดวยคําสั่ง isalpha isascii isdecimal isdigit islower isnumeric isprintable isspace
istitle และ isupper
ตารางที่ 5.3 แสดงฟงกชั่นการตรวจสอบสตริงแบบตาง ๆ
คําสั่ง คําอธิบาย
"information Science".isalpha() เปนอักษร a-z A-Z หรือไม: False (เพราะมี space)
"Informåtion Science".isascii() เปนแอสก (ASCII) หรือไม:False (เพราะมี å)
ี้
"\u0033".isdecimal() เปนตัวเลข unicode 0-9 หรือไม: True
"1234567890".isdigit() เปนตัวเลข 0-9 หรือไมใชกับ unicode: True
"information science".islower() เปนตัวพิมพเล็กหรือไม: True
"84000".isnumeric() เปนตัวเลขหรือไม: True
"!@#$%^&*()".isprintable() เปนตัวที่พิมพไดหรือไม: True
"\t\n ".isspace() เปน space bar หรือไม: True
"Information Science".istitle() ตัวแรกของคําเปนตัวพิมพใหญหรือไม:True
"INFORMATION SCIENCE".isupper() เปนตัวพิมพใหญหรือไม: True
5.26 การสกดอีเมลออกจากเอกสารดวย Regular Expression
ั
Regular Expression คือ การตรวจจับคําที่มีรูปแบบ เชน อีเมล มีรูปแบบเปน อะไรก็ได@อะไรก็
ได.อะไรก็ได
ตารางที่ 5.4 แสดง Meta Charater ของ Regular Expression
Meta Character ความหมาย ตัวอยาง
| หรือ "คนไทย|ชาวไทย" เชน คนไทย ชาวไทย
. อักขระใด ๆ จํานวน 1 ตัว .าร เชน การ ขาน คาน aาร bาร cาร ฯลฯ
^ คําเริ่มตน ^พระ เชน พระจอมเกลา
$ คําสุดทาย เกลา$ เชน พระจอมเกลา
[ ] อักษรภายในกามปู "[bcr]at" เชน bat cat rat
- จาก .. ถึง .. "F[0-9]" เชน F0 F1 F2 … F9
* ซ้ําไดหลายครั้ง "01*" เชน 0 01 011 0111 ฯลฯ
้
ึ
่
ํ
+ ซ้าหนงครงขนไป "01+" เชน 01 011 0111 ฯลฯ
ึ
้
ั
? ซ้ําไดเพียง 1 ครั้ง "01?" เชน 0 01
{ } ระบุจํานวนการซ้ํา "1{4}" เชน 1111