Page 145 - python
P. 145

119




                                                              ิ
                          1.  ขั้นการเตรียมขอมูล ดาวนโหลดราชกจานุเบกษาวาดวยเรื่องงบประมาณรายจายประจําป
                              ของประเทศไทย ไดที่ลิงค
                               http://dsdi.msu.ac.th/programming/th_budget/2564.pdf
                          2.  แปลง pdf เปน text ผานเว็บ เชน https://avepdf.com/pdf-to-text นําไฟลงบประมาณ
                                                                          
                              รายจายประจําปเขาเว็บดังกลาว จากนั้นแปลงเปนเท็กซไฟลและนําเท็กซไฟลที่ไดมา
                              ประมวลผลเพื่อสกัดงบประมาณของแตละจังหวัดออกมา
                          3.  เขียนโปรแกรมสกัดขอมูลการตั้งงบประมาณประจําป 2564 ดังนี้

                   ตัวอยางที่ 10.9 การเขียนโปรแกรมสกัดขอมูลหมวดงบประมาณรายจายประจําป 2564

                    t= open("2564.txt","r",encoding='utf-8').read()
                    nt = "๑๒๓๔๕๖๗๘๙๐"
                    ne = "1234567890"
                    for i in range(len(nt)):

                        t = t.replace(nt[i],ne[i])

                    for i in range(100):

                        t = t.replace("  "," ")

                    t = t.replace(" า","ำ") ; t = t.replace(" คือ ","")
                    tmp = t.split("\n")
                    z = []


                    for i in tmp:
                                                          
                        if ("ราชกิจจานุเบกษา" not in i) and ("หนา" not in i) and (len(i.strip()) > 4):
                            z.append(i.strip())
                    tmp = "".join(z).replace("\n","")
                    tmp = tmp.split(" บาท")
                    for i in tmp:

                        if "."  in i:
                            print("\n%s บาท"%(i))
                        else:
                            print("%s บาท"%(i))


                   ผลลัพธ
   140   141   142   143   144   145   146   147   148   149   150