ส่วนประกอบของข้อมูล XML

หัวข้อพิเศษไอที, XML No Comments »

     XML เป็นการทำงานในระดับกลาง middle tier ที่สามารถเรียกใช้ฐานข้อมูลได้หลากหลายระบบฐานข้อมูลและโอนข้อมูลให้อยู่ในรูปแบบของ XML และมีการให้รายละเอียดเกี่ยวกับตัวข้อมูล โครงสร้างต่างๆ ของระบบฐานข้อมูลได้ XML เป็นระบบเปิดที่นำเสนอข้อมูลในรูปแบบ text ผ่านทาง HTTP เหมือนกับ HTML แต่จะมีคุณสมบัติในการให้ข้อมูลแบบ real time อัพเดทหรือเปลี่ยนแปลงได้ตามข้อกำหนด การแสดงข้อมูลจาก XML ใน HTML จะเป็นการเพิ่มในส่วนของรายละเอียดข้อมูล ที่มีการเรียกใช้จากแหล่งหรือฐานข้อมูลที่เชื่อมโยงกันในหลายแหล่ง เพื่อให้ HTML มีความสมบูรณ์มากขึ้น
ในอนาคตการพัฒนาเว็บหรือการเขียนและสร้าง HTML ไม่จำเป็นต้องมีการเขียนชุดคำสั่งที่ยุ่งยากซับซ้อนมากก็สามารถทำงานร่วมกับระบบข้อมูลได้อย่างมีประสิทธิภาพ XML จะทำการกำหนดค่าสำหรับโครงสร้างข้อมูลที่จะนำไปแสดงใน HTML นอกจากนั้นยังสามารถนำไปสนับสนุนระบบการแลกเปลี่ยนข้อมูลข่าวสารทาง Electronic ได้อย่างดีอีกด้วย

สถาปัตยกรรม XML

หัวข้อพิเศษไอที, XML No Comments »

ภาษา XML ได้รับการสนับสนุนจาก W3C ให้นักพัฒนาเว็บแอพพลิเคชันได้หันมาใช้เป็นส่วนประกอบของการพัฒนาเว็บไซต์ เพราะ XML มีประสิทธิภาพและมีความน่าเชื่อสูงในการแปลงข้อมูลและโครงสร้างข้อมูลให้สามารถนำไปใช้งาน สถาปัตยกรรม 3 Tiered ที่ XML สามารถสร้างขึ้นจากระบบข้อมูลที่ใช้โมเดลของ 3-tier โครงสร้าง ของข้อมูลต่างๆ สามารถนำมาแสดงตามข้อกำหนด หรือรูปแบบที่ต้องการตามการใช้งานได้ (ดูภาพประกอบ) เราจะเห็นโครงสร้างทางสถาปัตยกรรมของ XML ที่ยืดหยุ่นเหมาะกับการพัฒนาร่วมกับเว็บแอพพลิเคชั่น

Well-formed & valid

หัวข้อพิเศษไอที, XML No Comments »

ศัพท์ 2 คำนี้จะใช้ตรวจสอบว่า เอกสาร XML ที่เราเขียนขึ้นนั้น ถูกต้องหรือไม่

รูปข้างบน เป็นตัวอย่างการ เช็คว่าเราเขียนถูกต้องหรือไม่โดยใช้โปรแกรม EditML Pro 2.1.1 ถ้าถูกต้อง จะต้องประกอบด้วย 2 ประการคือ

1. เอกสาร xml นั้น tag ต่างๆ ต้องมีรูปแบบที่ถูกต้องเช่น ขึ้นต้น tag ด้วยตัวเล็กต้องจบ tag ด้วยตัวเล็กเป็นต้น และ หากมี tag เปิดต้องมี tag ปิดเสมอ เช่น

untitled13.bmp

แบบนี้เราจะเรียกว่า well-formed คือ โครงสร้างถูกต้องทั้งหมด

2. เอกสาร xml นั้น ต้องเป็นไปตามกฎของ DTD ของเอกสารนั้นๆ ด้วยจึงจะเรียกได้ว่า valid

เราลองเพิ่ม code เพื่ออ้างอิง DTD กัน จะได้เป็น  untitled14.bmp

สรุปคือ สำหรับเอกสารที่มีรูปแบบ well-formed คือเอกสาร XML ที่สร้างถูกต้อง แต่หากต้องการให้เกิดบังคับโครงสร้างแล้ว มักนิยมสร้างเอกสาร XML โดยการอาศัย DTD มาช่วย

 

 

กฎและคำศัพท์ที่เกี่ยวข้องของ XML

หัวข้อพิเศษไอที, XML No Comments »

อันดับแรกการที่เราจะใช้งาน XML นั้น เราต้องอาศัยส่วนของการอ้างอิงความหมาย ที่เรียกว่า DTD (Document Type Definition) ในการกำหนดลักษณะและส่วนประกอบต่างๆ ของ element เรียกง่ายๆ ว่าเป็น grammar ของภาษา XML นั่นแหละ ซึ่ง DTD นี้เราสามารถเขียนขึ้นมาใช้เองได้ง่ายๆ หรือ ถ้ามีความซับซ้อนมากๆ ของเอกสาร XML เราอาจจะใช้ DTD ที่มีผู้เขียนไว้แล้วสำหรับเอกสารเฉพาะอย่าง ใช้ก็ได้

 

การประยุกต์ใช้ XML

หัวข้อพิเศษไอที, XML No Comments »

ตัวอย่างการประยุกต์ใช้งาน XML ตัวอย่างแรก ของเอกสาร XML

untitled10.bmp

จากรูปเป็น ไวยากรณ์ที่ถูกใช้ใน XML เมื่อเปรียบเทียบตัวอย่างนี้กับเอกสารที่เห็นในส่วนต้นของบทความ สำหรับโครงสร้างของหนังสือ โดยเปรียบเทียบที่ละส่วน โดยพิจารณาที่ส่วนของ element (สังเกตกลุ่ม element จากสัญลักษณ์ จนถึง ) ดังนั้นโครงสร้างของ XML จะมี element เป็นส่วนประกอบ ใช้กำหนดโครงสร้างของเอกสาร

ตัวอย่างถัดไปด้านล่าง เป็นการปรับปรุงตัวอย่าง XML ก่อนหน้าที่มี element อยู่ โดยเพิ่มส่วนที่เรียกว่าattribute ลงใน element คือตัวเลขบอกเลขที่ของบท โดยชื่อ attribute ใช้คำว่า number และ ตามด้วยตัวเลขบอกความหมายของบท

untitled11.bmp

ตัวอย่างของคำสั่ง สำหรับการกำหนด โครงสร้างสำหรับหนังสือuntitled12.bmp

จากตัวอย่างโครงสร้าง เมื่อพิจารณาจะเห็นได้ว่า มีรูปแบบของจำนวนบทอยู่ 2 บท ในแต่ละบทมีข้อความอยู่บางส่วน เช่น บทที่ 1 มีข้อความ Text for Chapter 1 ที่อยู่ระหว่าง element chap จะมี attribute ชื่อ number โดยบทที่ 1 ใช้ number=”1″ เป็นข้อมูลของ attribute

ภาษาสำหรับจัดการโครงสร้างเอกสาร XML

หัวข้อพิเศษไอที, XML No Comments »

XML พยายามลดข้อจำกัดของความแตกต่าง ทางด้านระบบคอมพิวเตอร์ เพื่อสร้างเป็นภาษาที่ใช้กำหนดโครงสร้างของเอกสาร ให้สามารถเข้าใจกันได้ในทุก ๆ ระบบ XML คือภาษาที่มีลักษณะเมต้า (meta language)

เมต้า หมายถึงรูปแบบการรวบรวมข้อมูลข่าวสาร ที่นำมาจากแหล่งข้อมูลข่าวสารอื่นๆ เช่น บทอ้างอิงในหนังสือสามารถบอกผู้อ่านได้ ถ้าถูกรวบรวมเนื้อหาไว้ด้วย XML ผู้อ่านจะสามารถรู้ว่าหัวข้อที่ตัวเองสนใจ จะไปอยู่ที่หน้าที่เท่าไหร่ของหนังสือ ซึ่งเมื่อเปิดไปยังหน้าดังกล่าวแล้ว จะได้รับข้อมูลที่อ้างไปถึงจากหัวข้อในบทอ้างอิงนั่นเอง ดังนั้นแต่ละหัวข้อในบทอ้างอิงจึงเป็น ข้อมูล ที่ได้รวบรวมมาจากข้อมูลในเนื้อหา บทอ้างอิงจะสามารถบอกข้อมูลเกี่ยวกับ element (elements) และแอตทริบิวต์ (attributes) ซึ่งจะมีเนื้อหาต่อไปได้ เราจึงใช้ XML เป็นภาษาเมต้า

วัตถุประสงค์หลักของ XML

หัวข้อพิเศษไอที, XML No Comments »

ความหมายของ XML ก่อนหน้านี้ ได้บอกเอาไว้ว่า “จุดประสงค์หลักของ XML คือการแยกส่วน ข้อมูลเพื่อประโยชน์ในการแสดงผล” นั่นคือ เอกสาร XML ใช้สำหรับควบคุม ตัวอักษร (plain text) โดยยึดเอาข้อมูลที่มีใจความเหมือนกัน แต่สามารถนำเอาไปแสดงผล ให้ผู้ใช้หรือผู้อ่านหลายคนได้รับรู้ข้อมูลใจความเดียวกัน เมื่อมองผ่านอุปกรณ์แสดงผลลัพธ์ที่ต่างกัน ซึ่งลักษณะเหล่านี้ ไม่เกิดขึ้นจริงกับ เอกสารประเภทประมวลผลคำอื่นๆ word processing หลากหลายคอมพิวเตอร์และหลากหลายระบบปฏิบัติการ นี้ไม่ใช้สิ่งที่ควรจะละเลยได้เลย เห็นได้ชัดว่าหลายๆปีที่ผ่านมา คอมพิวเตอร์หลากหลายชนิดถูกผลิตออกมาเป็นจำนวนมาก เพื่อใช้งาน รวมถึงระบบปฏิบัติการ(Operation System) ก็ยังมีความแตกต่างกันออกไปด้วย นั่นคือคอมพิวเตอร์รุ่นใหม่ๆจึงมีความหลากหลาย และยุ่งยากในการทำให้เข้าใจข้อมูลเดียวกัน ซึ่งเปรียบแล้วเหมือนกับภาษามนุษย์ที่ใช้สื่อสารกัน มีมากมายหลายร้อยภาษา

W3C ได้กล่าวถึงจุดมุ่งหมายหลักไว้ 10 หัวข้อ ดังนี้

1. XML มีการใช้งานโดยตรงบนเครือข่าย Internet, XML จะถูกออกแบบมาสำหรับจัดเก็บและจัดส่งข้อมูลบนเว็บ

2. XML มีการสนับสนุนโปรแกรมที่หลากหลาย, ถึงแม้ว่าวัตถุประสงค์ที่สำคัญคือ การจัดส่งข้อมูลบนเว็บผ่านทางเซิร์ฟเวอร์และโปรแกรมเบราวเซอร์ XML จะถูกออกแบบมาเพื่อใช้กับโปรแกรมที่มีรูปแบบต่าง ๆ ตัวอย่างเช่น การแลกเปลี่ยนข้อมูลระหว่างโปรแกรมทางด้านการเงิน การเผยแพร่และปรับปรุงโปรแกรมให้ทันสมัยและการเขียน Voice Script ให้สื่อสารได้ด้วยโทรศัพท์

3. XML จะต้องเข้ากันได้กับ SGML

4. XML จะต้องง่ายต่อการเขียนโปรแกรมเพื่อประมวลผลเอกสาร

5. จำนวนของทางเลือกเฉพาะของ XML ควรมีจำนวนน้อยที่สุดหรือไม่ควรมีเลย

6. เอกสาร XML จะต้องอ่านเข้าใจง่ายและมีความชัดเจน

7. XML ออกแบบมาเพื่อให้พัฒนาโปรแกรมได้อย่างรวดเร็ว

8. การออกแบบ XML ต้องมีรูปแบบที่เหมาะสมและกะทัดรัด

9. สามารถสร้างเอกสาร XML ได้ง่าย

10. Markup ของ XML ต้องไม่รวบรัดมากเกินไป

ส่วนประกอบของ XML (ต่อ)

หัวข้อพิเศษไอที, XML No Comments »

Content

เนื้อความ หรือ Content ถือได้ว่าเป็นข้อมูลเพื่อใช้ในการแสดง ให้ผู้อ่านเอกสารได้เห็น Content คือตัวอักษรสีเขียว จากตัวอย่าง หรือกล่าวอีกนัยหนึ่งคือ Content อยู่หลัง tag เปิด และจบที่ก่อนถึง tag ปิดนั่นเอง

Attribute

Attribute คือตัวอักษรสีน้ำเงิน จากตัวอย่าง และจะเห็นว่า ถูกบรรจุอยู่ภายใน tag เปิด และ attribute นี้ในบางครั้ง อาจจะมีหรือไม่มีก็ได้ รวมถึงถ้ามีอาจมีได้มากกว่าหนึ่งตัวใน tag เปิด
attribute คือข้อมูลความหมายเพิ่มเติม แน่นอน ถ้ากล่าวถึงสิ่งของ หากเราไม่ได้ให้ความหมายเพิ่มเติมเราก็จะไม่รู้ และแยกแยะสิ่งที่เหมือนกันออกจากกันได้ เช่น ถ้าพูดถึง บท ในหนังสือ แค่นี้เป็นความหมายโดยรวม แต่ถ้าบอกว่า บทที่ 1 ในหนังสือ เลข 1 ในที่นี้คือความหมายเพิ่มเติมให้กับบท

ส่วนประกอบของ XML(ต่อ)

หัวข้อพิเศษไอที, XML No Comments »

เรื่องที่ควรคำนึงถึง

                ในการใช้งานมีข้อควรคำนึงเพื่อให้เอกสาร XML  Well formed ดังนี้

                1.    ควรเขียน tag เปิด tag ปิดให้ครบ

                                การเขียนที่ผิด

untitled2.bmp

การเขียนที่ถูก                                              

untitled31.bmp
2.    XML เป็น Case Sensitive  หาก tag เปิดใช้ตัวอักษรพิมพ์เล็ก ก็ต้องใช้ตัวอักษรพิมพ์เล็กใน tag ปิด                               

                                               การเขียนที่ผิด 

untitled4.bmp

การเขียนที่ถูก 

                                                

untitled5.bmp

 

ส่วนประกอบของ XML

หัวข้อพิเศษไอที, XML No Comments »

       ส่วนประกอบของ XML มีดังนี้

1.       อิลิเมนต์

2.       tag

3.       แอตทริบิวต์

4.       Entity

 

อิลิเมนต์ (Element) และ tag
                อิลิเมนต์ใน XML จะหมายถึงส่วนของข้อมูลที่ประกอบไปด้วย tag เปิดและ tag ปิดรวมกัน ยกตัวอย่างเช่น อิลิเมนต์ note จะมี tag ดังนี้คือ               

 

untitled1.bmp

 

                สังเกตว่าการใช้งาน tag ของ XML จะมีลักษณะเหมือนกับการใช้งาน tag ของ HTML แต่ว่า XML จะสามารถสร้างอิลิเมนต์ใหม่ได้เองตามความต้องการของผู้ใช้

 

ตัวอย่าง XML

หัวข้อพิเศษไอที, XML No Comments »

     XML เป็นภาษาที่ยืดหยุ่นต่อข้อมูลการเก็บข้อมูลที่มีลักษณะเป็น Semistructure และนอกจากนั้น XML สามารถเป็นตัวกลางในการแปลงข้อมูลที่อยู่ในลักษณะการเก็บที่ต่างกัน เช่น Relational Database , Object Oriented Database หรือ Text file  ทำให้สามารถเข้าถึงข้อมูลได้เหมือนข้อมูลทั้งหมดอยู่ในที่เดียวกัน และมีรูปแบบเดียวกัน

ตัวอย่าง XML

untitled.bmp


 

DTD ข้อกำหนดโครงสร้างสำหรับ XML (ต่อ)

หัวข้อพิเศษไอที, XML No Comments »

เอกสารรูปแบบ well-formed
     แนวคิดของเอกสารแบบ well-formed ถูกนำมาใช้สำหรับ XML ในกรณีที่ ไม่สามารถสร้างเอกสาร XML ด้วยข้อกำหนด DTD
“จากตัวอย่างของ tag ใน HTML เป็น tag ที่เรียกว่า element เปล่า เนื่องจากว่า tag ดังกล่าว ไม่จำเป็นต้องอาศัย tag ปิด เช่นเดียวกัน หาก XML มี element ที่มี tag ปิด จึงไม่เป็นเอกสารในรูปแบบ ‘well-formed’

DTD ข้อกำหนดโครงสร้างสำหรับ XML (ต่อ)

หัวข้อพิเศษไอที, XML No Comments »

เอกสาร DTD
     ในการจัดสร้าง DTD ทำให้เอกสารมีความเป็นรูปแบบ well-formed เรียกง่ายๆกันว่า เอกสารที่ถูกต้อง ในบางครั้งหากเรา ต้องการสร้างเอกสาร XML ที่สามารถแลกเปลี่ยนกับคนอื่นๆ หรือส่วนอื่นๆ และให้สามารถเข้าใจโครงสร้างเดียวกัน นั้นก็คือ เอกสาร XML ของเรา และส่วนอื่นๆ จำเป็นต้องมีรูปแบบโครงสร้างเดียวกัน นั้นก็คือควรที่จะเลือกใช้ DTD เดียวกัน เพื่อบังคับโครงสร้างให้เหมือนกัน

เอกสารที่ถูกต้อง
     เอกสารที่อยู่ในรูปแบบ well-formed เป็นเอกสารที่เรียกว่าถูกต้องตามข้อกำหนดของ XML แต่เอกสารที่ไม่ถูกต้องตามรูปแบบ XML ก็สามารถเป็นเอกสารที่ดีได้เช่นกัน เนื่องจากในปัจจุบันข้อมูล บนระบบอินเตอร์เน็ตมีอยู่มากมาย ที่ไม่ได้สร้างเป็นเอกสารที่ถูกต้องตามแบบ XML นั่นคือความต้องการส่วนหนึ่ง ที่ DTD จะสามารถบังคับเอกสาร XML ที่สร้างมาจาก DTD เดียวกัน ให้เป็นเอกสารที่ถูกต้องตามแบบ XML (ต้องเป็น DTD ที่ถูกต้องด้วย)

DTD ข้อกำหนดโครงสร้างสำหรับ XML (ต่อ)

หัวข้อพิเศษไอที, XML No Comments »

XML ไม่จำเป็นต้องใช้ DTD เสมอไป
ถ้าแม้จะต้องใช้ DTD แต่ก็จะมีการสร้าง DTD ที่เป็นมาตรฐานให้ใช้อยู่แล้ว DTD ที่เป็นมาตรฐาน ถูกพัฒนาโดยผู้ที่สนใจ ในเอกสารเฉพาะด้าน และมีให้พวกเรา ได้ดึงมาใช้งาน เพื่อให้เกิดรูปแบบมาตรฐานที่ชัดเจน และเข้าใจข้อมูลกัน ในเอกสารประเภทเดียวกัน 3 ส่วนสำคัญ เอกสาร XML มีส่วนประกอบที่สำคัญอยู่สามส่วน สองส่วนเป็นสิ่งที่จำเป็น ในขณะที่อีกส่วนเป็นทางเลือก ที่จะมีหรือไม่ก็ได้

1. ส่วนแรก คือส่วนของเนื้อหา หรือ Content นั่นเอง ซึ่งทำให้เอกสารมีข้อมูลสำหรับดูโดยผู้อ่าน Content นี้เป็นได้ทั้งข้อความ รูปภาพ ส่วนนี้ถูกสร้างขึ้นมาจาก element ในที่นี้คือไฟล์ XML
2. ส่วนที่สอง คือกฎเกณฑ์และข้อกำหนด โครงสร้างของเอกสาร ในที่นี้คือไฟล์ DTD ส่วนนี้ถือเป็นทางเลือก ซึ่งจะเลือกใช้หรือไม่ก็ได้
3. ส่วนสุดท้าย คือ StyleSheet คือ ลักษณะข้อกำหนดสำหรับการแสดงผลลัพธ์นั้นเอง ในที่นี้คือไฟล์ XSL

DTD คือออปชั่นในขณะที่ StyleSheet ไม่ใช่ เอกสาร XML สามารถถูกบังคับโครงสร้างด้วย DTD ซึ่งจะใช้หรือไม่ใช้ก็ได้ แต่ StyleSheet คือสิ่งที่จำเป็นที่จะสามารถนำข้อมูลในเอกสาร มาแสดงด้วยการ rendering StyleSheet ในบางครั้งไม่ต้องการ หากเรามีกลไก rendering ที่จัดสร้างไว้พร้อมแล้ว สำหรับเอกสาร XML ที่ต้องผ่านขบวนการแปลงด้วย XSL เพื่อให้เป็น HTML ในการแสดงผ่านบราวเซอร์ อย่างนี้ต้องจำเป็นในการใช้งาน StyleSheet

DTD ข้อกำหนดโครงสร้างสำหรับ XML

หัวข้อพิเศษไอที, XML No Comments »

     ส่วนนี้ จะมาทำความรู้จักกับเอกสารในรูปแบบการจัดสร้างที่ถูกต้อง และส่วนควบคุมโครงสร้างเอกสารที่เรียกว่า DTD

DTD คืออะไร
     “DTD คือแฟ้มข้อมูล (หรือหลายแฟ้มข้อมูลที่ใช้งานร่วมกัน) ซึ่งบรรจุข้อกำหนด และกฎเกณฑ์ของเอกสาร ชุดข้อกำหนดเหล่านี้ สำหรับการกำหนดรูปแบบ element ตัวอย่างเช่น หากต้องการเอกสารที่มี element ที่มี element บรรจุอยู่ภายใน ข้อกำหนดในแฟ้มข้อมูล DTD จะมีรูปแบบดังนี้

ซึ่งอธิบายความหมายคือ element items บรรจุข้อความใดๆ และ element list บรรจุ element item อีกที ดังนั้น DTD เป็นรูปแบบภาษา ซึ่งทำให้สามารถตรวจสอบเอกสาร ที่นำเอาข้อกำหนด DTD ไปใช้ ว่าถูกจัดสร้างตามความต้องการหรือไม่ ทำให้ระบบการ rendering สามารถเข้าใจตัวเอกสารได้ดี และดึงไปใช้งานได้ถูกต้อง”

DTD มีความซับซ้อน
     จากคำอธิบายในส่วนต้น DTD มีความซับซ้อน หมายถึงการสร้าง DTD มีรายละเอียดและขั้นตอนที่ยุ่งยากพอสมควร ถึงแม้ DTD จะทำให้การสร้างเอกสารมีความยุ่งยากก็ตาม แต่มีเหตุผลอยู่ 2 ข้อที่ควรรู้ก่อน


   Designed By:  SadhWeb Directory  &  WP Theme

Sponsored By:  Affiliate Marketing Blog  &  Paid Directory