XML ภาษาสำหรับพัฒนาข้อมูลข่าวสาร
บทคัดย่อ
นับแต่ web page ที่เขียนด้วยภาษา HTML เริ่มมีการพัฒนามาตั้งแต่ปี ค.ศ.1991 ได้มีการใช้งานกันอย่างกว้างขวางและแพร่หลายจนทำให้มี web page จำนวนมากมายมหาศาล แต่ด้วยข้อจำกัดและข้อด้อยบางประการของ HTML ทำให้ไม่สามารถตอบสนองความต้องของผู้ใช้ในบางประการใด จึงได้มีการพัฒนาภาษาใหม่ขึ้นมาใหม่เรียกว่า XML (eXtensive Markup Language) มาช่วยเสริมการทำงานของ HTML ซึ่งเป็นการทำงานกับข้อมูลโดยตรง สามารถให้รายละเอียดเกี่ยวกับข้อมูลและการเปลี่ยนแปลงข้อมูลโดย Application บนเว็บได้ชัดเจน และใช้ฟอร์มที่ยืดหยุ่นได้ตามมาตรฐาน HTML หรือ Hyper Text Markup Language
สิ่งที่ถือได้ว่าเป็นเสน่ห์ของ XML คือ ความสะดวกในการจัดการด้านระบบการติดต่อกับผู้ใช้จากโครงสร้างของข้อมูล โดยสามารถนำข้อมูลจากหลายแหล่งมาแสดงผลและประมวลผลร่วมกันได้ ไม่ว่าจะเป็นข้อมูลลูกค้า รายการสั่งซื้อ ผลการวิจัย รายการรับชำระเงินข้อมูลเวชระเบียน รายการสินค้าหรือข้อมูลสารสนเทศอื่น ๆ ก็สามารถแปลงให้เป็น XML ได้ นอกจากนี้ยังสามารถปรับข้อมูลให้เป็น HTML ได้อีกด้วย จึงมีประโยชน์ในการเข้าถึงระบบข้อมูลขนาดใหญ่ในระบบเครือข่ายขององค์กรหรือ Internet เพื่อดูหรือเรียกใช้ข้อมูลให้มาแสดงผลทางหน้าจอได้อย่างรวดเร็วและง่ายในการจัดการ
ในปัจจุบัน การใช้งานข้อมูลบนเครือข่ายต้องจัดการเอกสารจำนวนมาก จึงมีการนำ XML มาประยุกต์ใช้อย่างกว้างขวางในการสร้างดิจิตอลไลบารีและการแลกเปลี่ยนข้อมูลข่าวสารระหว่างกัน เนื่องจากต้นทุนต่ำ มีความปลอดภัยของข้อมูล และไม่จำกัดแพลตฟอร์มของระบบสารสนเทศ ดังนั้น XML จึงเป็นแนวทางหนึ่งที่จะสร้างคุณค่าเพิ่มให้กับผู้ใช้ Internet และเป็นสร้างบทบาทการประยุกต์ใช้งานบนเครือข่าย รวมทั้งเป็นภาษามาตรฐานสำหรับการพัฒนาระบบการแลกเปลี่ยนเอกสารข้อมูลอิเล็กทรอนิกส์
XML คืออะไร
XML ย่อมาจากคำว่า e X tensible M arkup L anguage เป็นภาษาที่ใช้กำหนดรูปแบบของคำสั่งภาษา HTML หรือที่เรียกว่า Meta Data ซึ่งจะใช้สำหรับกำหนดรูปแบบของคำสั่ง Markup ต่าง ๆ แต่มีข้อแตกต่างกับ HTML ที่เป็น Markup Language ซึ่ง XML ได้รับการพัฒนามาจาก SGML (Standard Generalized Markup Language) ที่เป็นข้อกำหนดในการสร้างหรือจัดทำเอกสารในรูปแบบอิเล็กทรอนิกส์ที่กำหนดโดย W3C หรือ World Wide Web Consortium ซึ่งเป็นภาษาที่นิยมใช้และได้รับการพัฒนาให้มีประสิทธิภาพสูงสุดในการทำงานบนเว็บ โดย XML จะประกอบด้วย 3 ส่วนพื้นฐานด้วยกัน คือ เอกสารข้อมูล (Data document) เอกสารนิยามความหมาย (definition document ) และ นิยามภาษา (definition language)
การใช้งาน XML จำเป็นต้องใช้ร่วมกับ Style Sheet หรือมาตรฐานอื่น ๆ เพราะ XML เพียงแต่กำหนดรูปแบบของ Tag เท่านั้น ไม่ได้กำหนดว่า Tag จะแสดงผลแบบใด ดังนั้น หากเอาข้อมูลในรูปแบบ XML ไปแสดงผลในอุปกรณ์ชนิดใดก็ตาม จะต้องกำหนดวิธีแสดงผลของอุปกรณ์นั้นด้วย นอกจากนี้ XML ยังสนับสนุนตัวอักษรภาษานานาชาติ โดยใช้มาตรฐาน ISO 10646
จุดมุ่งหมายของภาษา XML คือ ภาษาต้องเรียบง่าย มีคำสั่งน้อยที่สุด สามารถเขียนด้วยโปรแกรมแก้ไขข้อความ (Text Editor) และสนับสนุนการทำงานร่วมกับ Application ได้หลายชนิด ซึ่งในปัจจุบันนี้ได้มีการพัฒนาภาษา Markup ตามข้อกำหนดของ XML แล้ว เช่น SMIL สำหรับควบคุมข้อมูลมัลติมีเดีย
XML เป็นส่วนหนึ่งของ HTML แต่ XML จะให้รายละเอียดเกี่ยวกับข้อมูลต่าง ๆ เช่น ชื่อเมือง อุณหภูมิ ความกดอากาศ เป็นต้น ส่วน HTML เป็นการกำหนด tag ต่าง ๆ ว่าจะให้ข้อมูลแสดงผลในรูปแบบใด ซึ่งข้อมูลสามารถแสดงผลได้หลายรูปแบบ ไม่ว่าจะเป็นตารางหรือ text ธรรมดา ขึ้นอยู่กับการกำหนดของ HTML และ XML ยังสามารถให้รายละเอียดของเนื้อหาเอกสาร เรียกว่า Document Type Definition (DTD) ว่าจะแสดงหรือซ่อนส่วนใดของเอกสาร
ดังนั้น XML จะเกิดประโยชน์เต็มที่เมื่อนำมาใช้งานร่วมกับ HTML เนื่องจาก XML มีความพร้อมในแง่ของรายละเอียด การนำข้อมูล ตลอดจนโครงสร้างข้อมูลมาแสดงในรูปแบบ Text ผ่านทาง HTTP และมีความสามารถในการจัดข้อมูล ซึ่งการเขียน Web page โดยใช้ HTML ผู้พัฒนาสามารถกำหนดได้ว่าส่วนไหนจะเป็นตัวหนา ตัวเอียง หรือตัวอักษรเป็นแบบไหน ส่วน XML นั้นจะเป็นการเตรียมส่วนของข้อมูลที่จะนำไปใส่ในช่องที่กำหนดตามการเขียนของ HTML เช่น ข้อมูลราคา หรือราคาที่ตั้งสำหรับการจัดรายการส่งเสริมการขาย อัตราภาษี ค่าขนส่ง เป็นต้น
จุดเด่นของ XML
* ดูเอกสารได้ง่าย สะดวก และได้ผลดีเหมือน HTML
* เน้นความจำเป็น กะทัดรัด เข้าใจง่าย และได้ประโยชน์กว้างขวาง
* สนับสนุนการประยุกต์ใช้กับงานต่าง ๆ และสนับสนุนโปรแกรมประยุกต์ต่าง ๆ
* เน้นเรื่องการประมวลผลเอกสาร
* เหมาะกับงานทางด้านการวิเคราะห์เอกสาร การผลิตเอกสาร การแลกเปลี่ยน และการแสดงผล
* เขียนง่าย
* คุณสมบัติของ XML อยู่ในระดับต่ำสุด เพื่อให้ผู้ใช้อื่นร่วมใช้ได้
* อ่านได้ด้วยมนุษย์ โดยไม่ต้องอาศัยโปรแกรมหรือเครื่องมือช่วยแปล
* การเขียน XML ทำได้ตั้งแต่การใช้ Text editor ทั่วไป และไม่ต้องการเครื่องมือที่ซับซ้อน
* เป็นมาตรฐานที่กำหนดแล้วใช้งานได้ทันที โดยที่บราวเซอร์และอุปกรณ์ต่าง ๆ พร้อมใช้งานร่วมกัน
* รูปแบบการเขียนโครงสร้างข้อกำหนดเป็นไปตามหลักการของวิศวกรรมคอมพิวเตอร์ คือ เมื่อเขียนแล้วต้องสามารถใช้โปรแกรมแปลภาษาได้ง่าย โดยทั่วไปเขียนในรูปแบบ BNF ได้ (Baches Normal Form)
* ใช้เป็นตัวควบคุมข้อมูล (Meta data) จึงเป็นแนวทางในการขนส่งข้อมูล และสร้างการเชื่อมโยงระหว่างแอปพลิเคชั่นได้ง่าย
* สนับสนุน UNICODE ทำให้ใช้ได้หลากหลายภาษา และผสมกันได้หลากหลายภาษา
* ดึงเอกสาร XML มาใช้งานได้ง่าย และใช้ร่วมกับโปรแกรมประยุกต์อื่นได้ง่าย เช่น โปรแกรม DB2, Oracle, SAP เป็นต้น
* ช่วยทำให้เกิดการรับส่งข้อมูลแบบ EDI (Electronic Data Interchange) โดยทำให้แนวทางการเชื่อมโยงและสร้างความเป็นเอกสารหรือมาตรฐานระหว่างองค์กร
ช่วยในการขนส่งข้อมูลไปยังปลายทางเพื่อให้แปลความหมายและใช้งานได้อย่างเต็มประสิทธิภาพ
* สร้างการประยุกต์ และนำเสนอผลลัพธ์ไปใช้งานจาก XML ได้มาก
* นำไปประยุกต์ใช้ในการดำเนินกิจกรรมบนเครือข่ายได้มาก เช่น E-Business, EDI, E-Commerce, การจัดการ Supply chain / Demand chain management, การดำเนินการแบบ intranet และ Web Base Application
คุณลักษณะต่าง ๆ ของ XML
XML สามารถจัดการได้หลายรูปแบบทั้งองค์ประกอบ โครงสร้างเอกสาร ลักษณะ ประเภท แอตทริบิวต์ และอิลิเมนต์ โดยเป็นภาษาที่ถูกออกแบบมาเฉพาะสำหรับการพัฒนาโปรแกรมเว็บเพื่อการจัดส่งข้อมูลสารสนเทศ ตลอดจนถูกนำมาใช้สร้าง ภาษามาร์คอัพ (Markup) ซึ่งตรงกันข้ามกับ SGML ที่มีความซับซ้อนมากกว่า
ในทางปฏิบัติเอกสาร XML มีกฎพื้นฐานเพื่อให้การสร้างเอกสารมีรูปแบบที่ถูกต้องในการใช้งานจริง โดยปกติแล้ว XML สามารถจัดเก็บฐานข้อมูล กำหนดโครงสร้างเอกสาร การนำเสนอมัลติมีเดียต่างๆ การจัดเก็บกราฟิกที่มีลักษณะแบบเวกเตอร์ และการสื่อสารระหว่างโปรแกรมต่าง ๆ นอกจากนี้ XML ยังสามารถช่วยในการประมวลผลข้อมูลแล้วส่งผ่านให้โปรแกรมประยุกต์ไปยังแหล่งเก็บข้อมูล
XML เป็นเอกสารที่เขียนด้วยข้อความปกติธรรมดา สามารถสร้างเอกสารหรือแก้ไขไฟล์ XML ได้อย่างง่ายดายด้วยโปรแกรมแก้ไขข้อความ (Text Editor) หากต้องการใช้โปรแกรมที่มีความสามารถพิเศษมากกว่านี้ ก็ต้องใช้โปรแกรมแก้ไขข้อความที่อยู่ในชุดโปรแกรม Microsoft Visual Studio เช่น Microsoft Visual C++ Microsoft Visual Basic และ Microsoft Visual Foxpro เป็นต้น
ภาษา XML ใช้ Tag [Tag] เริ่มต้นและ Tag [/Tag] ปิดเสมอเช่นเดียวกับ HTML เรียกว่า อิลิเมนต์ (Element) เป็นการแบ่งแยกระหว่างข้อมูลและคำสั่ง เพื่อระบุว่าข้อมูลที่อยู่ระหว่าง Tag ดังกล่าวคือข้อมูลอะไร
ส่วนประกอบในเอกสาร XML มีอยู่ 2 ส่วนหลักด้วยกัน คือ Prolog Element และ Document Element (หรือ Root Element) ในส่วนของเอกสาร XML คือ Element เดี่ยว ซึ่งสามารถบรรจุ Element เพิ่มเติมในเอกสาร XML ได้ โดยในเอกสาร XML นั้น Element จะแสดงลักษณะโครงสร้างของเอกสาร และจะแสดงส่วนประกอบเนื้อหาของเอกสารอยู่ภายในสัญลักษณ์ Element ประกอบด้วย Tag เริ่มต้น (start-tags) เนื้อหาภายใน Element และ Tag สิ้นสุด (end-tags) ส่วนเนื้อหาภายใน Element สามารถเป็นได้ทั้งข้อมูลหรือ Element อื่นๆ ที่ซ้อนอยู่ภายในหรือทั้งสองแบบ
ขีดความสามารถของ XML
XML เป็นเอกสารที่มีความเป็นอิสระกับซอฟต์แวร์และระบบปฏิบัติการอื่น ๆ สามารถส่งข้อมูลเอกสาร XML ผ่านการเชื่อมต่อเครือข่าย Internet ไปยังฝั่งผู้ตรวจสอบ เมื่อผู้ผลิตทำการเปลี่ยนแปลงระบบปฏิบัติการ ปริมาณความจุจะไม่มีผลกระทบต่อเอกสาร XML ข้อเสนอนี้เปลี่ยนแปลงไปตามรูปแบบเทคโนโลยีสารสนเทศหรือสถาปัตยกรรมอัตโนมัติ
โดยทั่วไปแล้วด้วยความสามารถของ XML Protocols ในการแก้ปัญหาต่างๆ ในการติดต่อสื่อสารทำได้ง่ายยิ่งขึ้น สามารถลดค่าใช้จ่ายในการบำรุงรักษา ยิ่งกว่านั้นระบบฐานข้อมูล SQL (Structured Query Language) ยังรองรับระบบ XML-based เพื่อสนับสนุนการทำงานกับฐานข้อมูลเชิงสัมพันธ์ (relational) โดยเฉพาะเน้นในส่วนที่เป็นคำสั่งที่ใช้ในการดึงข้อมูลเป็นหลัก ทั้งนี้ เพื่อช่วยเพิ่มประสิทธิภาพในการทำงาน หรือช่วยในการสร้าง Application ฐานข้อมูลได้อย่างมีประสิทธิภาพ สำหรับกุญแจสำคัญในการจัดเรียงฐานข้อมูลเชิงสัมพันธ์ นั้นคือ การมุ่งเน้นความสนใจไปที่ตัวข้อมูลเอง ไม่ใช่มุ่งไปที่ Application ที่จะใช้ข้อมูล เช่น การดาวน์โหลดโปรแกรมควบคุมเนื้อหาใหม่ เพื่อใช้ในการแลกเปลี่ยนข้อมูลในด้านการปฏิบัติงานของอุปกรณ์ Hardware ในโรงงาน โดยยินยอมให้บริษัทเข้าถึงข้อมูลและจัดการกับ Application ใหม่ได้
การนำ XML มาประยุกต์ใช้งาน
ในวงการอุตสาหกรรมกำลังให้ความสนใจกับเทคโนโลยี XML ที่เริ่มมีอิทธิพลและนำไปสู่การเปลี่ยนแปลงในภาคอุตสาหกรรมมาตรฐาน ทั้งนี้เพราะการพัฒนาของเทคโนโลยีทำให้พฤติกรรมการทำงานต่าง ๆ นั้นเปลี่ยนแปลงไป รูปแบบการรับส่งข้อมูลข่าวสารระหว่างกันก็ทำได้รวดเร็ว ซึ่งเมื่อเปรียบเทียบกับอดีตที่มีการแลกเปลี่ยนข้อมูลข่าวสารแบบ EDI การสร้างมาตรฐานเพื่อทำให้ผู้รับและผู้ส่งสามารถรับส่งข้อมูลแบบมีมาตรฐานได้ แต่การแลกเปลี่ยนข้อมูลก็ยังมีข้อจำกัดอยู่
แผนกจัดซื้อหลายบริษัทใช้ Internet เป็นทางเส้นข้อมูลดิจิตอลในการค้นหาโรงงานผู้ผลิตและผู้จำหน่ายอุปกรณ์เครื่องมือ และยังรวมไปถึงผู้ส่งมอบด้วย รวมทั้งการบริการหลังการขายในการซ่อมแซมและบำรุงรักษา และในไม่ช้านี้การเชื่อมโยงข้อมูลก็จะอยู่ในรูปแบบดิจิตอลมากขึ้นโดยอาศัยเครือข่าย Internet เป็นสื่อการในการค้นหาและแลกเปลี่ยนข้อมูลระหว่างองค์กร ทั้งส่วนผู้จำหน่าย ผู้ซื้อ ผู้ส่งมอบ ในอนาคตผู้ประกอบการจะเข้ามาเกี่ยวข้องและอาศัยข้อมูลร่วมกันซึ่งระบบทั้งหมดนี้จะสามารถเชื่อมโยงกันทั้งหมดทั่วโลก ทั้งโรงงาน แผนกจัดซื้อ แผนกขาย
ผู้ผลิตมุ่งหวังที่จะลดจำนวนชั่วโมงการทำงานของวิศวกรในแต่ละโครงงานด้วยการยกเลิกระบบที่ใช้ข้อมูลที่เขียน แต่ใช้ระบบการถ่ายโอนข้อมูลที่เป็นอัตโนมัติมากขึ้น จะเห็นได้ว่า XML เป็นเทคโนโลยีที่ได้รับสนับสนุนในวงการอุตสาหกรรมอย่างกว้างขวาง ผู้คนและองค์กรต่างเห็นคุณค่าของ XML เช่นเดียวกับการใช้ HTML
สรุปทิศทางและอนาคตของ XML
การประยุกต์ใช้ในเชิงธุรกิจถือได้ว่ามีแนวโน้มที่จะกลายเป็น มาตรฐานใหม่ของอุตสาหกรรมซอฟต์แวร์ ที่น่าจับตามอง โดยจะเป็นภาษาสำหรับคนในยุคใหม่ แม้ว่าเทคโนโลยีนี้จะเริ่มแพร่หลายก็ตามแต่ก็ยังคงมีความเป็นมาตรฐานสำหรับโปรโตคอลทั้งหมด โดย XML นี้เป็นสถาปัตยกรรมพื้นฐานที่เป็นแบบแผนและเริ่มแพร่หลายในระดับอุตสาหกรรมมาตรฐาน เพราะสามารถนำไปใช้ในการสื่อสารระหว่างอุปกรณ์และสนับสนุนการควบคุมระยะไกลกับอุปกรณ์ในโรงงานอุตสาหกรรมด้วยภาษา XML ที่มีคุณสมบัติที่ง่ายต่อการนำไปใช้กับโปรโตคอลต่างๆ เข้าด้วยกัน
เป้าหมายที่จะสนับสนุนลูกค้าและลดค่าใช้จ่ายหรือต้นทุน ในปัจจุบันเทคโนโลยีสารสนเทศทาง Internet จะมีบทบาทสำคัญสำหรับองค์ประกอบทางธุรกิจและการลงทุนนี้เป็นกรณีตัวอย่างของภาคธุรกิจที่ขับดันเทคโนโลยีให้ก้าวไกล XML จึงจัดเป็นคลื่นลูกใหม่ทางเทคโนโลยีที่จะต้องถูกนำมาพิจารณามากขึ้น การใช้งานในลักษณะแบบนี้ทำให้เราเห็นว่าแนวโน้มในอนาคตอันใกล้นี้ เราอาจจะนำ XML มาใช้เพื่อการแลกเปลี่ยนข้อมูลระหว่างองค์กรแบบเดียวกับที่เราใช้ในปัจจุบันได้มากขึ้น องค์กรต่าง ๆ ควรพิจารณาเป้าหมายของแต่ละหน่วยงานมากขึ้นและศึกษาผลกระทบเทคโนโลยีเว็บในแง่มุมทางธุรกิจ เพื่อปูทางไปสู่การได้เปรียบทางการแข่งขันในอนาคต
นางปราณี เฉลิมสุข
นางสาวสุชนนี โลหะชาละ
นายวัชรินทร์ คุมปชัยวรรณ
รุ่น MIT 9
นักศึกษาหลักสูตรวิทยาศาสตรมหาบัณฑิต (การจัดการเทคโนโลยีสารสนเทศ)
สำนักวิชาสารสนเทศศาสตร์ มหาวิทยาลัยวลัยลักษณ์
-
374 XML ภาษาสำหรับพัฒนาข้อมูลข่าวสาร /article-technology/item/374-xmlเพิ่มในรายการโปรด