ทฤษฎีเกม
ท่านผู้อ่านทุกท่าน เคยคุ้นๆหูกับ “ทฤษฏีเกม”(Game theory) หรือไม่ ?
บางท่านอาจจะคุ้นเคยเรื่องราวชีวิตของ จอห์น เอฟ. แนช (John F. Nash) ที่ถูกถ่ายทอดออกมาเป็นภาพยนตร์เรื่อง Beautiful Mind(2002) ซึ่งได้รับรางวัล Oscar ถึง 4 สาขา!!! (เอ..ใครที่ยังไม่ได้ดู ลองไปหามาดูกันนะ) และจอห์น แนช ในหนังเรื่องนี้นี่แหละที่ได้รับรางวัลโนเบลจากการพัฒนา “ทฤษฎีเกม” !
ก่อนจะอธิบายว่า “ทฤษฏีเกม” คืออะไร? คงต้องกล่าวถึงประวัติความเป็นมาของมันเสียเล็กน้อย เพื่อให้ผู้อ่านได้ตระหนักถึงประวัติศาสตร์ตั้งแต่อดีตจนได้กลายมาเป็น ทฤษฏีเกมสมัยใหม่ ในปัจจุบัน
ประวัติ
เกมที่มีผู้เล่นสองคนได้ถูกอภิปรายมาตั้งแต่อดีตแล้วก่อนจะมีการศึกษา ทฤษฏีเกมสมัยใหม่ ขึ้นมา โดยหลักฐานที่เป็นหลักฐานชิ้นแรกที่ชี้ให้เห็นว่าได้เริ่มมีการศึกษาทฤษฏีเกมมาตั้งแต่อดีตกาลแล้ว คือจดหมายเมื่อปี พ.ศ. 2256 ซึ่งเขียนโดย เจมส์ เวลด์เกรฟ โดยเขาได้ทำการวิเคราะห์หากลยุทธ์ที่ดีที่สุดในการเล่นเกมไพ่ชนิดหนึ่ง ที่ชื่อว่า le Her โดยมีแนวทางการวิเคราะห์คล้ายกับทฤษฎีเกม หลังจากนั้น เจมส์ เมดิสัน ได้วิเคราะห์ทฤษฏีเกมเกี่ยวกับวิธีที่รัฐจะถูกคาดหวังให้วางตัว ภายใต้ระบบการเก็บภาษีที่แตกต่างกัน และในที่สุด ผลงานเรื่อง Researches into the Mathematics Principle of the Theory of Wealth ของ แอนโทนี ออกัสติน คอร์นอร์ต ก็ได้ถูกตีพิมพ์ในปี พ.ศ.2381
จอห์น ฟอย นอยมันน์ ร่วมกับ ออสการ์ มอร์เกินเสติร์น ได้ตีพิมพ์ตำราเรื่อง Theory of Game and Economic Behavior ในปี พ.ศ. 2487 กล่าวถึงทางเลือกที่สอดคล้องกันสำหรับเกมที่มี ฝ่ายชนะ และ ฝ่ายแพ้ ซึ่งนับว่าเป็นตำราเล่มแรก ที่มีการศึกษาทฤษฏีเกมในฐานะสาขาเฉพาะขึ้น
จอห์น เอฟ. แนช (John F. Nash) ได้พัฒนาหลักเกณฑ์ที่สอดคล้องกันของกลยุทธ์ของผู้เล่นทั้งสองฝ่าย หรือ “จัดสมดุลของแนช” และผลงานของเขาเป็นที่ยอมรับ จนได้รับรางวัลโนเบล สาขาเศรษฐศาสตร์ในปี พ.ศ. 2537 ร่วมกับนักเศรษฐศาสตร์อีกสองท่าน และทฤษฏีดังกล่าวจึงกลายมาเป็นรากฐานให้กับวิขาเศรษฐศาสตร์ในปัจจุบัน
ในทางคณิตศาสตร์ ทฤษฎีเกม เป็นการจำลองสถานการณ์ทางกลยุทธ์ หรือเกมคณิตศาสตร์ ซึ่งความสำเร็จในการตัดสินใจของแต่ละบุคคลขึ้นอยู่กับทางเลือกของบุคคลอื่น แต่ละฝ่ายต่างก็พยายามแสวงหาผลตอบแทนให้ได้มากที่สุด ทฤษฎีเกมมีการใช้ในทางสังคมศาสตร์ (ที่โดดเด่นเช่น เศรษฐศาสตร์ การจัดการ การวิจัยปฏิบัติการ รัฐศาสตร์และจิตวิทยาสังคม) เช่นเดียวกับวิทยาศาสตร์รูปนัยอื่น ๆ (ตรรกะ วิทยาศาสตร์คอมพิวเตอร์และสถิติ) และชีววิทยา (โดยเฉพาะอย่างยิ่งชีววิทยาวิวัฒนาการและนิเวศวิทยา) แม้ว่าเดิมทฤษฎีเกมจะถูกพัฒนาขึ้นเพื่อวิเคราะห์การแข่งขันซึ่งบุคคลหนึ่งได้มากกว่าที่อีกฝ่ายหนึ่งเสีย แต่ก็ได้มีการขยายเพื่อให้ครอบคลุมถึงปฏิสัมพันธ์หลายรูปแบบ
ทฤษฎีของ จอห์น แนช มีความสำคัญเพราะเขาได้พิสูจน์ว่า เกม ที่ไม่มีการร่วมมือระหว่างผู้เล่นหลายคนนั้น จะสามารถดำเนินไปสู่จุดดุลยภาพ (Nash Equilibrium) ได้ อย่างไรก็ตาม แม้ว่าในบางกรณีจะมีจุดดุลภาพหลายจุด แต่การค้นคว้า พบว่า เราสามารถหาจุดดุลภาพได้ และมีจุดดุลยภาพจำนวนจำกัด ซึ่งทำให้เราสามารถวิเคราะห์ คาดการณ์ผลลัพธ์ ที่จะเกิดขึ้น ว่ามีความเป็นไปได้ในลักษณะใดได้บ้าง
ทฤษฎีเกมของ จอห์น แนช ได้กลายเป็นเครื่องมือหลัก ในการศึกษาวิเคราะห์การแข่งขันระหว่างผู้ผลิต และการวิเคราะห์โครงสร้างอุตสาหกรรม และในบางกรณีก็ถูกนำไปใช้ในการวิเคราะห์ นโยบายเศรษฐกิจมหภาค การเจรจาการค้าระหว่างประเทศ ตลอดจนนโยบายทางด้านการเมืองต่างๆ รวมไปถึงการจะยิงขีปนาวุธ ของประเทศมหาอำนาจ
มาดูตัวอย่างง่ายๆที่เป็นที่นิยมที่แพร่หลายในการอธิบาย ดุลยภาพของแน (Nash Equilibrium)
เกม ความลำบากใจของนักโทษ (Prisoner's dilemma)
กล่าวคือ ในกรณีที่มีคนร้ายสองคน ถูกตำรวจจับได้ ถูกตั้งข้อหาร่วมกันฆ่าคนตาย และมีหลักฐานเอาผิดในระดับหนึ่ง ที่สามารถสั่งจำคุกได้ แต่ยังไม่สามารถระบุความผิดของทั้งสองคนได้ และทั้งสองคนปฏิเสธ ดังนั้นตำรวจจึงแยกกันสอบสวน คนละห้อง และยื่นข้อเสนอไว้ว่า ถ้านาย A รับสารภาพและให้การซัดทอดนาย B โดยที่นาย B ไม่ปริปากใดๆ ตำรวจจะกันนาย A ไว้เป็นพยาน และจะได้รับการลดโทษลงเป็นจำคุก 2 ปี ส่วนผู้ที่ถูกซัดทอด (นาย B) จะต้องโทษจำคุก 10 ปี ทั้งนี้โทษจำคุกก็จะกลับกันหากอีกฝ่ายเป็นผู้สารภาพและซัดทอดโดยที่อีกฝ่ายไม่ปริปาก หากทั้งสองคนไม่ยอมให้การใดๆ ที่มีประโยชน์ ตำรวจจะทำได้เพียงจำคุกทั้งคู่คนละ 1 ปี และจะจำคุกคนละ 5 ปีหากทั้งสองฝ่ายปรักปรำซึ่งกันและกัน
จากโจทย์ อาจวิเคราะห์ให้ง่ายขึ้นด้วยการสร้างตารางทางเลือกของนาย A และนาย B ดังนี้
ตัวเลขในวงเล็บคือ จำนวนปีที่คนร้ายจะต้องจำคุก
จากตารางจะเห็นได้ว่า ทางเลือกที่ดีที่สุดสำหรับคนร้ายทั้งสองคนคือ การไม่ยอมปริปากทั้งคู่เพื่อที่จะได้รับโทษน้อยที่สุดนั่นคือติดคุกคนละ 1 ปี (1,1) แต่ในความเป็นจริง การถูกแยกสอบสวนทำให้ไม่ได้รับข้อมูลที่ถูกต้องและโปร่งใสเหมือนอยู่ในตลาดสินค้า ที่สามารถรับรู้ข้อมูลซึ่งกันและกันได้อย่างครบถ้วน คนร้ายไม่สามารถเปิดเผยข้อมูลระหว่างกันได้ และด้วยความกลัวที่จะถูกอีกฝ่ายปรักปรำ ทำให้ทั้งสองฝ่ายเลือกที่จะสารภาพและซัดทอดอีกฝ่าย ทางเลือกของคนร้ายทั้งสองได้รับเลยกลายเป็นต้องติดคุกคนละ 5 ปี (5,5) จากเกมข้างต้น เป็นเกมที่มีผู้เล่นเพียงสองฝ่าย แต่ก็สามารถหาจุดดุลยภาพของเกมได้ซึ่ง จุดดุลยภาพของเกมนี้ก็คือ เมื่อคนร้ายแม้คนเดียวเลือกสารภาพแล้วล่ะก็ คนร้ายอีกคนอีกคนหนึ่งก็ต้องสารภาพด้วย
เนื้อหาจาก
http://knowledge.wharton.upenn.edu/article/john-nashs-legacy-the-future-of-business-strategy/
http://oknation.nationtv.tv/blog/Duplex/2008/08/22/entry-1
http://www.vcharkarn.com/varticle/365
http://www.vcharkarn.com/varticle/502335
http://wwa.scimath.org/socialnetwork/groups/viewbulletin/1649-a-beautiful-mind?groupid=236
ภาพจาก
http://thaipublica.org/2015/06/varakorn-113/
http://www.openculture.com/2012/06/john_nash_ia_brilliant_madnessi.html
http://www.vcharkarn.com/varticle/502335
http://knowledge.wharton.upenn.edu/article/john-nashs-legacy-the-future-of-business-strategy/