Game theory (ทฤษฎีเกม) ถูกนำเสนอครั้งแรกโดย John von Neumann และ Oskar Morgenstern [1] คำว่า "game" ในที่นี้หมายถึงสถานการณ์ที่ผู้เกี่ยวข้อง (players) ทุกคนกำลังพยายามการนำกลยุทธหรือทางเลือก (strategies / choices) ที่มีอยู่มาใช้ เพื่อทำให้ฝ่ายตรงข้าม(adversary)ที่อาจมีมากกว่า 1 ต้องพ่ายแพ้หรือออกจากเกมไป เพื่อนำไปสู่เป้าหมายดังกล่าว จึงได้มีการพัฒนา dicision rule ที่เรียกว่า "Minimax" [3] ซึ่งมีหลักการว่า ผู้เล่นแต่ละคนจะเลือกทางเลือกที่ให้ payoff (ผลตอบแทน) น้อยที่สุดออกมาแล้วพยายามหาทางเพิ่มค่า payoff ให้ได้มากที่สุด (maximize minimum payoff) แนวคิดนี้ได้เป็น decision rule หนึ่งในระบบ Artificial Intelligence ในปัจจุบัน
ในทางคณิตศาสตร์แล้ว game theory คือการศึกษาตัวแบบทางคณิตศาสตร์ (mathematical model) ที่ว่าด้วยเรื่องของข้อขัดแย้ง, ความร่วมมือและการแข่งขันกันระหว่างผู้เล่น (ที่มีข้อมูลและอำนาจตัดสินใจ) [2] หรืออาจมองว่าเป็นศาสตร์ที่เกี่ยวข้องกับการกำหนดกลยุทธหรือการกำหนดขอบเขตการตัดสินที่เหมาะสมภายใต้เงื่อนไขหรือกติกาหนึ่งๆ ก็ได้
John Nash ได้ขยายแนวคิดของ Game theory ออกไป โดยเพิ่มมุมมองว่า มนุษย์ไม่จำเป็นต้องทำตัวเป็นศัตรูกันตลอดเวลา มนุษย์เพียงต้องการผลตอบแทนที่เหมาะสมกับสถานการณ์ [4] Nash จึงได้เสนอสิ่งที่เรียกว่า Nash equilibrium [5] ซึ่งเป็นสถานะของเกมที่ไม่มีผู้เล่นคนใดได้รับ payoff เพิ่มจาการเปลี่ยนแปลงกลยุทธที่อยู่ในขณะนั้น ตัวอย่างสถานการณ์ที่มักถูกยกมาเป็นตัวอย่างเพื่อให้เข้าใจ Nash's equilibrium คือ Prisoners' dilemma ซึ่งจะกล่าวถึงต่อไป
Prisoners' dilemma
Prisoners' dilemma เป็นเรื่องราวที่มักถูกยกเป็นตัวอย่างในการอธิบายเรื่อง Nash equilibrium อยู่บ่อย รายละเอียดอาจแตกต่างกันไปแล้วแต่ผู้เขียน แต่หลักการเหมือนกัน เรื่องมีอยู่ว่า
มีอาชญากร 2 คน สมมุติให้ชื่อเป็น A,B ถูกจับได้ ทั้งสองถูกจับและนำมาขังแยกกันโดยที่ไม่สามารถจะสื่อสารกันได้ อัยการ (prosecutors) ยังไม่มีหลักฐานเพียงพอสำหรับข้อหาหลัก แต่มีเพียงพอสำหรับข้อหารอง อัยการต้องการต่อรอง โดยยื่นข้อเสนอให้อาชญากรแต่ละคน (แยกกันคุย) ได้ทางเลือกดังนี้
• ถ้า A หรือ B ต่างให้การซัดทอดอีกฝ่าย แต่ละคนจะได้รับการเสนอโทษจำคุก 2 ปี
• ถ้า A ให้การซัดทอด B แต่ B ไม่ซัดทอด A แล้ว A จะไดัรับการเสนอให้ปล่อยตัว ส่วน B จะได้รับการเสนอโทษจำคุก 3 ปี
• ถ้า B ให้การซัดทอด A แต่ A ไม่ซัดทอด B แล้ว B จะไดัรับการเสนอให้ปล่อยตัว ส่วน A จะได้รับการเสนอโทษจำคุก 3 ปี
• ถ้า A และ B ไม่ยอมให้การใดๆ เลย ทั้งคู่จะได้รับการเสนอโทษจำคุก 1 ปี
Payoff matrices
คือรูปแบบการนำเสนอผลลัพธ์ (result) จากทางเลือกของผู้เล่นแต่ละรายในเกมหนึ่งๆ โดยไม่ได้บอกถึงโครงสร้างหรือวิธีการดำเนินการของเกม
จากเรื่อง Prisoners' dilemma นำเอาเงื่อนไขมาเขียนเป็น payoff matrix ได้ดังภาพที่ 1
![]() |
ภาพที่ 1 payoff matrix ของ prisoners dilemma |
ภาพที่ 1 แสดง payoff matrix อย่างง่าย ประกอบด้วยผู้เล่น 2 ราย A (อักษรสีแดง) และ B (อักษรสีฟ้า) ทั้งคู่มีทางเลือก (strategies) 2 ทาง คือ
การพิจารณาค่า payoff ของผู้เล่นจะใช้การเปรียบเทียบ "มากกว่า" หรือ "น้อยกว่า" ไม่ได้ให้ความสนใจไปที่ความต่างของตัวเลขและค่า payoff ของผู้เล่นรายอื่น เมื่อเปรียบเทียบค่า payoff ระหว่าง 2 ทางเลือก จะกล่าวว่า ทางเลือกที่ให้ payoff มากกว่า "dominates" ทางเลือกที่ให้ค่า payoff น้อยกว่า หรือจะกล่าวว่า ทางเลือกที่ให้ payoff น้อยกว่าถูก "dominated" และเลือกที่ dominates ทุกทางเลือกที่เหลือกแล้ว จะเรียกทางเลือกนั้น "dominant" ยกตัวอย่างเช่น พิจารณาภาพที่ 1
1) ถ้า A เลือก 'A stays silent' แล้ว ทางเลือก 'B betrays' dominates 'B stays silent' หรือ 'B stays silent' is dominated by 'B betrays' สำหรับผู้เล่น B
2) ถ้า A เลือก 'A betrays' แล้ว ทางเลือก 'B betrays' dominates 'B stays silent' หรือ 'B stays silent' is dominated by 'B betrays' สำหรับผู้เล่น B
3) ดังนั้น สำหรับ B แล้ว ทางเลือก 'B betrays' คือ dominant เพราะเป็นทางเลือกที่ dominates ทางเลือกอื่นหรือให้ payoff มากกว่าทางเลือกอื่นที่มีอยู่ ไม่ว่า A จะเลือกทางใด
การหา Nash equilibrium
จากที่กล่าวไปก่อนหน้านี้ว่า Nash equilibrium คือสภาวะที่ไม่มีผู้เล่นรายใดจะได้ payoff เพิ่มจากการเปลี่ยนทางเลือก นั่นคือ Nash equilibrium เกิดขึ้นเมื่อเกมอยู่ในช่อง (grid) ตำแหน่งที่ผู้เล่นทุกรายได้ใช้ dominant ของตัวเอง
จากที่กล่าวมาก่อนหน้านี้ เราทราบแล้วว่า 'B betrays' คือทางเลือก dominant ของ B มาพิจารณาทางฝั่งของ A บ้าง
1) ถ้า B ใช้ทางเลือก 'B stays silent' แล้ว ทางเลือก 'A betrays' dominates 'A stays silent'
2) ถ้า B ใช้ทางเลือก 'B betrays' แล้ว ทางเลือก 'A betrays' dominates 'A stays silent'
3) ดังนั้น สำหรับ A แล้ว ทางเลือก 'A betrays' คือ dominant ไม่ว่า B จะเลือกทางใด
จากการพิจารณาทั้งหมด สถานะของเกมที่ A เลือก 'A betrays' และ B เลือก 'B betrays' อยู่ที่ช่องขวา-ล่าง ตามภาพที่ 1 สภาวะของเกมในรูปแบบนั้นเรียกว่า "Nash equilibrium" จากสภาวะนี้ หาก B เปลี่ยนทางเลือกที่ต่างออกไปจากสภาวะนี้ ค่า payoff จะลดลงจาก
Nash equilibrium กับการเข่งขันทางการตลาด
เหตุการณ์สมมุติ ถ้ามีบริษัท A,และ B เป็นคู่แข่งกันทางธุรกิจ บริษัท A มีทรัพยากรและขนาดของตลาดที่มากกว่า B วันหนึ่ง ทั้งสองมีแผนที่จะสินค้าที่เหมือนกันออกสู่ตลาดในช่วงเวลาเดียวกัน บริษัทวิจัยทางการตลาดแห่งหนึ่งทำการศึกษากรณีนี้แล้วสร้าง payoff matrix ขึ้นมาดังภาพที่ 2
![]() |
ภาพที่ 2 |
ขั้นตอนการหา Nash equilibrium ในกรณีนี้คือ
1) ถ้า A เลือก release ทางเลือกของ B ที่ dominates คือ don't release (วงกลมสีฟ้าในภาพที่ 3 a)
2) ถ้า A เลือก don't release ทางเลือกของ B ที่ dominates คือ release (วงกลมสีฟ้าในภาพที่ 3 a)
3) ถ้า B เลือก release ทางเลือกของ A ที่ dominates คือ release (วงกลมสีแดงในภาพที่ 3 c)
4) ถ้า B เลือก don't release ทางเลือกของ A ที่ domimates คือ release (วงกลมสีแดงในภาพที่ 3 d)
![]() |
ภาพที่ 3 |
สรุปว่าภาวะ Nash equilibrium เกิดขึนเมื่อผู้เล่นทุกคนได้ทางเลือกที่เป็น domimates คือสถาวะที่แสดงในภาพที่ 3 d นั่นคือ A ควรทำการ release สินค้าตามกำหนด ในขณะที่ B ควรเลื่อนการ release สินค้าออกไป
Mixed strategy Nash equilibrium
ในกรณีของการออกสินค้าของ A และ B ที่กล่าวถึงก่อนหน้า Nash equlibrium จะเกิดขึ้นเมื่อ A ทำการ release ส่วน B ไม่ release ถ้าทั้งสองยึดตามนี้จะเรียกวิธีคิดนี้ว่า pure strategy แต่ภายใต้แนวคิดของ mixed strategy จะมองว่า ทุกคนจะเลือกทางเลือกของตัวเองแบบสุ่ม (randomized) ยังมีความเป็นไปได้ที่ B จะเลือกการ release หรือ A อาจเลือกการไม่ release จะด้วยเหตุผลใดก็แล้วแต่ การคำนวณหา Nash equilibrium ภายใต้แนวคิดนี้จะต้องใช้ความรู้เรื่อง probability มาช่วย
![]() |
ภาพที่ 4 |
ดูตัวแบบ payoff matrix แบบง่าย (ภาพที่ 4)
1) มีผู้เล่นสองคน A และ B
2) A มีทางเลือกเป็น
3) B มีทางเลือกเป็น
4) ค่า payoff เป็น
พิจารณาทางฝ่าย B : :
ถ้า B มองว่า A จะเลือกใช้
พิจารณาทางฝ่าย A :
ถ้า A มองว่า B จะเลือกใช้
ทดลองกรณีของบริษัท A, B ในเกมของการปล่อยสินค้าออกตลาดอีกครั้ง โดยใช้ payoff matrix เดิม ถ้ากำหนดให้ค่าความน่าจะเป็นที่ A จะปล่อยสินค้าเป็น
จาก (1) และ (2) :
ค่า expected payoff ของ B ชี้ว่าควรเลือก release สินค้า ซึ่งต่างจากผลที่วิเคราะห์ด้วย pure strategy อธิบายได้ว่า เนื่องจาก
ถ้าลองเพิ่มค่า
ภาพที่ได้ค่อนข้างชัดเจนว่า หาก A มีแนวโน้มจะ release สินค้าสูงขึ้น แนวโน้มที่ B จะได้ประโยชน์จากการ release สินค้าจะน้อยลง
ทดลองอีกครั้งกับบริษัท A โดยให้ค่าความน่าจะเป็นที่ผลที่ B จะ release สินค้าเป็น
จาก (3) และ (4) :
ผลที่ได้ออกมาบอกว่า ไม่ว่าแนวโน้มของ B จะเป็นอย่างไร A ก็ยังคงได้ค่า expected payoff กับการ release สินค้า ทั้งนี้อาจเพราะ A มีทรัพยากรและขนาดของตลาดที่ได้เปรียบ B อยู่แล้ว
จากตัวอย่างการคำนวณทำให้เห็นว่าแนวคิดของ mixed strategy ไม่ได้ระบุชัดเจนว่าจะต้องเลือกทางเลือกใดแบบเดียวกับ pure strategy แต่ใช้การระบุออกมาเป็นค่าคาดหวังของ payoff แทน ซี่งนัยเรื่องความน่าจะเป็นอยู่ด้วย
ค่าความน่าจะเป็น
1)
2)
(1) = (2) :
(3) = (4) :
หมายเหตุ การหาความน่าจะเป็นตาม (5),(6) คือเป็นไปได้ว่าค่าที่คำนวณออกมาได้จะไม่อยู่ในช่วง [0,1] หากได้มาจะต้องไม่นำไปใช้ และค่า expected payoff ที่คำนวณได้จากค่าความน่าจะเป็นที่หามาได้นี้ อาจไม่ได้มีค่าเท่ากันเสมอไป
Mixed strategy ในการแข่งขันฟุตบอลล์
มาดูตัวอย่างการศึกษาของ Ignacio Paracios-Huerta [7] เขาทำการเก็บข้อมูลการเตะลูกโทษ (penalty kicks) ในเกมการแข่งขันฟุตบอลล์รายการต่างๆ ในยุโรปจำนวน 1,417 การแข่งขัน การเตะลูกโทษถือเป็นเกมระหว่าง ผู้เตะ (kickers) กับ ผู้รักษาประตู (goal keepers) ผู้เตะมีทางเลือก 2 ทางคือเตะไปทางซ้ายหรือทางขวาของตัวเอง ผู้รักษาประตูก็เช่นเดียวกัน โดยทิศทางจะใช้มุมมองจากผู้เตะเป็นหลัก payoff matrix ที่แสดงในภาพที่ 5 แสดง success rate ของผู้เตะในรูปของเปอร์เซ็นต์ในการทำประตู ซึ่งจะเห็นว่าถ้าผู้รักษาประตูพุ่งไปทางเดียวกับที่นักเตะเตะลูกบอลล์ไป โอกาสที่จะได้คะแนนของผู้เตะจะลดลง
![]() |
ภาพที่ 5 |
จากข้อมูลเมื่อนำไปสร้าง payoff matrix ได้ดังภาพที่ 6
![]() |
ภาพที่ 6 |
ให้
ค่าของ
มาดูอีกฝั่งบ้าง ถ้าให้
ค่าของ
นำค่า
ให้
ค่าของ
ให้
จะเห็นได้ว่าค่าของ
ในข้อเขียนนี้ ได้เริ่มจากกล่าวถึงแนวคิดของ Game theory ต่อด้วย Nash equilibrium ทั้งความหมายและการคำนวณหา ด้วยหลักการแบบกว้าง พอเป็นแนวทางในการศึกษาต่อไป หากสนใจ เรื่องราวของ Game theory ได้ถูกต่อยอด ประยุกต์ใช้กับสาขาวิชาอื่นมากมาย เช่น เศรษฐศาสตร์ กฏหมาย การกีฬา artificial intelligence ฯล ดังนั้นจึงนับเป็นการดีที่จะได้ทำความรู้จักกับ Game theory ไว้เพราะในชีวิตประจำวันของมนุษย์เราก็เหมือนกับการเล่นเกมตลอดเวลาอยู่แล้ว
ความคิดเห็น
แสดงความคิดเห็น