Game theory (ทฤษฎีเกม) ถูกนำเสนอครั้งแรกโดย John von Neumann และ Oskar Morgenstern [1] คำว่า "game" ในที่นี้หมายถึงสถานการณ์ที่ผู้เกี่ยวข้อง (players) ทุกคนกำลังพยายามการนำกลยุทธหรือทางเลือก (strategies / choices) ที่มีอยู่มาใช้ เพื่อทำให้ฝ่ายตรงข้าม(adversary)ที่อาจมีมากกว่า 1 ต้องพ่ายแพ้หรือออกจากเกมไป เพื่อนำไปสู่เป้าหมายดังกล่าว จึงได้มีการพัฒนา dicision rule ที่เรียกว่า "Minimax" [3] ซึ่งมีหลักการว่า ผู้เล่นแต่ละคนจะเลือกทางเลือกที่ให้ payoff (ผลตอบแทน) น้อยที่สุดออกมาแล้วพยายามหาทางเพิ่มค่า payoff ให้ได้มากที่สุด (maximize minimum payoff) แนวคิดนี้ได้เป็น decision rule หนึ่งในระบบ Artificial Intelligence ในปัจจุบัน
ในทางคณิตศาสตร์แล้ว game theory คือการศึกษาตัวแบบทางคณิตศาสตร์ (mathematical model) ที่ว่าด้วยเรื่องของข้อขัดแย้ง, ความร่วมมือและการแข่งขันกันระหว่างผู้เล่น (ที่มีข้อมูลและอำนาจตัดสินใจ) [2] หรืออาจมองว่าเป็นศาสตร์ที่เกี่ยวข้องกับการกำหนดกลยุทธหรือการกำหนดขอบเขตการตัดสินที่เหมาะสมภายใต้เงื่อนไขหรือกติกาหนึ่งๆ ก็ได้
John Nash ได้ขยายแนวคิดของ Game theory ออกไป โดยเพิ่มมุมมองว่า มนุษย์ไม่จำเป็นต้องทำตัวเป็นศัตรูกันตลอดเวลา มนุษย์เพียงต้องการผลตอบแทนที่เหมาะสมกับสถานการณ์ [4] Nash จึงได้เสนอสิ่งที่เรียกว่า Nash equilibrium [5] ซึ่งเป็นสถานะของเกมที่ไม่มีผู้เล่นคนใดได้รับ payoff เพิ่มจาการเปลี่ยนแปลงกลยุทธที่อยู่ในขณะนั้น ตัวอย่างสถานการณ์ที่มักถูกยกมาเป็นตัวอย่างเพื่อให้เข้าใจ Nash's equilibrium คือ Prisoners' dilemma ซึ่งจะกล่าวถึงต่อไป
Prisoners' dilemma
Prisoners' dilemma เป็นเรื่องราวที่มักถูกยกเป็นตัวอย่างในการอธิบายเรื่อง Nash equilibrium อยู่บ่อย รายละเอียดอาจแตกต่างกันไปแล้วแต่ผู้เขียน แต่หลักการเหมือนกัน เรื่องมีอยู่ว่า
มีอาชญากร 2 คน สมมุติให้ชื่อเป็น A,B ถูกจับได้ ทั้งสองถูกจับและนำมาขังแยกกันโดยที่ไม่สามารถจะสื่อสารกันได้ อัยการ (prosecutors) ยังไม่มีหลักฐานเพียงพอสำหรับข้อหาหลัก แต่มีเพียงพอสำหรับข้อหารอง อัยการต้องการต่อรอง โดยยื่นข้อเสนอให้อาชญากรแต่ละคน (แยกกันคุย) ได้ทางเลือกดังนี้
• ถ้า A หรือ B ต่างให้การซัดทอดอีกฝ่าย แต่ละคนจะได้รับการเสนอโทษจำคุก 2 ปี
• ถ้า A ให้การซัดทอด B แต่ B ไม่ซัดทอด A แล้ว A จะไดัรับการเสนอให้ปล่อยตัว ส่วน B จะได้รับการเสนอโทษจำคุก 3 ปี
• ถ้า B ให้การซัดทอด A แต่ A ไม่ซัดทอด B แล้ว B จะไดัรับการเสนอให้ปล่อยตัว ส่วน A จะได้รับการเสนอโทษจำคุก 3 ปี
• ถ้า A และ B ไม่ยอมให้การใดๆ เลย ทั้งคู่จะได้รับการเสนอโทษจำคุก 1 ปี
Payoff matrices
คือรูปแบบการนำเสนอผลลัพธ์ (result) จากทางเลือกของผู้เล่นแต่ละรายในเกมหนึ่งๆ โดยไม่ได้บอกถึงโครงสร้างหรือวิธีการดำเนินการของเกม
จากเรื่อง Prisoners' dilemma นำเอาเงื่อนไขมาเขียนเป็น payoff matrix ได้ดังภาพที่ 1
ภาพที่ 1 payoff matrix ของ prisoners dilemma |
ภาพที่ 1 แสดง payoff matrix อย่างง่าย ประกอบด้วยผู้เล่น 2 ราย A (อักษรสีแดง) และ B (อักษรสีฟ้า) ทั้งคู่มีทางเลือก (strategies) 2 ทาง คือ \( A = \{ \text{'A stays silent'},\text{'A betrays'} \}\) และ \( B = \{ \text{'B stays silent'},\text{'B betrays'} \}\) จำนวนสถานะที่เป็นไปได้ทั้งหมดคือผลคูณของจำนวนทางเลือกที่มีของผู้เล่นทุกราย ในตัวอย่างนี้จะมีสถานะทั้งหมดเป็น \(2 \times 2 = 4 \) สถานะ แทนด้วยตาราง 4 ช่อง (grid) แต่ละช่องมีตัวเลขแสดงค่า payoff ที่ได้จากทางเลือกนั้นๆของผู้เล่นแต่ละราย เช่น ถ้า A และ B เลือก 'Stays silent' เหมือนกัน ค่า payoff ของ A และ B ที่จะนำมาพิจารณาคือตัวเลขที่อยู่ในช่องซ้าย-บน คือ \( (-1,-1 ) \)
การพิจารณาค่า payoff ของผู้เล่นจะใช้การเปรียบเทียบ "มากกว่า" หรือ "น้อยกว่า" ไม่ได้ให้ความสนใจไปที่ความต่างของตัวเลขและค่า payoff ของผู้เล่นรายอื่น เมื่อเปรียบเทียบค่า payoff ระหว่าง 2 ทางเลือก จะกล่าวว่า ทางเลือกที่ให้ payoff มากกว่า "dominates" ทางเลือกที่ให้ค่า payoff น้อยกว่า หรือจะกล่าวว่า ทางเลือกที่ให้ payoff น้อยกว่าถูก "dominated" และเลือกที่ dominates ทุกทางเลือกที่เหลือกแล้ว จะเรียกทางเลือกนั้น "dominant" ยกตัวอย่างเช่น พิจารณาภาพที่ 1
1) ถ้า A เลือก 'A stays silent' แล้ว ทางเลือก 'B betrays' dominates 'B stays silent' หรือ 'B stays silent' is dominated by 'B betrays' สำหรับผู้เล่น B
2) ถ้า A เลือก 'A betrays' แล้ว ทางเลือก 'B betrays' dominates 'B stays silent' หรือ 'B stays silent' is dominated by 'B betrays' สำหรับผู้เล่น B
3) ดังนั้น สำหรับ B แล้ว ทางเลือก 'B betrays' คือ dominant เพราะเป็นทางเลือกที่ dominates ทางเลือกอื่นหรือให้ payoff มากกว่าทางเลือกอื่นที่มีอยู่ ไม่ว่า A จะเลือกทางใด
การหา Nash equilibrium
จากที่กล่าวไปก่อนหน้านี้ว่า Nash equilibrium คือสภาวะที่ไม่มีผู้เล่นรายใดจะได้ payoff เพิ่มจากการเปลี่ยนทางเลือก นั่นคือ Nash equilibrium เกิดขึ้นเมื่อเกมอยู่ในช่อง (grid) ตำแหน่งที่ผู้เล่นทุกรายได้ใช้ dominant ของตัวเอง
จากที่กล่าวมาก่อนหน้านี้ เราทราบแล้วว่า 'B betrays' คือทางเลือก dominant ของ B มาพิจารณาทางฝั่งของ A บ้าง
1) ถ้า B ใช้ทางเลือก 'B stays silent' แล้ว ทางเลือก 'A betrays' dominates 'A stays silent'
2) ถ้า B ใช้ทางเลือก 'B betrays' แล้ว ทางเลือก 'A betrays' dominates 'A stays silent'
3) ดังนั้น สำหรับ A แล้ว ทางเลือก 'A betrays' คือ dominant ไม่ว่า B จะเลือกทางใด
จากการพิจารณาทั้งหมด สถานะของเกมที่ A เลือก 'A betrays' และ B เลือก 'B betrays' อยู่ที่ช่องขวา-ล่าง ตามภาพที่ 1 สภาวะของเกมในรูปแบบนั้นเรียกว่า "Nash equilibrium" จากสภาวะนี้ หาก B เปลี่ยนทางเลือกที่ต่างออกไปจากสภาวะนี้ ค่า payoff จะลดลงจาก \( -2 \rightarrow -3 \) กับ A ก็เช่นเดียวกัน นั่นคือการขยายความจากที่กล่าวว่า "ไม่มีผู้เล่นรายใดจะได้ payoff เพิ่มขึ้นจากการเปลี่ยนทางเลือก" ในการให้ความหมายของ Nash equilibrium
Nash equilibrium กับการเข่งขันทางการตลาด
เหตุการณ์สมมุติ ถ้ามีบริษัท A,และ B เป็นคู่แข่งกันทางธุรกิจ บริษัท A มีทรัพยากรและขนาดของตลาดที่มากกว่า B วันหนึ่ง ทั้งสองมีแผนที่จะสินค้าที่เหมือนกันออกสู่ตลาดในช่วงเวลาเดียวกัน บริษัทวิจัยทางการตลาดแห่งหนึ่งทำการศึกษากรณีนี้แล้วสร้าง payoff matrix ขึ้นมาดังภาพที่ 2
ภาพที่ 2 |
ขั้นตอนการหา Nash equilibrium ในกรณีนี้คือ
1) ถ้า A เลือก release ทางเลือกของ B ที่ dominates คือ don't release (วงกลมสีฟ้าในภาพที่ 3 a)
2) ถ้า A เลือก don't release ทางเลือกของ B ที่ dominates คือ release (วงกลมสีฟ้าในภาพที่ 3 a)
3) ถ้า B เลือก release ทางเลือกของ A ที่ dominates คือ release (วงกลมสีแดงในภาพที่ 3 c)
4) ถ้า B เลือก don't release ทางเลือกของ A ที่ domimates คือ release (วงกลมสีแดงในภาพที่ 3 d)
ภาพที่ 3 |
สรุปว่าภาวะ Nash equilibrium เกิดขึนเมื่อผู้เล่นทุกคนได้ทางเลือกที่เป็น domimates คือสถาวะที่แสดงในภาพที่ 3 d นั่นคือ A ควรทำการ release สินค้าตามกำหนด ในขณะที่ B ควรเลื่อนการ release สินค้าออกไป
Mixed strategy Nash equilibrium
ในกรณีของการออกสินค้าของ A และ B ที่กล่าวถึงก่อนหน้า Nash equlibrium จะเกิดขึ้นเมื่อ A ทำการ release ส่วน B ไม่ release ถ้าทั้งสองยึดตามนี้จะเรียกวิธีคิดนี้ว่า pure strategy แต่ภายใต้แนวคิดของ mixed strategy จะมองว่า ทุกคนจะเลือกทางเลือกของตัวเองแบบสุ่ม (randomized) ยังมีความเป็นไปได้ที่ B จะเลือกการ release หรือ A อาจเลือกการไม่ release จะด้วยเหตุผลใดก็แล้วแต่ การคำนวณหา Nash equilibrium ภายใต้แนวคิดนี้จะต้องใช้ความรู้เรื่อง probability มาช่วย
ภาพที่ 4 |
ดูตัวแบบ payoff matrix แบบง่าย (ภาพที่ 4)
1) มีผู้เล่นสองคน A และ B
2) A มีทางเลือกเป็น \( \{S_1^A,S_2^A\} \)
3) B มีทางเลือกเป็น \( \{S_1^B,S_2^B\} \)
4) ค่า payoff เป็น \( \{U_1^B,U_2^B,U_3^B,U_4^B,U_2^A,U_3^A,U_1^A,U_4^A\} \)
พิจารณาทางฝ่าย B : :
ถ้า B มองว่า A จะเลือกใช้ \( S_1^A \) ด้วยค่าความน่าจะเป็น \( P(S_1^A) \) แล้วค่าความน่าจะเป็นที่ A จะเลือกใช้ \( S_2^A \) ต้องเป็น \( 1 - P(S_1^A) \) ค่า expected payoff ของ B ที่ได้รับจากการเลือกทาง \( S_1^B \) หรือ \( S_2^B \) คำนวณได้จาก
\[ \begin{align*} E(S_1^B) &= P(S_1^A)U_1^B + (1 - P(S_1^A))U_3^B \tag{1} \\ E(S_2^B) &= P(S_1^A)U_2^B + (1 - P(S_1^A))U_4^B \tag{2} \\ \end{align*} \]พิจารณาทางฝ่าย A :
ถ้า A มองว่า B จะเลือกใช้ \( S_1^B \) ด้วยค่าความน่าจะเป็น \( P(S_1^B) \) แล้วค่าความน่าจะเป็นที่ B จะเลือกใช้ \( S_2^B \) ต้องเป็น \( 1 - P(S_1^B) \) ค่า expected payoff ที่ A จะได้รับจากการเลือกทาง \( S_1^A \) หรือ \( S_2^A \) คำนวณได้จาก
\[ \begin{align*} E(S_1^A) &= P(S_1^B)U_1^A + (1 - P(S_1^B))U_2^A \tag{3} \\ E(S_2^A) &= P(S_1^B)U_3^A + (1 - P(S_1^B))U_4^A \tag{4} \\ \end{align*} \]ทดลองกรณีของบริษัท A, B ในเกมของการปล่อยสินค้าออกตลาดอีกครั้ง โดยใช้ payoff matrix เดิม ถ้ากำหนดให้ค่าความน่าจะเป็นที่ A จะปล่อยสินค้าเป็น \( P(S_1^A) = \frac{2}{5} \) ค่า expectation ที่ B จะได้ในแต่ละทางเลือกคือ
จาก (1) และ (2) :
\[ \begin{align*} E(S_1^B) &= \frac{2}{5} \times (-2) + (1 - \frac{2}{5}) \times 5 \\ E(S_1^B) &= 2.2 \\\\ E(S_2^B) &= \frac{2}{5} \times 0 + (1 - \frac{2}{5}) \times 0 \\ E(S_2^B) &= 0.0 \\\\ \end{align*} \]ค่า expected payoff ของ B ชี้ว่าควรเลือก release สินค้า ซึ่งต่างจากผลที่วิเคราะห์ด้วย pure strategy อธิบายได้ว่า เนื่องจาก \( P(S_1^A) = \frac{2}{5} \) ซึ่งมีค่าต่ำกว่า 0.5 หรือตีความได้ว่า โอกาสที่ A จะ release สินค้ามีน้อยลง ทำให้แนวโน้มที่ B จะได้ประโยชน์จากการ release สินค้ามีมากขึ้น
ถ้าลองเพิ่มค่า \(P(S_1^A) = \frac{5}{6} \) (โอกาสที่ A จะ release สินค้าค่อนข้างสูง) และลดค่าความน่าจะเป็นที่ B ใช้ทางเลือก \(P(S_1^B) = \frac{1}{6} \)
\begin{align*} E(S_1^B) &= \frac{5}{6} \times (-2) + (1 - \frac{5}{6})\times 5 \\ E(S_1^B) &= -0.83 \\\\ E(S_2^B) &= \frac{5}{6} \times 0 + (1 - \frac{5}{6}) \times 0 \\ E(S_2^B) &= 0.0 \\\\ \end{align*}ภาพที่ได้ค่อนข้างชัดเจนว่า หาก A มีแนวโน้มจะ release สินค้าสูงขึ้น แนวโน้มที่ B จะได้ประโยชน์จากการ release สินค้าจะน้อยลง
ทดลองอีกครั้งกับบริษัท A โดยให้ค่าความน่าจะเป็นที่ผลที่ B จะ release สินค้าเป็น \( P(S_1^B) = \frac{5}{6} \) (โอกาสที่จะ release สินค้าค่อนข้างสูง) และ \( P(S_1^B) = \frac{1}{6} \) (โอกาสที่จะ release สินค้าค่อนข้างต่ำ) คำนวณค่า expected payoff ของ A
จาก (3) และ (4) :
\[ \begin{align*} E(S_1^A) &= \frac{5}{6} \times 2 + (1 - \frac{5}{6}) \times 5 \\ E(S_1^A) &= 2.5 \\\\ E(S_2^A) &= \frac{5}{6} \times 2 + (1 - \frac{5}{6}) \times 2 \\ E(S_2^A) &= 0.0 \\\\ E(S_1^A) &= \frac{1}{6} \times 2 + (1 - \frac{1}{6}) \times 5 \\ E(S_1^A) &= 4.5 \\\\ E(S_2^A) &= \frac{1}{6} \times 2 + (1 - \frac{1}{6}) \times 2 \\ E(S_2^A) &= 0.0 \end{align*} \]ผลที่ได้ออกมาบอกว่า ไม่ว่าแนวโน้มของ B จะเป็นอย่างไร A ก็ยังคงได้ค่า expected payoff กับการ release สินค้า ทั้งนี้อาจเพราะ A มีทรัพยากรและขนาดของตลาดที่ได้เปรียบ B อยู่แล้ว
จากตัวอย่างการคำนวณทำให้เห็นว่าแนวคิดของ mixed strategy ไม่ได้ระบุชัดเจนว่าจะต้องเลือกทางเลือกใดแบบเดียวกับ pure strategy แต่ใช้การระบุออกมาเป็นค่าคาดหวังของ payoff แทน ซี่งนัยเรื่องความน่าจะเป็นอยู่ด้วย
ค่าความน่าจะเป็น \( P(S_1^A), P(S_1^B) \) เป็นค่าที่นำไปสู่ equlibrium ต้องเป็นค่าที่ทำให้ expected payoff ที่จะได้จากแต่ละทางเลือกของคู่แข่งมีค่าเท่าหรือใกล้เคียงกัน
1) \( P(S_1^A) \) ที่ทำให้ \( E(S_1^B) = E(S_2^B)\) และ
2) \( P(S_1^B) \) ที่ทำให้ \( E(S_1^A) = E(S_2^A)\)
(1) = (2) :
\[ \begin{align*} P(S_1^A)U_1^B + (1 - P(S_1^A))U_3^B &= P(S_1^A)U_2^B + (1 - P(S_1^A))U_4^B \\ P(S_1^A)U_1^B + U_3^B -P(S_1^A)U_3^B &= P(S_1^A)U_2^B + U_4^B - P(S_1^A)U_4^B \\ P(S_1^A)U_1^B -P(S_1^A)U_3^B -P(S_1^A)U_2^B + P(S_1^A)U_4^B &= U_4^B - U_3^B \\ P(S_1^A)[U_1^B -U_3^B -U_2^B + U_4^B] &= U_4^B - U_3^B \\\\ \therefore P(S_1^A) &= \frac{U_4^B - U_3^B} {U_1^B -U_3^B -U_2^B + U_4^B} \tag{5} \\ \end{align*} \](3) = (4) :
\[ \begin{align*} P(S_1^B)U_1^A + (1 - P(S_1^B))U_2^A &= P(S_1^B)U_3^A + (1 - P(S_1^B))U_4^A \\ P(S_1^B)U_1^A + U_2^A - P(S_1^B)U_2^A &= P(S_1^B)U_3^A + U_4^A - P(S_1^B)U_4^A \\ P(S_1^B)U_1^A - P(S_1^B)U_3^A - P(S_1^B)U_2^A + P(S_1^B)U_4^A &= U_4^A - U_2^A \\ P(S_1^B)[U_1^A -U_3^A -U_2^a + U_4^A] &= U_4^A - U_2^A \\\\ \therefore P(S_1^B) &= \frac{U_4^A - U_2^A} {U_1^A -U_3^A -U_2^A + U_4^A} \tag{6} \\ \end{align*} \]หมายเหตุ การหาความน่าจะเป็นตาม (5),(6) คือเป็นไปได้ว่าค่าที่คำนวณออกมาได้จะไม่อยู่ในช่วง [0,1] หากได้มาจะต้องไม่นำไปใช้ และค่า expected payoff ที่คำนวณได้จากค่าความน่าจะเป็นที่หามาได้นี้ อาจไม่ได้มีค่าเท่ากันเสมอไป
Mixed strategy ในการแข่งขันฟุตบอลล์
มาดูตัวอย่างการศึกษาของ Ignacio Paracios-Huerta [7] เขาทำการเก็บข้อมูลการเตะลูกโทษ (penalty kicks) ในเกมการแข่งขันฟุตบอลล์รายการต่างๆ ในยุโรปจำนวน 1,417 การแข่งขัน การเตะลูกโทษถือเป็นเกมระหว่าง ผู้เตะ (kickers) กับ ผู้รักษาประตู (goal keepers) ผู้เตะมีทางเลือก 2 ทางคือเตะไปทางซ้ายหรือทางขวาของตัวเอง ผู้รักษาประตูก็เช่นเดียวกัน โดยทิศทางจะใช้มุมมองจากผู้เตะเป็นหลัก payoff matrix ที่แสดงในภาพที่ 5 แสดง success rate ของผู้เตะในรูปของเปอร์เซ็นต์ในการทำประตู ซึ่งจะเห็นว่าถ้าผู้รักษาประตูพุ่งไปทางเดียวกับที่นักเตะเตะลูกบอลล์ไป โอกาสที่จะได้คะแนนของผู้เตะจะลดลง
ภาพที่ 5 |
จากข้อมูลเมื่อนำไปสร้าง payoff matrix ได้ดังภาพที่ 6
ภาพที่ 6 |
ให้ \(P^G(L) \) คือ ความน่าจะเป็นที่ผู้รักษาประตูจะพุ่งไปทางซ้าย(มองจากด้านผู้เตะ) จากสมการ (6) จะได้
\[ \begin{align*} P^G(L) &= \frac{69.72 - 94.87} {58.30 - 93.91 - 94.87 + 69.7} \\ P^G(L) &= 0.413 \end{align*} \]ค่าของ \(P^G(L) = 0.413 \) ตีความว่า ผู้รักษาประตูตัองพุ่งตัวไปทางซ้าย(มองจากด้านผู้เตะ)ประมาณ 41 - 42 ครั้งต่อการรับลูกโทษ 100 ครั้ง จึงจะทำให้ success rate ของนักเตะไม่ต่างกันไม่ว่าจะเลือกเตะไปทางซ้ายหรือขวา
มาดูอีกฝั่งบ้าง ถ้าให้ \(P^K(L) \) คือ ความน่าจะเป็นที่ผู้เตะจะเตะลูกบอลล์ไปทางซ้าย จากสมการ (5) จะได้
\[ \begin{align*} P^K(L) &= \frac{30.28 - 7.09} {41.7 - 7.09 - 5.03 + 30.28} \\ P^K(L) &= 0.387 \end{align*} \]ค่าของ \(P^K(L) = 0.387 \) ตีความว่า นักเตะตัองเตะบอลล์ไปทางซ้ายประมาณ 38 - 39 ครั้งต่อการเตะลูกโทษ 100 ครั้ง จึงจะทำให้ success rate ของผู้รักษาประตูไม่ต่างกันไม่ว่าจะผู้รักษาประตูจะพุ่งตัวไปทางซ้ายหรือขวา
นำค่า \(P^K(L), P^G(L) \) ที่ได้มาคำนวณหา expected payoff ของทั้งผู้รักษาประตูและผู้เตะ
ให้ \(E^G(L), E^G(R) \) คือ expected payoff ของผู้รักษาประตูเมื่อพุ่งตัวไปทางซ้ายและขวาตามลำดับ โดยนักเตะจะเตะไปทางซ้ายด้วยความน่าจะเป็น 0.387
\[ \begin{align*} E^G(L) &= 0.387 \times 41.7 + (1 - 0.387) \times 7.09 = 20.48 \\ E^G(R) &= 0.387 \times 5.03 + (1 - 0.387) \times 30.28 = 20.50 \\ \end{align*} \]ค่าของ \(E^K(L), E^G(R) \)ที่ได้มีความใกล้เคียงกันมากตีความว่า ถ้าผู้เตะเตะไปทางซ้ายมือด้วยความน่าจะเป็น 0.387 ไม่ว่าผู้รักษาประตูจะพุ่งไปทางซ้ายหรือขวาก็จะมี success rate (การป้องกันลูกเข้าประตู)ได้ไม่ต่างกัน
ให้ \(E^K(L), E^K(R) \) คือ expected payoff ของผู้เตะที่จะได้เมื่อเตะลุกไปทางซ้ายและขวาตามลำดับ โดยผู้รักษาประตูพุ่งตัวไปทางซ้ายด้วยความน่าจะเป็น 0.413
\[ \begin{align*} E^K(L) &= 0.413 \times 58.30 + (1 - 0.413) \times 94.87 = 79.77 \\ E^K(R) &= 0.413 \times 93.91 + (1 - 0.413) \times 69.72 = 79.71 \\ \end{align*} \]จะเห็นได้ว่าค่าของ \(E^K(L), E^K(R) \) ที่ได้มีความใกล้เคียงกันมากตีความว่า ถ้าผู้รักษาประตูพุ่งตัวไปทางซ้ายมือด้วยความน่าจะเป็น 0.413 แล้ว ไม่ว่าผู้เตะจะเตะบอลล์ไปทางซ้ายหรือขวาก็จะมี success rate (เตะลูกเข้าประตู)ได้ไม่ต่างกัน
ในข้อเขียนนี้ ได้เริ่มจากกล่าวถึงแนวคิดของ Game theory ต่อด้วย Nash equilibrium ทั้งความหมายและการคำนวณหา ด้วยหลักการแบบกว้าง พอเป็นแนวทางในการศึกษาต่อไป หากสนใจ เรื่องราวของ Game theory ได้ถูกต่อยอด ประยุกต์ใช้กับสาขาวิชาอื่นมากมาย เช่น เศรษฐศาสตร์ กฏหมาย การกีฬา artificial intelligence ฯล ดังนั้นจึงนับเป็นการดีที่จะได้ทำความรู้จักกับ Game theory ไว้เพราะในชีวิตประจำวันของมนุษย์เราก็เหมือนกับการเล่นเกมตลอดเวลาอยู่แล้ว
ความคิดเห็น
แสดงความคิดเห็น