คณิตศาสตร์ทฤษฎีเกม

เกมผลรวมตัวแปรสองคน

งานส่วนใหญ่ในช่วงต้นของทฤษฎีเกมเป็นเกมสองคนคงที่เนื่องจากพวกเขาง่ายที่สุดในการรักษาทางคณิตศาสตร์ ผู้เล่นในเกมดังกล่าวมีผลประโยชน์ขัดแย้งและมีมติเป็นเอกฉันท์เกี่ยวกับสิ่งที่ถือเป็นการแก้ปัญหา (ตามที่ได้รับจากทฤษฎีบท minimax) อย่างไรก็ตามเกมส่วนใหญ่ที่เกิดขึ้นในทางปฏิบัตินั้นเป็นเกมผลรวมตัวแปร ผู้เล่นมีความสนใจร่วมกันและไม่เห็นด้วย ตัวอย่างเช่นผู้ซื้อและผู้ขายมีส่วนร่วมในเกมผลรวมตัวแปร (ผู้ซื้อต้องการราคาต่ำและผู้ขายสูง แต่ทั้งคู่ต้องการทำข้อตกลง) เช่นเดียวกับสองประเทศที่เป็นศัตรู (พวกเขาอาจไม่เห็นด้วยกับหลาย ๆ ปัญหา แต่ทั้งคู่ได้รับหากพวกเขาหลีกเลี่ยงการทำสงคราม)

พฤติกรรมก้าวร้าว: ทฤษฎีเกม: โมเดล Hawk-Dove

ผลของการเพิ่มความหนาแน่นของคู่แข่งต่อการป้องกันดินแดนแสดงให้เห็นว่าการออกกำลังกายส่งผลต่อพฤติกรรมของบุคคลใน

คุณสมบัติ“ ชัดเจน” ของเกมผลรวมคงที่สองคนไม่ถูกต้องในเกมผลรวมผันแปร ยกตัวอย่างเช่นในเกมผลรวมคงที่ผู้เล่นทั้งสองไม่สามารถได้รับ (พวกเขาอาจหรืออาจไม่แพ้ แต่พวกเขาทั้งสองไม่ได้) ถ้าพวกเขาถูกกีดกันจากกลยุทธ์บางอย่างของพวกเขา อย่างไรก็ตามในเกมผลรวมตัวแปรผู้เล่นอาจได้รับหากกลยุทธ์บางอย่างไม่มีอยู่อีกต่อไป สิ่งนี้อาจดูเป็นไปไม่ได้ในตอนแรก ใคร ๆ ก็คิดว่าถ้าผู้เล่นได้รับประโยชน์จากการไม่ใช้กลยุทธ์บางอย่างผู้เล่นก็จะหลีกเลี่ยงกลยุทธ์เหล่านั้นและเลือกกลยุทธ์ที่มีประโยชน์มากกว่า แต่นี่ไม่ใช่กรณีเสมอไป ตัวอย่างเช่นในภูมิภาคที่มีการว่างงานสูงคนงานอาจเต็มใจรับเงินเดือนที่ต่ำกว่าเพื่อให้ได้งานหรือทำงาน แต่ถ้ากฎหมายค่าแรงขั้นต่ำทำให้ทางเลือกนั้นผิดกฎหมายคนงานอาจถูก "บังคับ" ให้รับเงินเดือนที่สูงขึ้น

ผลของการสื่อสารโดยเฉพาะอย่างยิ่งการเปิดเผยความแตกต่างระหว่างเกมผลรวมคงที่และผลรวมของตัวแปร ในเกมผลรวมคงที่มันไม่เคยช่วยผู้เล่นให้ข้อมูลที่เป็นปฏิปักษ์และไม่เคยทำร้ายผู้เล่นเพื่อเรียนรู้กลยุทธ์ที่ดีที่สุดของฝ่ายตรงข้าม (บริสุทธิ์หรือผสม) ล่วงหน้า อย่างไรก็ตามคุณสมบัติเหล่านี้ไม่จำเป็นต้องเก็บไว้ในเกมผลรวมตัวแปร อันที่จริงผู้เล่นอาจต้องการให้คู่ต่อสู้ได้รับข้อมูลที่ดี ในข้อพิพาทด้านการจัดการแรงงานตัวอย่างเช่นหากสหภาพแรงงานพร้อมที่จะนัดหยุดงานสหภาพแรงงานจะแจ้งให้ฝ่ายบริหารทราบและอาจบรรลุเป้าหมายโดยไม่มีการนัดหยุดงาน ในตัวอย่างนี้การจัดการไม่ได้รับอันตรายจากข้อมูลล่วงหน้า (เช่นกันประโยชน์โดยหลีกเลี่ยงการนัดหยุดงานค่าใช้จ่ายสูง) ในเกมผลรวมตัวแปรอื่น ๆ การรู้กลยุทธ์ของคู่ต่อสู้อาจทำให้เสียเปรียบ ตัวอย่างเช่นผู้แบล็กเมล์สามารถได้รับประโยชน์เฉพาะในกรณีที่เขาแจ้งเหยื่อก่อนว่าเขาจะทำอันตรายเขา - โดยทั่วไปแล้วจะเปิดเผยรายละเอียดที่ละเอียดอ่อนและเป็นความลับเกี่ยวกับชีวิตของเหยื่อ - หากไม่ปฏิบัติตามข้อกำหนดของเขา สำหรับภัยคุกคามที่จะมีความน่าเชื่อถือเหยื่อต้องกลัวการเปิดเผยและเชื่อว่าผู้ส่งจดหมายหลอกลวงมีความสามารถในการดำเนินการคุกคาม (ความน่าเชื่อถือของการข่มขู่เป็นคำถามที่ศึกษาทฤษฎีเกม) แม้ว่าผู้โจมตีอาจจะสามารถทำร้ายผู้เคราะห์ร้ายได้โดยไม่ต้องมีการสื่อสารใด ๆ ผู้ส่งสารไม่สามารถรีดไถเหยื่อได้เว้นแต่เขาจะแจ้งเหยื่อถึงเจตนาและผลที่ตามมา ดังนั้นความรู้ของเหยื่อเกี่ยวกับกลยุทธ์ของแบล็กเมล์รวมถึงความสามารถของเขาและความตั้งใจที่จะดำเนินการกับภัยคุกคามนั้นเป็นไปเพื่อประโยชน์ของแบล็กเมล์

ร่วมมือกับเกมที่ไม่ร่วมมือ

การสื่อสารไม่มีจุดหมายในเกมที่มีผลรวมคงที่เนื่องจากไม่มีความเป็นไปได้ที่จะได้รับผลประโยชน์ร่วมกันจากการร่วมมือกัน ในเกมผลรวมตัวแปรความสามารถในการสื่อสารระดับการสื่อสารและแม้แต่ลำดับที่ผู้เล่นสื่อสารสามารถมีอิทธิพลอย่างลึกซึ้งต่อผลลัพธ์

ในเกมผลรวมตัวแปรที่แสดงในตารางที่ 3 แต่ละรายการเมทริกซ์ประกอบด้วยตัวเลขสองตัว (เนื่องจากความมั่งคั่งที่รวมกันของผู้เล่นไม่คงที่จึงเป็นไปไม่ได้ที่จะอนุมานการจ่ายเงินของผู้เล่นคนหนึ่งจากการจ่ายเงินของผู้อื่นดังนั้นการจ่ายเงินของผู้เล่นทั้งสองจะต้องได้รับ) หมายเลขแรกในแต่ละรายการคือ ผู้เล่น (ผู้เล่น A) และหมายเลขที่สองคือการจ่ายให้ผู้เล่นคอลัมน์ (ผู้เล่น B)

ในตัวอย่างนี้ผู้เล่น A จะได้เปรียบถ้าเกมนั้นร่วมมือกันและเพื่อประโยชน์ของผู้เล่น B หากเกมนั้นไม่ใช่ความร่วมมือ หากไม่มีการสื่อสารให้สันนิษฐานว่าผู้เล่นแต่ละคนใช้หลักการ“ แน่นอน”: จะเพิ่มผลตอบแทนขั้นต่ำให้มากที่สุดโดยการกำหนดขั้นต่ำที่จะได้รับทุกสิ่งที่คู่ต่อสู้ทำ ดังนั้น, A ระบุว่าจะเป็นการดีที่สุดที่จะเลือกกลยุทธ์ฉันไม่ว่า B จะทำอะไร: ถ้า B เลือก i, A จะได้ 3 โดยไม่คำนึงถึงสิ่งที่ A ทำ; ถ้า B เลือก ii, A จะได้ 4 แทนที่จะเป็น 3 B ในทำนองเดียวกันจะเป็นตัวตัดสินว่ามันจะเป็นการดีที่สุดที่จะเลือก i ไม่ว่า A จะทำอะไร การเลือกสองกลยุทธ์นี้ A จะได้ 3 และ B จะได้ 4 ที่ (3, 4)

อย่างไรก็ตามในเกมความร่วมมือ A สามารถขู่ว่าจะเล่น II เว้นแต่ว่า B ตกลงที่จะเล่น ii หาก B ตกลงการจ่ายเงินจะลดลงเป็น 3 ในขณะที่การจ่ายของ A จะเพิ่มขึ้นเป็น 4 ที่ (4, 3) ถ้า B ไม่เห็นด้วยและ A ดำเนินการกับภัยคุกคาม A จะไม่ได้รับและสูญเสียที่ (3, 2) เมื่อเทียบกับ (3, 4) แต่ B จะได้รับผลตอบแทนเพียง 2 อย่างชัดเจน A จะไม่ได้รับผลกระทบหาก B ไม่เห็นด้วยและมีภัยคุกคามที่น่าเชื่อถือ B จะได้รับผลกระทบและเห็นได้ชัดว่าจะทำได้ดีกว่าที่ (4, 3) มากกว่าที่ (3, 2) และควรปฏิบัติตามการคุกคาม

บางครั้งผู้เล่นทั้งสองจะได้รับจากความสามารถในการสื่อสาร นักบินสองคนที่พยายามหลีกเลี่ยงการชนกลางอากาศอย่างชัดเจนจะได้รับประโยชน์หากพวกเขาสามารถสื่อสารได้และระดับการสื่อสารที่อนุญาตระหว่างพวกเขาอาจกำหนดได้ว่าพวกเขาจะชนหรือไม่ โดยทั่วไปความสนใจของผู้เล่นสองคนมากขึ้นเท่ากันการสื่อสารที่สำคัญและเป็นประโยชน์ก็จะมากขึ้น

วิธีแก้ปัญหาสำหรับเกมความร่วมมือที่ผู้เล่นมีเป้าหมายร่วมกันคือการประสานงานการตัดสินใจของผู้เล่นอย่างมีประสิทธิภาพ นี่เป็นวิธีที่ค่อนข้างตรงไปตรงมาเช่นเดียวกับการค้นหาวิธีแก้ปัญหาของเกมที่มีผลรวมคงที่ สำหรับเกมที่ผู้เล่นมีทั้งความสนใจร่วมกันและความขัดแย้ง - กล่าวอีกนัยหนึ่งในเกมรวม - ตัวแปรไม่ว่าจะเป็นความร่วมมือหรือไม่ร่วมมือ - สิ่งที่ถือเป็นการแก้ปัญหานั้นยากที่จะกำหนดและโน้มน้าวใจมาก