Προηγμένες στρατηγικές θεωρίας παιγνίων για λήψη αποφάσεων

Eισαγωγή στην Οικονομία Βασισμένη στους Πόρους (Μάρτιος 2024)

Eισαγωγή στην Οικονομία Βασισμένη στους Πόρους (Μάρτιος 2024)
Προηγμένες στρατηγικές θεωρίας παιγνίων για λήψη αποφάσεων

Πίνακας περιεχομένων:

Anonim

Η θεωρία των παιχνιδιών, η μελέτη της στρατηγικής λήψης αποφάσεων, συγκεντρώνει διαφορετικούς κλάδους όπως τα μαθηματικά, την ψυχολογία και τη φιλοσοφία. Η θεωρία των παιχνιδιών επινοήθηκε από τον John von Neumann και τον Oskar Morgenstern το 1944 και από τότε έχει προχωρήσει πολύ. Η σημασία της θεωρίας των παιχνιδιών για τη σύγχρονη ανάλυση και τη λήψη αποφάσεων μπορεί να εκτιμηθεί από το γεγονός ότι από το 1970 μέχρι και 12 κορυφαίοι οικονομολόγοι και επιστήμονες έχουν βραβευτεί με το βραβείο Νόμπελ στις Οικονομικές Επιστήμες για τη συμβολή τους στη θεωρία των παιχνιδιών.

Η θεωρία των παιχνιδιών εφαρμόζεται σε πολλούς τομείς, όπως η επιχειρηματικότητα, η οικονομία, η οικονομία, οι πολιτικές επιστήμες και η ψυχολογία. Η κατανόηση των στρατηγικών θεωρίας παιγνίων - τόσο δημοφιλείς όσο και κάποιες από τις σχετικά λιγότερο γνωστές στρατηγικές - είναι σημαντική για την ενίσχυση των συλλογιστικών και των δεξιοτήτων λήψης αποφάσεων σε έναν πολύπλοκο κόσμο.

Το δίλημμα του φυλακισμένου - Σε λίγα λόγια

Μια από τις πιο δημοφιλείς και βασικές στρατηγικές θεωρίας παιγνίων είναι το δίλημμα του φυλακισμένου. Αυτή η ιδέα διερευνά τη στρατηγική λήψης αποφάσεων που λαμβάνουν δύο άτομα τα οποία, ενεργώντας με το δικό τους ατομικό συμφέρον, καταλήγουν σε χειρότερα αποτελέσματα από ό, τι εάν είχαν συνεργασθεί μεταξύ τους κατά πρώτο λόγο.

Στο δίλημμα του φυλακισμένου, δύο υπόπτους που έχουν συλληφθεί για ένα έγκλημα κρατούνται σε χωριστά δωμάτια και δεν μπορούν να επικοινωνούν μεταξύ τους. Ο εισαγγελέας ενημερώνει καθένα ξεχωριστά ότι εάν αυτός (τον αποκαλεί ύποπτο 1) ομολογεί και καταθέτει εναντίον του άλλου, μπορεί να πάει ελεύθερος, αλλά αν δεν συνεργαστεί και ο ύποπτος 2, ο ύποπτος 1 θα καταδικαστεί σε τρία χρόνια φυλάκισης. Εάν και οι δύο ομολογούν, θα πάρουν ποινή δύο ετών, και αν δεν ομολογήσουν, θα καταδικαστούν σε ένα χρόνο στη φυλακή.

Ενώ η συνεργασία είναι η καλύτερη στρατηγική για τους δύο υπόπτους, όταν έρχονται αντιμέτωποι με ένα τέτοιο δίλημμα, οι έρευνες δείχνουν ότι οι πιο ορθολογικοί άνθρωποι προτιμούν να ομολογήσουν και να καταθέσουν εναντίον του άλλου προσώπου αντί να παραμείνουν σιωπηλοί και να πάρουν την ευκαιρία που το άλλο συμβαλλόμενο μέρος ομολογεί.

Στρατηγικές Θεωρίας Παιχνιδιών

Το Δίλημμα του Θυγατέρου θέτει τα θεμέλια για στρατηγικές προηγμένης θεωρίας παιγνίων, στις οποίες οι δημοφιλείς στρατηγικές παιχνιδιών περιλαμβάνουν:

Matching Pennies

: Αυτό είναι ένα παιχνίδι με μηδενικό άθροισμα που περιλαμβάνει δύο παίκτες Ο παίκτης Α και ο παίκτης Β) τοποθετώντας ταυτόχρονα μια πένα στο τραπέζι, με την πληρωμή ανάλογα με το αν οι πένες ταιριάζουν. Εάν και οι δύο πένες είναι κεφαλές ή ουρές, ο παίκτης Α κερδίζει και κρατά την δεκάρα του παίκτη Β. Εάν δεν ταιριάζουν, ο Παίκτης Β κερδίζει και κρατά την δεκάρα του παίκτη Α.

Αδιέξοδο : Πρόκειται για ένα σενάριο κοινωνικού δίλημμα, όπως το δίλημμα του φυλακισμένου, ότι δύο παίκτες μπορούν είτε να συνεργαστούν είτε να ελαττώσουν (i.μι. δεν συνεργάζονται). Στο Deadlock, εάν ο παίκτης Α και ο παίκτης Β συνεργάζονται, ο καθένας παίρνει ένα κέρδος 1, και αν και οι δύο αποτύχουν, ο καθένας παίρνει μια αποζημίωση 2. Αλλά αν ο παίκτης Α συνεργάζεται και ο παίκτης Β ελαττώματα, τότε ο Α κερδίζει 0 και Β παίρνει μια πληρωμή 3. Στο διάγραμμα πληρωμής παρακάτω, ο πρώτος αριθμός στα κελιά (α) έως (d) αντιπροσωπεύει την πληρωμή του παίκτη Α και ο δεύτερος αριθμός είναι εκείνος του παίκτη Β:

Matrix Payoff Payoff < Παίκτης Β Συνεργαστείτε

Βλάβη

Παίκτης A

Συνεργαστείτε

(a) 1, 1

, 0

(d) 2, 2

Το αδιέξοδο διαφέρει από το δίλημμα του φυλακισμένου, καθώς η κυρίαρχη στρατηγική είναι η δράση με το μεγαλύτερο αμοιβαίο όφελος (δηλαδή και τα δύο ελαττώματα). Μια κυρίαρχη στρατηγική για έναν παίκτη ορίζεται ως μία που παράγει την υψηλότερη απόδοση οποιασδήποτε διαθέσιμης στρατηγικής, ανεξάρτητα από τις στρατηγικές που χρησιμοποιούν οι άλλοι παίκτες.

Ένα συχνά αναφερόμενο παράδειγμα της αδιέξοδο είναι αυτό των δύο πυρηνικών δυνάμεων που προσπαθούν να καταλήξουν σε συμφωνία για την εξάλειψη των οπλοστασίων των πυρηνικών βόμβων. Σε αυτή την περίπτωση, η συνεργασία προϋποθέτει την τήρηση της συμφωνίας, ενώ η απομάκρυνση σημαίνει ότι απορρίπτεται κρυφά η συμφωνία και διατηρείται το πυρηνικό οπλοστάσιο. Το καλύτερο αποτέλεσμα για κάθε έθνος, δυστυχώς, είναι να αρθεί η συμφωνία και να διατηρηθεί η πυρηνική επιλογή ενώ το άλλο έθνος εξαλείφει το οπλοστάσιό του, δεδομένου ότι αυτό θα δώσει στον πρώην ένα τεράστιο κρυφό πλεονέκτημα έναντι του τελευταίου αν ο πόλεμος ποτέ ξεσπάσει μεταξύ των δύο. Η δεύτερη καλύτερη επιλογή είναι να αποτύχουν ή να μην συνεργαστούν, καθώς διατηρούν το καθεστώς τους ως πυρηνικές δυνάμεις.

Ανταγωνισμός Cournot

: Το μοντέλο αυτό είναι εννοιολογικά παρόμοιο με το δίλημμα του φυλακισμένου και ονομάζεται από τον γαλλικό μαθηματικό Augustin Cournot, ο οποίος τον εισήγαγε το 1838. Η πιο κοινή εφαρμογή του μοντέλου Cournot περιγράφει ένα δυοπώλιο ή δύο κύρια παραγωγούς σε μια αγορά.

Για παράδειγμα, υποθέστε ότι δύο εταιρείες Α και Β παράγουν ένα πανομοιότυπο προϊόν και μπορούν να παράγουν μεγάλες ή μικρές ποσότητες. Αν και οι δύο συνεργάζονται και συμφωνούν να παράγουν σε χαμηλά επίπεδα, η περιορισμένη προσφορά θα μεταφραστεί σε υψηλή τιμή για το προϊόν στην αγορά και σημαντικά κέρδη και για τις δύο εταιρείες. Από την άλλη πλευρά, εάν αποτύχουν και παράγουν σε υψηλά επίπεδα, η αγορά θα κατακλυσθεί και θα οδηγήσει σε χαμηλή τιμή για το προϊόν και συνεπώς χαμηλότερα κέρδη. Αν όμως κάποιος συνεργάζεται (δηλαδή παράγει σε χαμηλά επίπεδα) και τα άλλα ελαττώματα (δηλ. Παράγει κρυφά σε υψηλά επίπεδα), τότε ο πρώτος μόλις σπάει ακόμη και όταν ο τελευταίος κερδίζει υψηλότερο κέρδος από ό, τι εάν και οι δύο συνεργάζονται.

Εμφανίζεται ο πίνακας απολαβών για τις εταιρείες Α και Β (τα στοιχεία αντιπροσωπεύουν κέρδος σε εκατομμύρια δολάρια). Έτσι, εάν η Α συνεργάζεται και παράγει σε χαμηλά επίπεδα, ενώ τα Β ελαττώματα και παράγει σε υψηλά επίπεδα, η απολαβή είναι όπως φαίνεται στο στοιχείο κυψέλης (b) - το όριο απομείωσης για την εταιρεία Α και τα κέρδη 7 εκατομμυρίων δολαρίων για την εταιρεία Β.

(Β) 0, 7

Βλάβη (c)

Εταιρεία Β

Συνεργασία

Βλάβη

) 7, 0

(δ) 2, 2

Συντονισμός

: Με συντονισμό, οι παίκτες κερδίζουν υψηλότερες απολαβές όταν επιλέγουν την ίδια πορεία δράσης.

Για παράδειγμα, εξετάστε δύο γίγαντες της τεχνολογίας που αποφασίζουν να εισαγάγουν μια ριζοσπαστική νέα τεχνολογία στα μάρκες μνήμης που θα μπορούσαν να τους κερδίσουν εκατοντάδες εκατομμύρια κέρδη ή μια αναθεωρημένη έκδοση παλαιότερης τεχνολογίας που θα τους αποφέρει πολύ λιγότερα. Εάν μια μόνο εταιρεία αποφασίσει να προχωρήσει με τη νέα τεχνολογία, η υιοθέτηση της αγοράς από τους καταναλωτές θα είναι σημαντικά χαμηλότερη και, ως εκ τούτου, θα κερδίσει λιγότερα από ό, τι και αν οι δύο εταιρείες αποφασίσουν για την ίδια πορεία δράσης. Ο πίνακας πληρωμής εμφανίζεται παρακάτω (τα στοιχεία αντιπροσωπεύουν κέρδος σε εκατομμύρια δολάρια).

Έτσι, αν και οι δύο εταιρείες αποφασίσουν να εισαγάγουν τη νέα τεχνολογία, θα κερδίσουν 600 εκατομμύρια δολάρια ανά τεμάχιο, ενώ εισάγοντας μια αναθεωρημένη έκδοση της παλαιότερης τεχνολογίας θα τους αποκόμιζαν 300 εκατομμύρια δολάρια το καθένα, όπως φαίνεται στην κελιά d. Αν όμως η Εταιρεία Α αποφασίσει μόνη της να εισαγάγει τη νέα τεχνολογία, θα κερδίσει μόνο 150 εκατομμύρια δολάρια, αν και η Εταιρεία Β θα κερδίσει $ 0 (πιθανώς επειδή οι καταναλωτές ενδέχεται να μην είναι πρόθυμοι να πληρώσουν για την τεχνολογία που έχει πλέον ξεπερασθεί). Στην περίπτωση αυτή, είναι λογικό και για τις δύο εταιρείες να συνεργαστούν και όχι μόνο.

Εταιρεία A

Νέα τεχνολογία

(α) 600, 600

β) 0, 150 < Παλαιά τεχνολογία

(γ) 150, 0 (δ) 300, 300

μερίδιο μιας σταδιακά αυξανόμενης απόσβεσης χρημάτων. Το παιχνίδι Στόπιασμα είναι διαδοχικό, δεδομένου ότι οι παίκτες κάνουν τις κινήσεις τους ένα μετά το άλλο και όχι ταυτόχρονα. κάθε παίκτης γνωρίζει επίσης τις στρατηγικές που επέλεξαν οι παίκτες που έπαιξαν ενώπιόν τους. Το παιχνίδι ολοκληρώνεται μόλις ο παίκτης παίξει το στοίχημα, με τον παίκτη να πάρει το μεγαλύτερο τμήμα και ο άλλος παίκτης να πάρει το μικρότερο τμήμα.

Για παράδειγμα, αν ο Παίκτης Α και ο Παίκτης Β παίζουν το παιχνίδι Σεντόνι, υποθέστε ότι ο Παίκτης Α πηγαίνει πρώτος και πρέπει να αποφασίσει αν πρέπει να «πάρει» ή να «περάσει» το στοίχημα, το οποίο ανέρχεται σήμερα σε $ 2. Εάν παίρνει, τότε το Α και το Β παίρνουν $ 1 το καθένα, αλλά εάν ο Α περάσει, η απόφαση να πάρει ή να περάσει τώρα πρέπει να γίνει από τον παίκτη Β. Αν το B παίρνει, παίρνει $ 3 (δηλαδή το προηγούμενο στοίχημα $ 2 + $ 1 ) και το Α παίρνει $ 0. Αλλά εάν το Β περάσει, ο Α παίρνει τώρα να αποφασίσει αν θα πάρει ή να περάσει και ούτω καθεξής. Εάν και οι δύο παίκτες πάντοτε επιλέξουν να περάσουν, κάθε ένας παίρνει μια πληρωμή $ 100 στο τέλος του παιχνιδιού.

Το σημείο του παιχνιδιού είναι ότι αν οι Α και Β συνεργάζονται και "περάσουν" στο τέλος του παιχνιδιού, παίρνουν τη μέγιστη αποζημίωση των $ 100 η κάθε μία. Αν όμως δεν εμπιστεύονται τον άλλο παίκτη και αναμένουν ότι θα "πάρουν" με την πρώτη ευκαιρία, τότε η ισορροπία Nash προβλέπει ότι οι παίκτες θα πάρουν τη χαμηλότερη δυνατή αξίωση ($ 1 σε αυτή την περίπτωση). Πειραματικές μελέτες έχουν δείξει, ωστόσο, ότι αυτή η "ορθολογική" συμπεριφορά (όπως προβλέπεται από τη θεωρία των παιχνιδιών) σπάνια εκτίθεται στην πραγματική ζωή. Αυτό δεν αποτελεί έκπληξη intuitively δεδομένου του μικρού μεγέθους της αρχικής πληρωμής σε σχέση με την τελική. Παρόμοια συμπεριφορά από πειραματικά θέματα έχει επίσης εκδηλωθεί στο δίλημμα του ταξιδιώτη.

Το δίλημμα του ταξιδιώτη

: Πρόκειται για ένα παιχνίδι μη μηδενικού αθροίσματος στο οποίο και οι δύο παίκτες προσπαθούν να μεγιστοποιήσουν τη δική τους ανταμοιβή ανεξάρτητα από την άλλη. Σχεδιασμένο από τον οικονομολόγο Kaushik Basu το 1994, στο δίλημμα του ταξιδιώτη, μια αεροπορική εταιρεία συμφωνεί να καταβάλει στους ταξιδιώτες δύο αποζημιώσεις για αποζημιώσεις σε πανομοιότυπα στοιχεία. Ωστόσο, οι δύο ταξιδιώτες πρέπει ξεχωριστά να υπολογίσουν την αξία του στοιχείου, με ελάχιστο ποσό $ 2 και μέγιστο ποσό $ 100. Εάν και οι δύο καταγράψουν την ίδια τιμή, η αεροπορική εταιρεία θα επιστρέψει σε κάθε ένα από αυτά το ποσό. Αν όμως οι τιμές διαφέρουν, η αεροπορική εταιρεία θα τους πληρώσει τη χαμηλότερη αξία, με ένα επίδομα $ 2 για τον ταξιδιώτη που κατέγραψε αυτή τη χαμηλότερη αξία και μια ποινή $ 2 για τον ταξιδιώτη που κατέγραψε την υψηλότερη τιμή.

Το επίπεδο ισορροπίας Nash, με βάση την αντίστροφη επαγωγή, είναι $ 2 σε αυτό το σενάριο. Αλλά όπως και στο παιχνίδι Centipede, τα εργαστηριακά πειράματα αποδεικνύουν σταθερά ότι οι περισσότεροι συμμετέχοντες - αφελώς ή αλλιώς - επιλέγουν έναν αριθμό πολύ υψηλότερο από τα $ 2.

Το δίλημμα του ταξιδιώτη μπορεί να εφαρμοστεί για να αναλύσει διάφορες πραγματικές καταστάσεις. Η διαδικασία της καθυστερημένης επαγωγής, για παράδειγμα, μπορεί να βοηθήσει να εξηγήσουμε πώς δύο εταιρείες που ασχολούνται με τον αγωνιστικό ανταγωνισμό μπορούν να μειώσουν σταθερά τις τιμές των προϊόντων με καστάνια σε μια προσπάθεια να αποκτήσουν μερίδιο αγοράς, γεγονός που μπορεί να οδηγήσει σε όλο και μεγαλύτερες απώλειες στη διαδικασία.

Στρατηγικές συμπληρωματικής θεωρίας παιχνιδιών

Μάχη των φύλων

: Αυτή είναι μια άλλη μορφή του παιχνιδιού συντονισμού που περιγράφηκε νωρίτερα αλλά με κάποιες ασυμμετρίες κέρδους. Περιλαμβάνει ουσιαστικά ένα ζευγάρι που προσπαθεί να συντονίσει τη βραδινή έξοδό τους. Ενώ συμφώνησαν να συναντηθούν είτε στο παιχνίδι της μπάλας (η προτίμηση του ανθρώπου) είτε σε ένα παιχνίδι (την προτίμηση της γυναίκας), έχουν ξεχάσει αυτό που αποφάσισαν και για να συνθέσουν το πρόβλημα, δεν μπορούν να επικοινωνούν μεταξύ τους. Πού πρέπει να πάνε; Ο πίνακας απολαβών είναι όπως φαίνεται - οι αριθμοί στα κελιά αντιπροσωπεύουν το σχετικό βαθμό απόλαυσης του γεγονότος για τη γυναίκα και τον άνθρωπο, αντίστοιχα. Για παράδειγμα, το στοιχείο (α) αντιπροσωπεύει την απολαβή (όσον αφορά τα επίπεδα απόλαυσης) για τη γυναίκα και τον άντρα, αντίστοιχα, στο παιχνίδι (απολαμβάνει πολύ περισσότερο από ό, τι κάνει). Η κυψέλη (d) είναι η πληρωμή εάν και οι δύο το κάνουν στο παιχνίδι με μπάλα (απολαμβάνει περισσότερο από ό, τι κάνει). Το κύτταρο (c) αντιπροσωπεύει τη δυσαρέσκεια αν και οι δύο πηγαίνουν όχι μόνο σε λάθος θέση, αλλά και στο γεγονός που απολαμβάνουν λιγότερο - η γυναίκα στο παιχνίδι με μπάλα και ο άνθρωπος στο παιχνίδι.

Παιχνίδι

Παιχνίδι

Παιχνίδι

Γυναίκα Παίξτε

(α) 6, 3

> Παιχνίδι με μπάλα

(c) 0, 0 (d) 3, 6

Παιχνίδι δικτάτορα

: Αυτό είναι ένα απλό παιχνίδι στο οποίο ο παίκτης Α πρέπει να αποφασίσει πώς να χωρίσει ένα χρηματικό έπαθλο με τον παίκτη Β , ο οποίος δεν έχει εισροή στην απόφαση του παίκτη Α. Ενώ αυτή δεν είναι στρατηγική θεωρίας παιχνιδιών

per se

, παρέχει κάποιες ενδιαφέρουσες γνώσεις σχετικά με τη συμπεριφορά των ανθρώπων. Τα πειράματα αποκαλύπτουν ότι περίπου το 50% κρατά όλα τα χρήματα στον εαυτό τους. Το 5% το χωρίζει εξίσου, και το υπόλοιπο 45% δίνουν στο άλλο συμμετέχοντα μικρότερο μερίδιο. Το παιχνίδι του δικτάτορα είναι στενά συνδεδεμένο με το παιχνίδι τελεσμάτων, στο οποίο ο Παίκτης Α λαμβάνει ένα συγκεκριμένο χρηματικό ποσό, μέρος του οποίου πρέπει να δοθεί στον Παίκτη Β, ο οποίος μπορεί να δεχτεί ή να απορρίψει το ποσό που του δόθηκε.Το αλίευμα είναι ότι αν ο δεύτερος παίκτης απορρίψει το ποσό που προσφέρεται, τόσο το Α όσο και το Β δεν παίρνουν τίποτα. Οι αγώνες του δικτάτορα και του τελετουργικού κατέχουν σημαντικά διδάγματα για θέματα όπως η φιλανθρωπική προσφορά και η φιλανθρωπία. Ειρηνικός Πόλεμος

: Μια παραλλαγή του δίλημμα του φυλακισμένου, στο οποίο οι αποφάσεις "Συνεργάζονται ή ελαττώνονται" αντικαθίστανται από "Ειρήνη ή Πόλεμος. "Μια αναλογία θα μπορούσε να είναι δύο εταιρείες που ασχολούνται με έναν πόλεμο τιμών. Εάν και οι δύο απέχουν από την κοπή των τιμών, απολαμβάνουν σχετική ευημερία (cell a), αλλά ο πόλεμος τιμών θα μειώσει δραματικά τις αποδόσεις (στοιχείο d). Ωστόσο, αν ο Α προχωρήσει σε μείωση των τιμών (πόλεμος), αλλά ο Β δεν το κάνει, ο Α θα έχει υψηλότερη απόδοση 4, δεδομένου ότι μπορεί να κατακτήσει σημαντικό μερίδιο αγοράς, και αυτός ο υψηλότερος όγκος θα αντισταθμίσει τις χαμηλότερες τιμές των προϊόντων.

Εταιρεία Α

Ειρήνη

(α) 3, 3

(β) 0, 4

> (c) 4, 0

(δ) 1, 1

Το δίλημμα του εθελοντή

: Στο δίλημμα ενός εθελοντή, κάποιος πρέπει να αναλάβει μια εργασία ή εργασία για το κοινό καλό. Το χειρότερο δυνατό αποτέλεσμα πραγματοποιείται εάν κανείς δεν εθελοντή. Για παράδειγμα, εξετάστε μια εταιρεία όπου η λογιστική απάτη είναι αχαλίνωτη, αλλά η ανώτατη διοίκηση δεν το γνωρίζει. Μερικοί κατώτεροι υπάλληλοι της λογιστικής υπηρεσίας γνωρίζουν την απάτη, αλλά διστάζουν να ενημερώσουν την ανώτατη διοίκηση, διότι θα οδηγούσαν σε εκτόπιση των υπαλλήλων που εμπλέκονται στην απάτη και, πιθανότατα, σε δίωξη. Η επισήμανση ως "πληροφοριοδότης" μπορεί επίσης να έχει κάποιες επιπτώσεις στη γραμμή. Αλλά αν κανείς δεν εθελοντής, η απάτη μεγάλης κλίμακας μπορεί να οδηγήσει στην ενδεχόμενη πτώχευση της εταιρείας και στην απώλεια θέσεων εργασίας όλων.

Η κατώτατη γραμμή

Η θεωρία των παιχνιδιών μπορεί να χρησιμοποιηθεί πολύ αποτελεσματικά ως εργαλείο λήψης αποφάσεων σε οικονομικό, επιχειρηματικό ή προσωπικό επίπεδο.