Una defensa restringida a la teoría de las preferencias reveladas

Felipe Núñez

Artículos

Recepción: 27 Diciembre 2022

Aprobación: 05 Mayo 2023

DOI: https://doi.org/10.4067/S0717-554X2023000200120

Resumen: Este artículo expone una defensa restringida de la teoría de las preferencias reveladas (TPR) considerando la argumentación crítica de Villacís (La preferencia revelada frente al enfoque utilitarista) en contra de esta. Se muestra que la TPR es un avance en términos metodológicos para la investigación económica y también un avance en tanto fundamentación formal microeconómica. En particular, mostraré que, en primer lugar, las críticas planteadas a la TPR pueden matizarse, en tanto 1. asumen que el objetivo de TPR es ofrecer una epistemología conductista y 2. asumen que sostener una visión conductista de las preferencias es sostener una visión conductista de la fundamentación microeconómica. En segundo lugar, mostraré que la crítica formal que plantea Villacís no es efectiva pues existe una ambigüedad respecto sobre qué recaen las preferencias de los jugadores en el contexto de juegos estratégicos.

Palabras clave: Filosofía de la economía, preferencias, preferencias reveladas, microeconomía, Paul Samuelson.

Abstract: This paper presents a restricted defence of the revealed preference theory (RPT) considering the critical argumentation of Villacís (Revealed preference versus the utilitarian approach) against it. It is shown that the RPT is an improvement in methodological terms for economic research and an improvement as a formal microeconomic foundation. I will show that, first, the criticisms raised against RPT are misguided insofar as 1. they assume that the aim of RPT is to offer a behaviourist epistemology and 2. they assume that to hold a behaviourist view of preferences is to hold a behaviourist view of microeconomic foundations. Second, I will show that the formal critique raised by Villacís is ineffective because there is an ambiguity as to what players' preferences depend on in the context of strategic games.

Key words: Philosophy of economics, preferences, revealed preferences, microeconomics, Paul Samuelson.

I. Introducción

En Villacís (La preferencia revelada frente al enfoque utilitarista: Discusión sobre los fundamentos de la teoría del consumidor) se comparan dos enfoques sobre los fundamentos de la teoría microeconómica en torno a la noción de preferencia. Se compara, por una parte, la teoría de preferencias reveladas (TPR) como mecanismo para inferir el orden de preferencias desde las elecciones; y, por otra, la noción de preferencia proveniente de la teoría subjetiva del valor, ligada estrechamente al desarrollo del pensamiento utilitarista inglés e ineludiblemente asociada a conceptos de carácter mental como la “utilidad”.

A través de esta comparación, el autor muestra que la capacidad explicativa de la TPR, respecto de los fundamentos de la teoría microeconómica, no es mayor que la teoría de la utilidad clásica dependiente de contenidos mentales, en particular, del concepto de utilidad. Pero por sobre todo, muestra que, sumadas a las críticas clásicas de esta metodología, existen problemas formales si se considera el contexto de la teoría de juegos.

En este breve artículo pretendo mostrar en primer lugar que, por el contrario, la TPR es un avance en términos metodológicos para la investigación económica y también un avance en tanto fundamentación microeconómica. En segundo lugar, mostraré que la crítica formal de Villacís puede matizarse, ya que existe una ambigüedad respecto sobre qué recaen las preferencias de los jugadores en el contexto de juegos estratégicos.

Pese al contexto de creación de la TPR, el aspecto metodológico me parece más importante que el aspecto fundacional, considerando que, para su principal creador, Paul Samuelson, la teoría de las preferencias reveladas es un ejercicio de definición que no tiene aplicación empírica directa, como veremos más adelante. En este sentido, mostraré, en particular, que las críticas metodológicas planteadas a la TPR no se siguen, en tanto (1) asumen que el objetivo de TPR es ofrecer una epistemología conductista y (2) asumen que sostener una visión conductista de las preferencias es sostener una visión conductista de la fundamentación microeconómica.

En lo que sigue supondré que el lector o ha leído el artículo de Villacís antes referido, o está familiarizado con los aspectos fundamentales de la teoría de la decisión y la teoría de juegos, por lo que no explicaré en detalle las características fundamentales de la TPR ni los aspectos generales de la teoría de juegos a no ser que sea necesario plantear una discrepancia interpretativa.

El artículo se estructura de la siguiente manera: en la segunda sección “TPR: una defensa”, retomaré algunas de las críticas que se han planteado a la TPR para luego mostrar las razones para seguir considerándola como un avance importante. Por último, en la tercera sección, “acciones, estrategias y equilibrio”, mostraré por qué la crítica formal a la TPR no es efectiva.

II. TPR: una defensa

El concepto de preferencias en economía tiene una definición clara, es un tipo de relación. En particular, una relación de preferencia sobre el conjunto X es una relación binaria completa y transitiva sobre X. La noción de preferencias podría definirse también en términos funcionales, ambas descripciones son equivalentes. Aquí utilizaremos la definición a través de una relación binaria.

Una relación binaria en un conjunto X específica para cada par ordenado (x, y), miembros de X, si x se relaciona con y de cierta manera. Consideremos ahora la relación binaria “... es al menos tan deseable como …”. A partir de ella pueden deducirse las relaciones de indiferencia y la relación de preferencia estricta.

Con esto podemos decir que el concepto de preferencia expresa una relación que, a su vez, determina un ordenamiento entre todos los elementos del conjunto X.

Puede criticarse la exigencia de completitud y la exigencia de transitividad, sin embargo, esas críticas en tanto afectan globalmente a toda la teoría de la decisión, no son pertinentes en esta discusión más restringida respecto a las preferencias reveladas.

La definición de preferencias recién descrita expresa las condiciones de posibilidad de la formación de las preferencias en tanto orden y expresa el significado de las preferencias independientemente de si esta formación se describe en términos conductistas o si se hace en términos más bien mentales.

Ahora bien, ¿es posible pensar en preferencias evadiendo todo aspecto mental? En principio, no. Creencias y deseos son razones para actuar. Los modelos de racionalidad esencialmente restringen los deseos y creencias, de manera que las acciones puedan ser explicadas. La manera típica es pensar en términos de preferencias, ya que, a diferencia de los deseos son comparativas. Pero tanto las preferencias como las acciones deben ser explicadas. ¿O acaso es posible explicar una preferencia mediante la acción? Esta es justamente la idea metodológica de la TPR. La TPR no es una teoría sobre qué son las preferencias, tampoco es una definición de las preferencias: es una forma de mostrar que la idea de función de utilidad, que depende de la noción de preferencia, no es más que la formación de un orden dadas las elecciones fácticas o hipotéticas. En el fondo, un intento por evitar el lenguaje mentalista en la fundamentación microeconómica.

La idea de las preferencias reveladas surge, en cierto sentido, porque los economistas se sienten incómodos hablando de deseos y creencias, incluso hablando de placer; les recuerda una época en la que la economía se ligaba directamente con el utilitarismo inglés y con la folk psychology. Esto es claro en el artículo fundacional de Samuelson al respecto (A note on the pure theory of consumer’s behaviour), que seguía la línea del proyecto de Hicks y Allen (A reconsideration of the theory of value). Por lo mismo, una manera de distinguir la economía de la psicología es pensar en la relación de preferencias desde el concepto de elección, en particular, a través de la idea de función elección racionalizable.

Para lograr inferir un orden de preferencias desde las elecciones la TPR se vale de los siguientes razonamientos: si vemos que i escoge a en el par {a, b} decimos que a se revela directamente preferido a b. Si vemos que además para i se revela directamente preferido b en par {b, c}, decimos que se revela indirectamente preferido a en {a, c}. Sólo necesitamos elecciones y los axiomas de racionalidad. Hay dos niveles de inferencia con preferencias reveladas: en primer lugar, el axioma débil de preferencias reveladas, que nos dice que, si a es directamente preferido a b, entonces no ocurre que b es directamente preferido a a; y el axioma fuerte de preferencias reveladas, que nos dice que si a es directa o indirectamente preferido a b, entonces no ocurre que b es directa o indirectamente preferido a a. La importancia de estos niveles, y de su generalización en el axioma generalizado de preferencias reveladas, está en su aplicación a la construcción del equilibrio.

¿Para qué utilizar la TPR? Como medio de fundamentación de la teoría microeconómica para eliminar todo mentalismo la TPR es insuficiente y también es insuficiente en términos predictivos. Si este era el objetivo de Samuelson, entonces su proyecto no logró su fin, esto ha sido mostrado clara y detalladamente por Wong (Foundations of Paul Samuelson's revealed preference theory). Sin embargo, ninguno de esos aspectos son los objetivos necesarios de la TPR. Al menos es defendible un uso metodológico menos radical pero que mantiene el espíritu de minimizar los aspectos mentales. En este caso restringido, el objetivo de la TPR es más bien permitir inferir razonablemente un ordenamiento de preferencias a través de las acciones.

No hay que minimizar las fortalezas de la teoría considerando estos objetivos restringidos. Con ella, el sentido de las palabras “maximización de la utilidad” se vuelve claro si consideramos que refiere simplemente a la elección de lo preferido considerando las restricciones; y que, a su vez, las elecciones develan un ordenamiento llamado orden de preferencias que puede ser representado mediante funciones de utilidad continuas que permiten transformar el problema de decisión del agente racional en un problema de optimización con restricciones. Todo contenido mental ha sido minimizado. Esto es una manera de enfrentar lo que se ha llamado “el problema de la utilidad”.

Sin embargo, como se ha visto, no es tan claro si realmente la TPR logra evitar el mentalismo. Después de todo, como se ha dicho reiterativamente desde Hausman (Revealed preference, belief, and game theory), expectativas y creencias son razones para la acción: la acción debe ser explicada y la preferencia debe explicar la acción y no al revés. Tampoco es claro que este ejercicio de definición tenga una utilidad en la investigación empírica, ¿Acaso el objetivo de Samuelson era utilizar esta metodología para inferir información útil para la modelación desde los datos? Si este es el caso, tampoco la TPR no ha logrado su objetivo.

Entonces, ¿por qué seguir utilizando la TPR? Villacís reseña claramente algunas de las críticas clásicas. Me parece, sin embargo, que ninguna de estas críticas, que comentaré en mi argumentación, son suficientes para abandonar TPR por dos razones. (1) TPR es útil en la economía aplicada y (2) TPR cumple un papel importante en la construcción formal de la teoría microeconómica. Lo anterior no quiere decir, en ningún caso, que la práctica económica esté ligada necesariamente a una epistemología conductista ni que la construcción de la teoría microeconómica esté condicionada necesariamente a una epistemología conductista: es posible una interpretación conductista de las preferencias con un mentalismo mínimo ligado a las opciones presentes en las elecciones de los agentes, en particular a la idea de la congruencia conceptual de las opciones, sin comprometer contenido mental sobre las preferencias.

Antes de continuar, es importante mencionar el contexto en el que se desarrolla la TPR. Samuelson tenía dos importantes antecedentes que tomar en cuenta para lograr una síntesis formal de la disciplina económica. En primer lugar, la fuerte influencia de la tradición ordinalista que buscó demarcar la economía de la psicología; y, en segundo lugar, la formulación típica del trabajo de Keynes a través del modelo IS/LM de Hicks. Lo que buscaba Samuelson era, en palabras de Ross, “construir un marco empíricamente testeable para modelar la economía como una máquina determinista” (Ross 2014:59). Para esto era necesario obtener ciertas propiedades de las funciones de demanda individuales de los modelos típicos, como la teoría del comportamiento del consumidor. En tanto el objetivo de Samuelson era efectivamente eliminar los vestigios de la teoría de la utilidad entendida en términos mentales para sentar las bases de una teoría formalizada y empíricamente testeable, se plantea la TPR como un recurso básico. Sin embargo, el proyecto de Samuelson no es conductista en un sentido riguroso (Ross Philosophy of economics, p. 62). El economista no intenta ofrecer un método para generar modelos empíricamente testeables, lo de Samuelson es un ejercicio de definición, un ejercicio formal. El trabajo del economista y la teoría económica, se pregunta Samuelson, no se ve afectado, incluso si las condiciones sobre las que se describe la teoría fueran empíricamente falsas (Samuelson Foundations of economic analysis, p. 117). Es cierto, en cualquier caso, que el proyecto de Samuelson va cambiando con el tiempo, debilitándose en cierto sentido. Como muestra Wong (Foundations of Paul Samuelson's revealed preference theory), el intento de Samuelson pasa de intento por eliminar los vestigios mentales de la teoría de la utilidad (A note on the pure theory of consumer’s behaviour), a un intento por construir las curvas de indiferencia desde las observaciones del mercado (Consumption theory in terms of revealed preference), hasta una manera de extraer todas las consecuencias empíricas de la teoría de la utilidad (The problem of integrability in utility theory).

Pero incluso en la versión más radical del proyecto de Samuelson, que se encuentra en A note on the pure theory of consumer’s behaviour, no se suponía que la TPR fuese útil para el trabajo empírico. Después de todo, asumió funciones de demanda con datos infinitos, lo que es razón suficiente para mostrar que no estaba ofreciendo una teoría con compromiso epistemológico conductista. Ahora bien, Afriat (The construction of utility functions from expenditure data) logró mostrar un uso no meramente formal de la TPR a través del axioma generalizado de preferencias reveladas. Afrait mostró que mediante ese axioma es posible construir una función de utilidad desde datos finitos que fuese consistente con el axioma fuerte de preferencias reveladas. Esto implicaba la posibilidad de la construcción de modelos a partir de datos (y de los axiomas de racionalidad).

Si bien es cierto que con el axioma generalizado de preferencias reveladas se permite hacer un uso genuinamente conductista de TPR (aunque no es necesario que así sea, pues TPR puede tener otras motivaciones, como las que defiendo aquí), no es el programa de Samuelson. Lo de Samuelson se enmarca en el terreno definicional, no en la generación de modelos desde los datos: después de todo, el conjunto de canastas a todo nivel de precios es infinito. Y si bien se eliminan las preferencias como estados mentales en tanto estos se definen por el comportamiento, como dice él mismo (Foundations of economic analysis, p. 90), no se eliminan los estados mentales, pues el comportamiento requiere de estados mentales, al menos para el analista en el trabajo empírico.

En cualquier caso, desde Hausman (Revealed preference, belief, and game theory) se ha planteado una crítica importante a la TPR, crítica que Villacís recoge. Según Hausman la TPR es incoherente o al menos carece de motivos para ser utilizada, pues como las acciones deben ser explicadas, debemos aceptar estados mentales: creencias y expectativas. Pero, para un economista empírico, que no cree en una epistemología conductista y que solo puede acceder a las elecciones, ¿qué tipo de información de estados mentales es necesaria considerando que la TPR es falible? Es perfectamente posible pensar que no es necesario ningún tipo de información mental sobre las preferencias, pues las preferencias se relevan en las acciones si es que, como analistas, tenemos una descripción consistente con las creencias de los agentes sobre las opciones que se le presentan. En lo que sigue, mostraré parte del argumento de Thoma (In defence of revealed preference theory) en defensa de la TPR, una defensa de la interpretación conductista de las preferencias, no de la teoría económica.

Imaginemos que un economista y un amigo están comiendo papas fritas y hay algunas salsas disponibles, en particular una salsa de color amarillo y una salsa de color rojo. El economista tiene la impresión de que la salsa amarilla es mostaza y la roja es ají, en cambio, su amigo tiene la impresión de que la salsa amarilla es mostaza y la roja es ketchup.

Imaginemos que el amigo toma la salsa roja y les echa a sus papas fritas. Si no intercambian sus creencias ni sus apreciaciones, el economista creerá, utilizando TPR, que el amigo prefiere las papas fritas con ají a las papas fritas con mostaza. El economista ahora tiene razones para pensar que la próxima vez su amigo actuará de la misma forma. Luego de un tiempo el economista y su amigo vuelven a comer papas fritas, sin embargo, esta vez el amigo elige la mostaza. ¿Qué es lo que falló aquí en la teoría del economista? ¿La acción no reveló preferencia?

Se puede creer que falló porque las preferencias del amigo cambian en el tiempo, lo que dificulta toda la teoría de las preferencias en términos de los modelos; o que en realidad las acciones no nos dicen nada: se necesitan contenidos mentales que expresen razones y el contexto de la elección.

Sin embargo, el problema aquí no está en ninguno de esos aspectos, el problema es que el economista no tiene una descripción correcta de las opciones a las que se enfrenta su amigo. En este problema no se necesita tener información mental sobre las preferencias del amigo, solo información mental sobre las opciones a las que se enfrenta: se necesita congruencia conceptual de las opciones entre el economista y el amigo. En este sentido, la TPR puede ser empíricamente útil sin considerar una epistemología conductista, porque requiere solo contenidos mentales sobre las opciones. Es posible, por lo tanto, mantener una visión conductista de las preferencias. Lo anterior no quiere decir, en cualquier caso, que las preferencias no tengan dependencia mental en términos conceptuales. Evidentemente las preferencias pueden cambiar en el tiempo, evidentemente el contexto puede generar cambios. Sin embargo, una buena descripción de las opciones minimiza esas amenazas que, en cualquier caso, lo único que nos dicen es que la TPR es una metodología falible.

Dejando este problema de lado, y aceptando el hecho de que existen aspectos no empíricamente testeables en la TPR en tanto asumen los axiomas de la teoría de la decisión, se pueden plantear críticas más generales a la teoría de las preferencias. La crítica de Sen en Rational fools, por ejemplo, es un ataque global dirigido tanto a los axiomas de la racionalidad en tanto hay críticas a la transitividad, pero también una crítica a la forma particular de las funciones de utilidad utilizadas en los modelos clásicos como el modelo del consumidor. En este modelo en particular se asume la independencia de las funciones de utilidad, lo que es crucial para montar la teoría del equilibrio pero que es evidentemente poco realista. Sin embargo, es perfectamente posible plantear otras funciones de utilidad sin egoísmo, como ha mostrado, por ejemplo, Bicchieri (The grammar of society). En cualquier caso, estas críticas particulares sobrepasan la particularidad de la TPR: las críticas a los axiomas de la teoría de la decisión como transitividad y completitud son demasiado generales y las críticas a la forma de las funciones de utilidad son demasiado específicas en tanto afectan a modelos particulares, por más que esos modelos tengan una influencia importante en el pensamiento económico. Sin embargo, es importante no confundir la importancia de los modelos, e incluso la centralidad del equilibrio general, con lo que está a la base de la fundamentación microeconómica, que hoy en día apunta a la teoría de la decisión y a la teoría de juegos (General equilibrium vs. general Nash equilibrium).

¿Hasta qué punto, entonces, las críticas de Sen o las críticas de Kahneman y Tversky (Prospect theory) en el contexto de la teoría de la utilidad esperada son válidas fuera del contexto de los modelos que requieren supuestos poco razonables por razones que van más allá del modelo en sí mismo? Por ejemplo, la teoría del consumidor es una piedra fundamental para la teoría del equilibrio general que termina en la demostración de existencia del equilibrio por Arrow-Debreu. Sin embargo, esta prueba es una explicación de la posibilidad del equilibrio, no es un resultado descriptivo ni predictivo de la economía en ninguna situación real. Fuera de las exigencias del equilibrio general y del problema de la agregación es posible pensar en otros problemas locales y parciales sin los supuestos de egoísmo (es decir, que las funciones de utilidad de los agentes no estén interrelacionadas).

Se han visto, hasta el momento, algunas de las críticas planteadas a la TPR y algunos aspectos importantes para tener en cuenta al momento de evaluar el papel que cumple en el trabajo económico. Respecto a esto es útil considerar lo que sigue. Villacís resume las conclusiones de Sen respecto de TPR en Behaviour and the concept of preference del siguiente modo: “(i) el uso de que el comportamiento de la elección revele la preferencia no quiere decir que el comportamiento se pueda explicar haciendo referencia exclusivamente al propio comportamiento; (ii) si este es el propósito, entonces no se necesitarían propiedades de racionalidad añadidas, pues serían redundantes; (iii) es posible que una ‘comparación sistemática de alternativas’ no caracterice el comportamiento de los consumidores y la falta de un patrón de preferencia puede confundirse con la indiferencia; y (iv) los cálculos racionales individuales pueden no funcionar en entornos estratégicos de decisiones interdependientes entre varios agentes, dado que no considera los compromisos sociales propios de la acción humana real.” (Villacís 2021:177).

Me parece que las conclusiones de Sen resumen de manera clara el carácter de las críticas que posteriormente se desarrollaron en Hausman (Revealed preference, belief, and game theory), y, en general, a las críticas del uso empírico de la TPR. Sin embargo, he mostrado que es posible defender que el uso de la TPR puede perfectamente no estar ligada a una epistemología conductista y que es posible darles cabida a los contenidos mentales en la teoría económica sin abandonar una visión conductista de las preferencias. Al mismo tiempo, puede considerarse que el proyecto de Samuelson, en particular, no está ligado necesariamente a una epistemología conductista.

Hay una crítica de Sen que no hemos considerado: los problemas de la TPR en los contextos de interacción estratégica. A eso dedicaremos la siguiente sección.

III. Acciones, estrategias y equilibrio

Villacís reconoce que las críticas clásicas que se plantean a la TPR pretenden justamente invalidarla desde la pretensión metodológica que las preferencias reveladas intentan desarrollar. Se ha visto que en términos de la fundamentación de la TPR es perfectamente posible defenderla sin considerar una epistemología conductista, manteniendo su relevancia en términos del trabajo empírico en economía y en términos de la fundamentación de la teoría microeconómica.

Sin embargo, hay un contexto en el que la TPR ha sido particularmente problemática: la teoría de juegos. En esta sección consideraré las críticas a la TPR en el contexto de la interacción estratégica, es decir, en contextos donde las decisiones optimizadoras de los agentes dependen de las decisiones optimizadoras de otros agentes.

Un juego estratégico está definido por los jugadores, las acciones para cada jugador y una función de pago que mapea desde el perfil de acciones o estrategias (es decir, la intersección de acciones de cada jugador) a R. Este tipo de especificación es especialmente útil para juegos simultáneos; para juegos que se desarrollan en el tiempo, con turnos, es necesaria una definición un poco más compleja, sin embargo, para nuestros objetivos es suficiente mantenernos en la especificación estratégica o normal.

En teoría de juegos el concepto central es el equilibrio de Nash (EN). Este concepto, a diferencia del concepto de equilibrio de las intuiciones desarrolladas a partir de Edgeworth o Walras no es un concepto que representa la idea de competencia perfecta ni la idea de la determinación de precios; es un concepto sobre la racionalidad en contextos de interacción estratégica, es decir, es un concepto normativo. Un EN es un perfil de acciones o estrategias con la propiedad de que ningún jugador debe tener una acción disponible que le entregue un pago mayor al que recibe cuando juega la acción de tal perfil, dado que todos los demás ocupan su acción de equilibrio. Dicho en términos simples, en un EN ningún jugador está arrepentido de la acción que tomó. En un juego puede existir más de un EN e incluso puede no existir un EN (al menos no uno puro).

Otro concepto importante, tanto en teoría de juegos como en las representaciones de la competencia perfecta, es el concepto de optimalidad de Pareto (OP), concepto especialmente importante para las implicancias sobre la idea de bienestar en economía. Este concepto nos dice que si X es un conjunto de estados sociales factibles (de perfiles de acciones), entonces el estado social factible x (el perfil de acciones) es óptimo en el sentido de Pareto si no admite mejoras paretianas. Es decir, si no existe otro estado social factible (otro perfil de acciones) que le dé un nivel de bienestar mayor o igual a cada uno de los individuos, y estrictamente mayor para al menos uno. Esto es lo mismo que decir que un estado social factible (un perfil de acciones) es óptimo si es que nadie puede estar mejor sin dejar en peor situación a otro.

Evidentemente, no todo EN es un OP ni todo OP es un EN. Un ejemplo del primer caso es el juego de la caza del ciervo (fig. 1.), ya que en este juego con dos EN uno de ellos no es OP. Un ejemplo del segundo caso es el dilema del prisionero (fig. 2), ya que este juego los OP no son EN.

Figura 1

Figura 1. Caza del ciervo. En este juego de dos jugadores cada jugador se enfrenta a dos acciones: ciervo, liebre (C, L). El jugador 1 elige columna y el jugador 2 elige fila, los pagos del jugador 1 representan los primeros términos de los vectores de pagos; los pagos del jugador 2, los segundos. Los perfiles de acciones son (C, C), (C, L), (L, C), (L, L). La lógica del juego puede describirse del siguiente modo: cada jugador puede elegir entre cazar un ciervo o una liebre. Cada jugador puede cazar por sí mismo una liebre, sin embargo, para cazar un ciervo es necesario cooperar. Si es que ambos eligen cazar el ciervo cada uno recibe un pago de 2, si es que uno elige liebre y el otro ciervo, el primero recibe 1 y el segundo 0. Si ambos escogen liebre, ambos obtienen pago 1.

Los EN en este juego son (C, C) y (L, L), ya que en ambos casos ningún jugador puede arrepentirse de la acción que tomó dada la elección del otro jugador. El OP de este juego es (C, C) ya que todos los otros perfiles admiten mejoras paretianas.

Figura 2

Figura 2. Dilema del prisionero. En este juego las acciones son cooperar o defraudar, (C, D). Este juego puede describirse del siguiente modo, dos ladrones han robado un banco y han sido capturados, cada uno ha sido interrogado en piezas diferentes. Los ladrones saben que, si cooperan entre ellos, es decir, si se callan, cada uno obtendrá un año tras las rejas (-1); sin embargo, si deciden defraudar a su compañero, recibirán, en el mejor de los casos, la libertad (0), y el peor de los casos, tres años tras las rejas (-3). Si por otro lado deciden cooperar, existe la posibilidad de que el otro defraude, pasando cinco años tras las rejas (-5). En este juego el EN es (D, D), por otro lado, son OP los tres otros perfiles: (C, C), (C, D), (D, C).

El caso del dilema del prisionero ha sido especialmente discutido ya que, al parecer, plantea una situación contraintuitiva, una situación en la que la racionalidad no coincide con la optimalidad.

Sin embargo, es fácil comprender que no hay ninguna razón para que sea racional para cada jugador optar por un perfil que es OP, ya que los jugadores no tienen ninguna razón para creer que el otro jugador jugará otra estrategia. Después de todo, las acciones óptimas están determinadas por los pagos en cada perfil de acciones independiente de lo que signifiquen esos números. La función de pago que mapea desde el perfil de acciones o estrategias (es decir, la intersección de unas acciones de cada jugador) a R no nos dice nada sobre las motivaciones de los agentes ni sobre las razones de sus preferencias en cada situación, solo nos dice que los agentes escogen tales acciones. Si los pagos fuesen otros simplemente sería otro juego y si los jugadores tuviesen razones para confiar en que los otros jugadores actuarán de otra manera, entonces ya no sería la estructura del dilema del prisionero. Este sería el caso del dilema del prisionero como juego repetido infinitamente, que es, efectivamente, otro juego. En esa situación es EN jugar (C, C), ya que cualquier desvío de ese perfil implica jugar (D, D) en el futuro, lo que tiene consecuencias en el pago futuro. Considerando que el juego se repite infinitamente hay razones para creer que el otro jugador usará la estrategia C repetidamente. Nótese que en cualquier escenario finito este razonamiento no es válido. Nótese además que la teoría de juegos efectivamente implica razonamientos que implican creencias, pero no creencias sobre deseos o sobre creencias más allá de la racionalidad basada en el orden que dan las funciones de pago.

Según Villacís, la TPR falla en contextos de interacción estratégica porque el método no da cuenta del orden de preferencias establecido por el propio juego a partir de las estrategias óptimas. Pero esto es lo que efectivamente ocurre: en un juego con interacción estratégica las acciones dependen de las acciones de los otros jugadores por lo que esto debe ser tomado en cuenta al momento de decidir las preferencias sobre las acciones. En el caso del dilema del prisionero, el jugador A debe escoger entre el conjunto de acciones (C, D) dado que el jugador B escoge C, y luego el mismo ejercicio condicionado a que el jugador B escoge D.

Dado que en ambos casos es preferible D, la acción preferida por A es D. D es una estrategia estrictamente dominante.

Los jugadores, por lo tanto, tienen preferencias sobre acciones que dependen de perfiles de acción (que determinan los pagos), no sobre pagos particulares ni sobre equilibrios ni sobre óptimos. Si los jugadores eligiesen perfiles de acuerdo con los pagos particulares, entonces sería posible decir algo como lo siguiente: “para el agente A su orden de preferencias es (D, C) > (C, C) > (D, D) > (C, D)". Sin embargo, este tipo de razonamiento considera que el problema del dilema del prisionero se da en un entorno paramétrico, que es justamente lo que debemos evitar. Las preferencias de cada agente son sobre las acciones propias y las acciones dependen los perfiles de acciones. Si se recuerda esto, la elección sí permite inferir preferencia y no hay problemas especiales con la TPR en contextos de interacción estratégica.

Se podría criticar el hecho de que los jugadores tengan preferencias sobre acciones. Después de todo, como hemos dicho en la segunda sección, la lógica es más bien que las preferencias explican las acciones. Este es un punto crucial de la crítica de Hausman: ya que las estrategias dependen tanto de los pagos como de las creencias, los pagos deben representar preferencia en vez de preferencia* (Revealed preference, belief, and game theory, p. 111). Entendiendo por preferencia* la idea técnica de las preferencias, definida en la sección II. Sin embargo, justamente una de las fortalezas de la teoría de juegos es que no hay ninguna necesidad de apelar a razones o creencias más allá de la consistencia interna. Los juegos estratégicos están definidos por los jugadores, las acciones y la función de pago. La función de pago expresa el pago que cada perfil de acciones otorga. Es posible modificar los números de las matrices y analizar cómo se comporta el juego porque conocemos lo que los jugadores prefieren justamente por los pagos y dado el comportamiento de los otros jugadores.

Ese comportamiento de juego puede explicar distintos fenómenos y en el entendimiento de estos fenómenos es posible modelar funciones de utilidad consistentes con la estructura del juego. Por ejemplo, en el caso del dilema del prisionero, es posible utilizar su estructura para comprender el problema al que se encuentran las firmas en una guerra de precios o comprender la lógica detrás del contractualismo de Hobbes o la lógica de la tragedia de los comunes.

Si se considera que la estructura del juego es lo fundamental, es posible comprender que en la teoría de juego la función de pago de los jugadores se maximiza buscando la mejor acción dada las mejores acciones de los demás jugadores (esto es básicamente lo que se llama aplicación de mejor respuesta). La pregunta por el porqué de tales acciones más allá de la estructura del juego es una cuestión posterior, una pregunta por la congruencia de la estructura del juego con otros fenómenos, como los expuestos en el párrafo anterior.

Conclusiones

En este artículo he mostrado por qué es posible defender la TPR de algunas críticas clásicas y también de la crítica formal planteada por Villacís (La preferencia revelada frente al enfoque utilitarista). He mostrado que, en primer lugar, la TPR no está necesariamente ligada a una epistemología conductista pese a sostener una visión conductista de las preferencias; en segundo lugar, que siguiendo a Thoma (In defence of revealed preference theory), es posible sostener TPR con mentalismo mínimo centrado en una teoría de las opciones. Como corolario de lo anterior, es posible defender que la TPR es útil para el trabajo empírico si se asegura una congruencia conceptual de las opciones y también como parte de la fundamentación de la teoría microeconómica en tanto las críticas que se han planteado no son eficaces y, a lo más, muestran que la TPR es una metodología falible.

Por último, he mostrado que la TPR no tiene dificultades especiales con los contextos de interacción estratégica dado que las preferencias se definen sobre los perfiles de acciones. En tanto la relación de preferencias se construye sobre el perfil de acciones y la función de pagos que va del perfil de acciones a R, las preferencias están determinadas por la función de pago dadas las elecciones de los demás jugadores. Es posible, en este sentido, utilizar la teoría de juegos sin considerar deseos y creencias fuera de las creencias sobre la racionalidad de los demás jugadores.

Bibliografía

Ross, D. (2014). Philosophy of economics. Palgrave Macmillan. https://doi.org/10.1057/9781137318756

Villacís, C. (2021). La preferencia revelada frente al enfoque utilitarista: discusión sobre los fundamentos de la teoría del consumidor. Cinta de Moebio, (72), 164-182. https://doi.org/10.4067/s0717-554x2021000300164

	C	L
C	(2,2)	(0,1)
L	(1,0)	(1,1)

	C	D
C	(-1,-1)	(-5,0)
D	(0,-5)	(-3,-3)