d'Economía.net

ECONOMÍA

Hay amplitudes de probabilidad de raíz cuadrada de norma compleja de número uno de 0,006 en las que Sam Bankman-Fried es feliz


Matt Levine piensa en Sam Bankman-Fried, la asunción de riesgos y el criterio de Kelly: la regla de que la fracción F de su riqueza usted debe apostar en una apuesta de doble o nada es f = p – (1-p)/bdónde pag es la posibilidad de ganar y b es la relación de probabilidades de ganar-perder. (Para más información sobre eso, recomiendo William Poundstone: La fórmula de la fortuna.) Matt lo entiende en su mayor parte, pero creo que no del todo bien:

Matt Levin: SBF fue imprudente desde el principio:¡La gente ha pensado en esta pregunta! Esto es en gran medida un tema central que preocupa a los comerciantes y las empresas comerciales. El punto de partida estándar es el criterio de kelly, que calcula el tamaño máximo de la apuesta en función de su ventaja y el tamaño de sus fondos. Dado el presupuesto del pasante de $100, creo que Kelly le diría que ponga como máximo $10 en esta apuesta…. Estoy siendo impreciso y, por varias razones, es posible que no espere que los pasantes sigan a Kelly en esta situación. Pero cuando leo sobre pasantes que hacen fila para perder todo su dinero en apuestas con una ventaja del 1%, pienso, «eh, eso es agresivo, ¿qué les están enseñando a esos pasantes?»…

Pero también pienso en un Argumento de Twitter que Bankman-Fried tuvo con Matt Hollerbach en 2020, en el que Bankman-Fried se burló del criterio de Kelly y dijo que “yo, personalmente, haría más” que la cantidad de Kelly. «¿Por qué? Porque, en última instancia, mi función de utilidad no es realmente logarítmica. Es más cercano a lo lineal”. Como le dice a Lewis, “tenía utilidad para los ‘dólares infinitos’” (iba a convertirse en billonario y usar el dinero para curar enfermedades y alinear la IA y derrotar a Trump, claro), por lo que siempre quiso maximizar los retornos.

Pero… esto no entiende por qué las empresas comerciales utilizan el criterio de Kelly…. El punto de Kelly no se refiere a las curvas de utilidad; no se trata de “tener 200 dólares es menos del doble de placentero que tener 100 dólares, por lo que deberías estar menos dispuesto a correr grandes riesgos para obtener grandes recompensas”. El objetivo de Kelly es maximizar sus posibilidades de sobrevivir y obtener rendimientos a largo plazo…. Kelly se trata de dimensionar tus apuestas para que puedas seguir jugando y ganar la mayor cantidad de dinero posible a largo plazo. Apostar más puede hacerte ganar más dinero a corto plazo, pero si sigues haciéndolo terminarás en la ruina…

Creo que la distinción que Matt hace aquí no es del todo correcta. Se trata de permanecer en el juego para realizar apuestas de valor positivo en el futuro. Pero también se trata del valor de su utilidad de $200 en relación con $100.

Supongamos que comienza con $1000 y tiene una secuencia de apuestas de doble o nada, con las probabilidades a su favor: un 60% de posibilidades de ganar y un 40% de posibilidades de perder:

Después de 20 apuestas, Sam Bankman-Fried está en quiebra el 99,9963% de las veces. Pero el 0,0037% de las veces tiene 1.048.576.000 dólares. Pero su valor esperado es de 38.340 dólares: 19 millones de mosquiteros. El 99,9963% de las veces Sam Bankman-Fried perdió su dólar y no compró ninguno de los mosquiteros que quería comprar y distribuir. Pero ese 99,9963% de las veces Sam Bankman-Fried se consuela pensando que en algún lugar de la superposición cuántica que es el multiverso está la versión suya que tuvo suerte y logró comprar y distribuir 524.288.000 mosquiteros. Y, si es un buen seguidor de la interpretación de Everett de la mecánica cuántica, eso hace feliz a Sam Bankman-Fried. ex post. Y está el 0,0037% de las veces que Sam Bankman Fried sí consigue comprar y distribuir 524.288.000 mosquiteros,

Después de 20 apuestas, lo más probable es que John Kelly haya obtenido cara doce veces y haya convertido sus $1000 iniciales en $1500, con los que puede comprar 750 mosquiteros. El 80% de las veces su riqueza final se sitúa entre 440 y 5.050 dólares, comprando entre 220 y 2.525 mosquiteros. el 10% de las veces su riqueza es menor; El 10% de las veces su riqueza es mayor. Su riqueza esperada es de 2.190 dólares, un poco más del doble de su dinero y suficiente para comprar 1.095 mosquiteros. John Kelly está obteniendo una ganancia esperada de sólo $1,190 porque, en cada etapa, está dejando pasar el 80% de su oportunidad de hacer una apuesta de valor esperado positivo.

Compartir

Supongamos que fuera más agresivo que John Kelly, el doble de agresivo, y apostara el 40% de sus fondos en cada ronda. Luego, con las 12 caras esperadas, terminas con $950 y pierdes $50. ¿Por qué? Porque cada pérdida reduce tus fondos a sólo 3/5 de lo que eran, mientras que cada ganancia aumenta a sólo 7/5, por lo que cada ida y vuelta de cruz y cara te deja con sólo 21/25 de lo que tenías y, por lo tanto, te cuesta. 16% de tu bankroll. Este efecto de ida y vuelta te duele aumenta rápidamente con el tamaño relativo de tu apuesta: cada viaje de ida y vuelta borra a Sam Bankman-Fried, pero un viaje de ida y vuelta le da al John Kelly original 24/25 de su apuesta inicial.

Pero el mejor dos veces más agresivo que John Kelly obtiene una riqueza final esperada de 4.660 dólares, obtiene una ganancia de 3.660 dólares y, por lo tanto, puede permitirse comprar 2.330 mosquiteros. Sólo que el 60% de las veces los enfermos de malaria habrían estado mejor si hubiera comprado 500 mosquiteros.

A estas alturas hemos pasado por alto todas las cuestiones filosóficas y psicológicas profundas en el estudio de la probabilidad, con la excepción de dos, dos que son las más importantes de todas:

  1. ¿Qué hacemos con el hecho de que somos malos a la hora de estimar probabilidades y peores a la hora de actuar de acuerdo con su lógica, incluso cuando intentamos limitarnos con procedimientos y sistemas?

  2. ¿Qué hace Sam Bankman-Fried cuando por primera vez sale cruz y se arruina? ¿Dice “bueno, fue un buen intento” y se va a hacer otra cosa? ¿O abre la caja fuerte, toma el dinero de los clientes y se dice a sí mismo: «En realidad no lo estoy robando; realmente encontraré una manera de manipular la contabilidad y devolverlo todo a su lugar después de que voltee mi vigésima cabeza»? y hacer otra apuesta? Y así terminar en un tribunal federal en un juicio por malversación de fondos, quejándose: «Nunca tuve la intención de quedarme con el dinero, sino de devolverlo».

Y, de hecho, las empresas comerciales utilizan el criterio de Kelly no tanto porque tengan funciones de utilidad logarítmicas sino por otras tres razones:

  • Hay un valor para la franquicia por hacer apuestas futuras que se destruye con la quiebra, y esa pérdida no llega al cálculo inicial del operador.

  • Si sus traders no creen en lo que están haciendo y no sobreestiman un poco sus posibilidades de éxito, probablemente no tenga los traders adecuados.

  • La tentación psicológica de apostar por la resurrección cuando se está bajo el agua es muy fuerte y muy humana, y conduce a verdaderas sorpresas a medida que las personas descubren quiénes son realmente y cuántos atajos están dispuestos a tomar.

Deja un comentario

PODCAST: "hexapodia" ¡Es esta visión clave!  XLIII: ¡Fraude criptográfico!  Edición

PODCAST: ¡»Hexapodia» es la idea clave! XLIII: ¡Fraude criptográfico! Edición

Suicidio financiero cuántico, SBF y FTX y

Suicidio financiero cuántico, SBF y FTX y

Estrategia industrial para una economía rica y de vanguardia, y NOTA BREVE

Estrategia industrial para una economía rica y de vanguardia, y NOTA BREVE

NOTA personal: apalancamiento óptimo del mercado de valores ex-post

NOTA personal: apalancamiento óptimo del mercado de valores ex-post

Comparta la apasionante realidad de Brad DeLong





Brad DeLong's Grasping Reality

RELACIONADOS