jueves, 24 de septiembre de 2015

Proyecto basado en la ley de los grandes números, es posible convertirla en nuestra aliada? O estoy incurriendo en la falacia del jugador?

"La ley de los grandes números, también llamada ley del azar, afirma que al repetir un experimento aleatorio un número de veces, la frecuencia relativa de cada suceso elemental tiende a aproximarse a un número fijo, llamado probabilidad del suceso." Ahí queda eso...

Como mejor se entiende es con el ejemplo del lanzamiento de un dado, la prob de sacar cualquier número es del 0.167 (1/6) pero no obtendremos la misma frecuencia en el resultado si tiramos 10 veces que si tiramos 100 o que si tiramos 1000.

Si tomamos los partidos de la liga como sucesos independientes pero dentro de una misma jornada, podemos analizar la tendencia de una competición en cuanto a resultados o mercados se refiere. 

Por ejemplo, en la hoja excel adjunta podéis ver como he ido sumando por jornadas diferentes "mercados" desde si el resultado del partido es par, si marcan los 2 equipos, si marcan 2-3 goles, si se marca 0-1 gol, si marcan más de 2,5, si se marcan más de 3,5, empates...

En la primera columna tenéis el número de la jornada, en este caso he escogido los datos de la Premier 2014/2015 en la siguiente columna tenéis el número de veces que se da ese "suceso" o resultado que buscamos en cada jornada (en esa jornada) y en la columna inmediatamente posterior lo que hago es calcular el % acumulado de ese suceso desde la jornada 1 hasta la x (acumulo todos y voy sacando el %).

En la parte de abajo tengo las referencias de los 2 años anteriores inmediatos en esos mercados, en los que como podéis ver hay pequeñas desviaciones de un año a otro, las desviaciones suelen ser mayores siempre en mercados de goles que en mercados 1x2 (que también estuve analizando).

Todo esto por qué lo hice? Pues para analizar si hay opción de sacar valor en tendencias futuras. 

Os pongo el ejemplo del mercado de goles par, en las 9 primeras jornadas el %  estaba por encima de la probabilidad que se estima para ese suceso (50% aprox) por lo que a medida que se vayan disputando los 380 partidos de liga la ley de los grandes números nos dice que ese % debe bajar y por tanto en nº de partidos con resultado par. La pregunta es: ¿a partir de cuando "debe/debería" empezar a ser menor? pregunta del millón...

En este caso si os fijáis pasamos de un % de más del 60% de la jornada 1 a la 9 (color verde) a un % del 43% de la 10 a la 19 (color amarillo)..Este resultado tiene un reflejo o parte de la explicación en el % de empates de esas primeras 9 jornadas (muy por encima de la media). Casualidad?? No. Big Data...

Que resultado hubiésemos obtenido apostando al impar en ese periodo de la 10 a la 19 por ejemplo 57w/43l, not bad no? Para un mercado que se suele pagar sobre 1,95 verdad? Más de un 11% yeild y con un payout decente en  (para el caso del impar mejor cuota además)

Pero esto no es tan fácil, como os decía la pregunta es cuando entrar? Cuantos sucesos son suficientes para considerar que la tendencia está muy por encima de la probabilidad esperada y que va a cambiar? Hasta ahora estoy trabajando en:

  • Estudiar los datos totales de esa misma liga en los últimos años.
  • Ver patrones o buscar tendencias similares con max y min varianzas en los últimos años, es decir tener esta misma tabla del año anterior y del anterior.
  • Ver si además de esa tendencia los resultados son aun más "extremos/desviados" en las ultimas jornadas.

Habrá alguno que me esté leyendo y esté pensando que no tengo ni puta idea de estadística, ni de probabilidad y que los sucesos son totalmente independientes, que no voy a llegar a ningún lado y que la falacia del jugador está en mi contra y en la de este análisis y os tendría que dar la razón en parte, pero y si sí...(grande José Mota ;-))

Creo que hay una parte importante de la estadística basada en patrones que se les asca pa a muchos y que es muy aprovechable en ligas como la BBVA en la que se juegan los partidos consecutivamente y tienes % y datos a compartir con otros años y patrones de los mismos. Este fin de semana por ejemplo en la jornada 31 de la liga BBVA hubo 8 partidos consecutivos con both to score y eso no había pasado en los últimos años (es la probabilidad de que 16 equipos le marquen a otro...sacadla...), los patrones siempre eran de 5 o 6 como máximo pero por pura estadística, tengo claro que el resultado de un partido no tienen nada que ver en otro y que son sucesos totalmente independientes PERO NO LO SON LOS PATRONES DE LA LIGA y el que quiera discutirlo que lo discuta seguro que lo hará sin haber estudiado series de datos y ligas y se basara en la falacia del jugador y en el rojo y negro, pero la realidad no es la misma ni se puede comparar con algo que pasa y que tiene patrones definidos y no aleatorios como el rojo y negro, en un partido hay muchas más variables y no digamos en el comportamiento de 20 equipos de una liga...La jornada 32 tendrá 8 o 9 btts??? Yo apuesto a que no...

Creéis que las bookies analizan los partidos de la jornada en su conjunto? Rotundamente no, salvo casos especiales como los de pinny cuando nos ofrece ah y líneas de gol para todos los partidos de una jornada y de una misma liga?...Creeis que con estudio de patrones se les puede sacar partido? En mi modesta opinión. Todos los datos que manejamos durante la liga tienden hacia una media, media, normal, etc llamadlo como queráis pero eso es un hecho.

No pretendo sentar cátedra pero el paradigma de la falacia del jugador cuando analizas patrones de datos grandes tiene su sentido o al menos así lo veo yo, otra cosa es que no es nada fácil cuando es el momento en el que las series están en máximos o minimos y cuando entrar...

Este estudio lo tengo aun muy vivo y sigo hablando y discutiendo sobre el mismo con amigos, os invito a que me sigáis ayudando a mejorarlo y a sacar conclusiones o a que con toda la confianza del mundo me digáis que me dedique a otra cosa, me tenéis disponible en twitter @bigdatabets o en bigdatbets@gmail.com

Abrasos y gracias por estar ahí.




Gracias por vuestro apoyo, si os he aportado estaré muy agradecido por darle difusión

Abrasos.

Manu.




4 comentarios:

  1. Liga española. Más 1,5 goles
    2012/2013 76%
    2013/2014 72%
    2014/2015 74%
    Ahora mismo en 2015/2016 estamos en 61%. Se supone que llegará a más de 70%.
    Pero cuando? Si tarda muchas semanas se acumulará una pérdida que tenemos que compensar Cómo? Aumentando el stake después de cada semana en negativo? Uff...complicado está el tema.

    ResponderEliminar
  2. Gracias por tu aportación José.

    Por su puesto que está complicado, nadie dijo que fuera fácil ;-). Tengo un problema, en mis stats no he incluido el over 1,5 para ver tendencias o streaks de los últimos años por lo que no te puedo dar una orientación de cual podría ser la "máxima varianza" alcanzada en ese mercado en jornadas consecutivas.

    Yo en cualquier caso hasta la jornada 9-10 nunca considero desviación significativa (por el motivo que explicaba con el ejemplo del dado), necesitamos al menos 100 partidos que ya es más del 25% de las competición, si en la jornada10 llevamos el 60 revisamos stats y tendencias de las últimas semanas.

    En la jornada 10 llevaremos 100 partidos, si consideramos que la media de este mercado es del 73% en los ultimos 2 años quiere decir que 277 de cada 380 partidos de liga acaban en over 1,5 , ok? en la jornada 10 si sigue en 60 nos "quedarían" entonces 217 partidos para llegar a ese 73%. O lo que es lo mismo de los 280 partidos que quedarían por jugarse tendríamos un 78% de overs, a partir de aquí habría que ver si las cuotas medias con la suma de todos los over de la jornada están por encima del 1,28 , me sigues?

    Otra opción es entrar y salir en cuanto hayamos conseguido más del yeild que si siguiésemos hasta el final, imagina que entramos en la 11 y en la 11º y 12º jornadas hay 8 y 9 overs...es difícil...pero y si sí ;-)

    Gracias por leerme y por aportar, espero haberme explicado bien.

    ResponderEliminar
  3. Este comentario ha sido eliminado por el autor.

    ResponderEliminar