"La ley de los grandes números, también llamada ley del azar, afirma que al repetir un experimento aleatorio un número de veces, la frecuencia relativa de cada suceso elemental tiende a aproximarse a un número fijo, llamado probabilidad del suceso." Ahí queda eso...
Como mejor se entiende es con el ejemplo del lanzamiento de un dado, la prob de sacar cualquier número es del 0.167 (1/6) pero no obtendremos la misma frecuencia en el resultado si tiramos 10 veces que si tiramos 100 o que si tiramos 1000.
Si tomamos los partidos de la liga como sucesos independientes pero dentro de una misma jornada, podemos analizar la tendencia de una competición en cuanto a resultados o mercados se refiere.
Por ejemplo, en la hoja excel adjunta podéis ver como he ido sumando por jornadas diferentes "mercados" desde si el resultado del partido es par, si marcan los 2 equipos, si marcan 2-3 goles, si se marca 0-1 gol, si marcan más de 2,5, si se marcan más de 3,5, empates...
En la primera columna tenéis el número de la jornada, en este caso he escogido los datos de la Premier 2014/2015 en la siguiente columna tenéis el número de veces que se da ese "suceso" o resultado que buscamos en cada jornada (en esa jornada) y en la columna inmediatamente posterior lo que hago es calcular el % acumulado de ese suceso desde la jornada 1 hasta la x (acumulo todos y voy sacando el %).
En la parte de abajo tengo las referencias de los 2 años anteriores inmediatos en esos mercados, en los que como podéis ver hay pequeñas desviaciones de un año a otro, las desviaciones suelen ser mayores siempre en mercados de goles que en mercados 1x2 (que también estuve analizando).
Todo esto por qué lo hice? Pues para analizar si hay opción de sacar valor en tendencias futuras.
Os pongo el ejemplo del mercado de goles par, en las 9 primeras jornadas el % estaba por encima de la probabilidad que se estima para ese suceso (50% aprox) por lo que a medida que se vayan disputando los 380 partidos de liga la ley de los grandes números nos dice que ese % debe bajar y por tanto en nº de partidos con resultado par. La pregunta es: ¿a partir de cuando "debe/debería" empezar a ser menor? pregunta del millón...
En este caso si os fijáis pasamos de un % de más del 60% de la jornada 1 a la 9 (color verde) a un % del 43% de la 10 a la 19 (color amarillo)..Este resultado tiene un reflejo o parte de la explicación en el % de empates de esas primeras 9 jornadas (muy por encima de la media). Casualidad?? No. Big Data...
Que resultado hubiésemos obtenido apostando al impar en ese periodo de la 10 a la 19 por ejemplo 57w/43l, not bad no? Para un mercado que se suele pagar sobre 1,95 verdad? Más de un 11% yeild y con un payout decente en (para el caso del impar mejor cuota además)
Pero esto no es tan fácil, como os decía la pregunta es cuando entrar? Cuantos sucesos son suficientes para considerar que la tendencia está muy por encima de la probabilidad esperada y que va a cambiar? Hasta ahora estoy trabajando en:
- Estudiar los datos totales de esa misma liga en los últimos años.
- Ver patrones o buscar tendencias similares con max y min varianzas en los últimos años, es decir tener esta misma tabla del año anterior y del anterior.
- Ver si además de esa tendencia los resultados son aun más "extremos/desviados" en las ultimas jornadas.
Habrá alguno que me esté leyendo y esté pensando que no tengo ni puta idea de estadística, ni de probabilidad y que los sucesos son totalmente independientes, que no voy a llegar a ningún lado y que la falacia del jugador está en mi contra y en la de este análisis y os tendría que dar la razón en parte, pero y si sí...(grande José Mota ;-))
Creo que hay una parte importante de la estadística basada en patrones que se les asca pa a muchos y que es muy aprovechable en ligas como la BBVA en la que se juegan los partidos consecutivamente y tienes % y datos a compartir con otros años y patrones de los mismos. Este fin de semana por ejemplo en la jornada 31 de la liga BBVA hubo 8 partidos consecutivos con both to score y eso no había pasado en los últimos años (es la probabilidad de que 16 equipos le marquen a otro...sacadla...), los patrones siempre eran de 5 o 6 como máximo pero por pura estadística, tengo claro que el resultado de un partido no tienen nada que ver en otro y que son sucesos totalmente independientes PERO NO LO SON LOS PATRONES DE LA LIGA y el que quiera discutirlo que lo discuta seguro que lo hará sin haber estudiado series de datos y ligas y se basara en la falacia del jugador y en el rojo y negro, pero la realidad no es la misma ni se puede comparar con algo que pasa y que tiene patrones definidos y no aleatorios como el rojo y negro, en un partido hay muchas más variables y no digamos en el comportamiento de 20 equipos de una liga...La jornada 32 tendrá 8 o 9 btts??? Yo apuesto a que no...
Creéis que las bookies analizan los partidos de la jornada en su conjunto? Rotundamente no, salvo casos especiales como los de pinny cuando nos ofrece ah y líneas de gol para todos los partidos de una jornada y de una misma liga?...Creeis que con estudio de patrones se les puede sacar partido? En mi modesta opinión. Todos los datos que manejamos durante la liga tienden hacia una media, media, normal, etc llamadlo como queráis pero eso es un hecho.
No pretendo sentar cátedra pero el paradigma de la falacia del jugador cuando analizas patrones de datos grandes tiene su sentido o al menos así lo veo yo, otra cosa es que no es nada fácil cuando es el momento en el que las series están en máximos o minimos y cuando entrar...
Este estudio lo tengo aun muy vivo y sigo hablando y discutiendo sobre el mismo con amigos, os invito a que me sigáis ayudando a mejorarlo y a sacar conclusiones o a que con toda la confianza del mundo me digáis que me dedique a otra cosa, me tenéis disponible en twitter @bigdatabets o en bigdatbets@gmail.com
Abrasos y gracias por estar ahí.
Gracias por vuestro apoyo, si os he aportado estaré muy agradecido por darle difusión
Abrasos.
Manu.