Análisis de resultados de fútbol con Power BI
- El informe en Power BI de este artículo lo puedes descargar pulsando AQUI.
El Business Intellingence (o inteligencia empresarial, en castellano) como concepto, existe desde hace muchos años aunque en estos últimos años este término se esta poniendo muy de moda. El Business Intelligence no es más que un proceso que consiste en transformar los datos en información y la información en conocimiento con el fin de que ese conocimiento sirva para la toma de decisiones empresariales. Este concepto como tal es simple pero se complica cuando la cantidad de datos de la que se dispone es extremadamente grande; de ahí, que el Big Data y el Business Intelligence vayan siempre de la mano.
Hecha esta pequeña introducción de lo que es el Business Intelligence y dado que he tenido que utilizar por temas laborales herramientas de business intelligence como Tableau y Power BI, pensé en hacer un informe sobre los resultados de los partidos de fútbol de la liga Española desde la temporada 1970-71 hasta la 2016-17, aprovechando el data set que publiqué y compartí en el entrada de «Data Set de resultados de partidos de fútbol para su predicción (Machine Learning)» con el fin de que fuese utilizado para la predicción de resultados de partidos de fútbol utilizando técnicas de Machine Learning.
El informe realizado para esta entrada puede considerarse un ejercicio de obtención de conocimiento a partir de un conjunto de datos (business intelligence) que pueden servir para la toma de decisiones a la hora de hacer una quiniela o realizar alguna apuesta. Con el data set de partidos de fútbol podemos hacernos preguntas como ¿Cuantos partidos han tenido como resultado una victoria del equipo local, del visitante o han terminado en empate?,¿Cuantos partidos gana, empata o pierde un equipo?, ¿Cuantos de estos partidos los gana o los pierde en su estadio o fuera de él?, de un partido concreto ¿Cuales fueron sus resultados, cuantos goles anotaron, etc.? y así todas las preguntas que se nos ocurran para poder tomar la decisión de que resultado poner en la quiniela. Para hacer este tipo de análisis hay que tener ciertos conocimientos para el tratamiento de los datos como por ejemplo saber filtrar datos, agruparlos, unirlos, hacer operaciones matemáticas sobre esos datos, etc. que son conceptos que no vamos a explicar en esta entrada; pero si hay que decir, que Power BI en este caso permite hacer este tipo de operaciones de forma sencilla sin tener que saber ningún de lenguaje de consultas, etc. ya que Power BI ofrece un entorno que permite hacer filtros, group by, Join, etc. de forma interactiva. A continuación se muestra el informe realizado, ya que Power BI permite embeber estos informes con un iframe (informe con 3 secciones).
En primer lugar tenemos un conteo de cuantos partidos se han jugado (36K), cuantos han tenido como resultado un «1» (18K) en la quiniela y cuantos un «X» (10K) y un «2» (7.9K). Con esta información podemos ver que casi un 51% de los resultados son un «1» un 27,5% son un empate y casi un 22% son un «2». A parte podemos ver que historicamente la tendencia es esa, aunque también se puede apreciar que en los últimos años los empates y las victorias del equipo visitante crecen:
En el segundo informe se muestra en una tabla el número de partidos que ha jugado cada equipo y cuantos de ellos los ha ganado, empatado y perdido a parte de saber el porcentaje que eso supone. Podemos ver como el Real Madrid y el Barça son los dos equipos que más partidos han ganado ya que por defecto ordenamos la tabla por el número de victorias aunque podemos ordenar la tabla por la columna que queramos. Por otro lado se han puesto tres gráficos Voronoi en el que se muestran los equipos que más partidos han ganado, los que más han empatado y los que más han perdido. Como se puede apreciar el Zaragoza y el Valladolid son los equipos que más partidos empatan y el Osasuna y Sporting de Gijón los que más partidos pierden.
Por último se muestra un informe por partidos de fútbol jugados y datos interesantes de los mismos. Como se puede apreciar los partidos que más se han jugado son el Barça-Real Madrid y Real Madrid-Barça, viendo de esos partidos información como: victorias del local, del visitante, empates, cuantos goles se han metido, cuantos goles de media se meten en el partido, cuantos lo hace el local, cuantos el visitante, el partido que más goles ha marcado el local, cuantos el visitante, etc. a parte; en la parte derecha del informe, se puede filtrar por el equipo local o el visitante (o ambos). La tabla tambien puede ser ordenada por cualquier campo.
Con un informe como este no creo que consigamos un pleno al 15 en una quiniela (o igual sí) pero seguro que nos ayuda rellenar una quiniela teniendo un conocimiento importante de las quinielas y de los partidos jugados.
Haciendo un pequeño análisis de Power BI, es cierto que (al igual que Tableau) es una herramienta visual bastante potente, que permite analizar y transformar los datos para poder ser pintados en un informe. Para realizar este informe el data set no llegaba a los 3MB y he podido realizar bastantes operaciones sobre él de forma rápida; aunque le faltan ciertas operaciones estadísticas (por lo menos en la versión free) como el cálculo de varianza, desviación típica, etc. que por ejemplo librerías como Pandas (de Python) lo pueden realizar, aunque para su uso hay que tener conocimientos de programación. Lo malo es que estas herramientas no pueden trabajar con muchos datos ya que realice pruebas con el data set de Movilens de 10M de votos (de usuarios) que eran entorno a 250MB de datos y tardaba muchísimo en procesar y analizar estos datos (con un procesado i7 y 16GB de Ram); tardando por ejemplo, 3-4 minutos en hacer una simple agrupación por película y obtener la media de los votos. Para este tipo de casos lo mejor es utilizar en Power BI los datos ya procesados y agregados por alguna herramienta externa.
Hola
Gran trabajo, no han pensado en seguiir actualizando la base de datos de los partidos de futbol al dia de hoy?
Saludos
Hola.
La podemos actualizar por medio del script que hicimos en la siguiente entradas:
https://jarroba.com/dataset-resultados-partidos-futbol-prediccion-machine-learning/
Ahora resulta que meten publicidad??
¿Publicidad? Ni nos pagan los de Microsoft ni los de la liga Española un duro por el momento XD
Aclaro que simplemente utilizamos esta herramienta gratuita como pudieramos enseñar cualquier otra. Simplemente que por la experiencia que tenemos, hemos visto que esta herramienta es muy útil y con el único objetivo de que ayude a mucha gente.
Puedes descargar Power BI gratis desde: https://powerbi.microsoft.com/es-es/get-started/