¡°Durante un partido se pueden generar ocho millones de datos¡±
Francisco Gonz¨¢lez est¨¢ a la vanguardia de la utilizaci¨®n del Big Data en el f¨²tbol. En Espa?a es una novedad a la que tienden las entidades punteras...
?C¨®mo lleg¨® a dedicarse a la estad¨ªstica en el f¨²tbol?
Empec¨¦ a trabar a los 18 a?os con empresas de telecomunicaciones e inform¨¢tica. Paralelamente entren¨¦ en multitud de categor¨ªas del f¨²tbol base, hasta Tercera Divisi¨®n Nacional. Los dos sectores, tecnolog¨ªa y f¨²tbol, han ido de la mano para m¨ª. Siempre buscaba integrar un sector o cualquier novedad en el otro. Ten¨ªa una ilusi¨®n, un reto, integrar ambos conceptos. Hace 25 a?os era inimaginable, ahora es una realidad.
?Cu¨¢l ha sido el gran cambio en el f¨²tbol?
La clave de todo esto es una situaci¨®n real que vivimos no en el deporte, sino en la vida. Es la nueva revoluci¨®n industrial derivada del mundo del dato, el internet de las cosas. En cualquier situaci¨®n de nuestra vida se generan multitud de datos a nuestro alrededor. Hay millones de datos a nuestro alrededor que monitorizan absolutamente todo lo que sucede. Y el f¨²tbol no es ajeno a ello.
?Cu¨¢ntos datos genera un partido de f¨²tbol?
Teniendo en cuenta todos los jugadores, equipo arbitral y lo m¨¢s importante, la pelota, se capturan m¨¢s de ocho millones de datos y eventos.
?C¨®mo se recogen?
Instalando tecnolog¨ªa IoT, de internet de las cosas, en este caso de monitorizaci¨®n en los estadios. Por ejemplo, con una serie de c¨¢maras. As¨ª se estudian los eventos...
?A qu¨¦ se refiere con eventos?
A situaciones del juego. Imaginemos que vemos de nuevo el partido pero no a trav¨¦s de todos los ojos de todos los que estamos en el estadio, si no con los ojos de 100 Bernab¨¦us llenos.
?Qu¨¦ se puede hacer con esos datos?
Una vez capturados debemos almacenarlos correctamente en un repositorio com¨²n que permita transversabilidad entre todos los actores de responsabilidad en el tratamiento de los mismos. Depurarlos, como dicen en mi tierra de Castilla, para separar el grano de la paja. No todos valen y m¨¢s teniendo en cuenta lo que nos solicite quien tiene que tomar la decisi¨®n subjetiva final. Analizarlos objetivamente, y eso s¨®lo es posible por el volumen de los mismos con herramientas anal¨ªticas y algoritmos matem¨¢ticos. Y posteriormente reportar sus conclusiones de una manera f¨¢cil y sencilla para quien toma las decisiones finales de una manera subjetiva pero apoy¨¢ndose entre otros aspectos en la objetividad del dato correctamente interpretado, las tome con las mayores garant¨ªas y ahorr¨¢ndose el mayor tiempo posible. El tiempo, algo tan necesario.
?Si?
Wenger, apoy¨¢ndose en conocimiento cient¨ªfico dice que el ojo humano s¨®lo puede ver el 30% de lo que pasa en un partido. No le falta raz¨®n. El resto de informaci¨®n que no ves est¨¢ ah¨ª. Se trata de que no se nos escape ni un solo detalle, el f¨²tbol se decide por m¨ªnimos detallles. Porque eso ayudar¨¢ a la toma de decisiones.
La cultura del dato...
En las grandes empresas se culturiza a la organizaci¨®n a trav¨¦s del dato para ayudar a tomar decisiones subjetivas pero apoyadas en objetividad, y ahora, le ha llegado su momento en el f¨²tbol. O culturizamos nuestras entidades a trav¨¦s del dato, o estaremos un paso o varios por detr¨¢s de nuestros rivales.
?C¨®mo se ordenan ocho millones de datos?
Lo principal es tener claro cu¨¢l es el dato id¨®neo, el dato maestro. Sin duda alguna es el dato ZXY, los datos que se producen en todas sus situaciones a trav¨¦s de la pelota. Y depurarlo al m¨¢ximo a trav¨¦s de los requerimientos de quien toma la decisi¨®n final de manera subjetiva. El buen proyecto de data se realiza correctamente, en un 80%, depurando al m¨¢ximo el dato.
Tiene sentido¡
Una vez que tenemos el dato depurado hay que aplicar la ciencia. El an¨¢lisis de esos ocho millones de datos genera m¨¢s de 25 pentabytes de datos.
?Eso es mucho?
En papel impreso ser¨ªan m¨¢s de 259.000 kil¨®metros. ?Qui¨¦n ser¨ªa capaz de analizarlo de manera objetiva sin la metodolog¨ªa y las herramientas correctas?
Parece complicado.
Por supuesto que es complicado, pero necesario. El f¨²tbol es un juego, pero un juego ac¨ªclico de habilidades abiertas donde todo gira alrededor de la pelota y en el que el factor humano, toma de decisi¨®n final del jugador e incluso decisiones arbitrales y fortuna tienen mucho que decir. Por eso genera tantos eventos, por eso requiere de metodolog¨ªas del tratamiento del dato, profesionales.
?Y qu¨¦ pasa en otros deportes?
Es m¨¢s f¨¢cil analizar otros deportes, la gran mayor¨ªa son c¨ªclicos.
?Podr¨ªa poner casos pr¨¢cticos en el f¨²tbol?
El Leicester gan¨® la Premier. Ha sido el primer equipo de la historia del f¨²tbol de ¨¦lite europeo, top, que menos jugadores lesionados ha tenido en una temporada. Ranieri tuvo el m¨¢ximo tiempo a todos sus jugadores para preparar la periodizaci¨®n t¨¢ctica y t¨¦cnica. En Inglaterra obligan a los clubes a tener dentro de su estructura matem¨¢ticos de datos.
?Conoce a los del Leicester?
A Tom Joel y a sus compa?eros, s¨ª. Espectacular trabajo el que realizan.
?Qu¨¦ situaciones son ac¨ªclicas?
Patrones de juego. ?Podemos predefinir c¨®mo nos va a jugar un equipo? ?Si juega en casa o fuera? ?Si es una acci¨®n de salida de bal¨®n o de repliegue? ?C¨®mo juega si llueve mucho o poco? ?Si pita un ¨¢rbitro u otro?
?Se puede saber?
Se puede saber. Pero esa es la clave. Para responder a esas preguntas hay que conocer el dato perfecto. Y el dato perfecto ser¨ªa X Y sobre pelota. Necesitar¨ªamos saber la posici¨®n de los jugadores y la pelota para a partir de ah¨ª meter ciencia que nos permita saber qu¨¦ va a suceder.
Hemos llegado a la clave¡
No es dogm¨¢tico, pero el entrenador va a tener tanta informaci¨®n sobre lo que le puede pasar que le va a ayudar a tomar decisiones. Se pueden predecir patrones del comportamiento del juego.
Lo del lanzamiento de penaltis ser¨¢ lo m¨¢s b¨¢sico...
(Risas). Eso es c¨ªclico, es m¨¢s f¨¢cil. Pero funciona igual: el portero tendr¨¢ toda la informaci¨®n pero luego decide ¨¦l d¨®nde se tira. Pero podr¨¢ saber por d¨®nde los suele tirar Messi si est¨¢ fuera de casa y el partido ha pasado del minuto 70. Y esto es rec¨ªproco: el lanzador tambi¨¦n podr¨ªa tener informaci¨®n de hacia d¨®nde se suelen tirar los porteros.
?Qu¨¦ pueden ganar los entrenadores?
Tiempo, eso que nos falta a todos. Y emplear ese tiempo en el terreno de juego o en tareas de metodolog¨ªa que consideren oportunas. Yo organizo en la Universidad de Valladolid un m¨¢ster dedicado a formar en esta metodolog¨ªa y cultura del dato. En la primera edici¨®n tuvimos 19 inscritos. Hubo profesionales de clubes como el Sevilla que apostaron por inscribirse para aprender. Tambi¨¦n del New York Cosmos, Real Valladolid y de varios equipos chinos. A todos esos 19 estudiantes mi agradecimiento por su confianza.
Curioso.
Eso fue en octubre. Para la segunda edici¨®n, que sale en marzo, ya hay 42 inscritos. El 90% son analistas de equipos de primer nivel del f¨²tbol espa?ol. Barcelona, Real Madrid, Sevilla, Valladolid, Real Sociedad¡
Este es el momento.
Sin duda es el momento.
?C¨®mo contrat¨® el Sevilla sus servicios?
Por la relaci¨®n a trav¨¦s del m¨¢ster de la Universidad de Valladolid.
?Qu¨¦ quieren hacer?
Imagino que seguir creciendo, si cabe a¨²n m¨¢s, y esto es otro granito de arena a sumar.
?El Madrid no trabaja en este sentido?
Lo desconozco. Mi ¨²nica relaci¨®n con el Madrid es indirecta a trav¨¦s de la Universidad Europea, como formador en varios de sus m¨¢sters.
?Sirve el Big Data para los fichajes?
Indudablemente. Ese tema es c¨ªclico. Es indiferente contratar un talento para un equipo o para IBM o Microsoft. S¨®lo hacen falta una serie de herramientas que analicen datos.
De fichar a voleo, nada.
Se est¨¢ fichando de una manera subjetiva, y seguir¨¢ siendo as¨ª. Pero se puede mirar si un jugador se lesiona mucho o poco, qu¨¦ grado de comportamiento ha tenido dentro del grupo, el grado de expulsiones¡ Todo eso es c¨ªclico. Pero en lo ac¨ªclico se podr¨ªa mirar, si soy un equipo al que le gusta tener la pelota, cu¨¢l es su ratio consecutivo de asociaci¨®n media¡
?Ratio consecutivo de asociaci¨®n media?
La capacidad de asociarse con dos, tres o cuatro jugadores de manera consecutiva en tres, cuatro o cinco ocasiones. Es correlacionar la asociaci¨®n. Puedo saber la influencia de un mediocentro respecto al juego. Busquets siempre garantiza la primera salida de bal¨®n. Da bien el primer pase el 98% de las veces. Pero tambi¨¦n se puede saber qu¨¦ pasa luego con el bal¨®n en las siguientes tres o cuatro acciones, si tienen ¨¦xito o no. Porque dependen mucho de aquel primer pase que dio Busquets.