"Para el Big Data Messi es el mejor, no hay ninguna duda"
Salvador Carmona es experto en analizar futbolistas a trav¨¦s del Big Data. Su modelo, similar al de 'Moneyball', busca ayudar a los clubes a retocar sus plantillas.
Salvador Carmona nos recibe en COTEC para hablar sobre Big Data en el mercado del f¨²tbol en el marco de Imperdibles 02, un evento que atraer¨¢ la innovaci¨®n al balompi¨¦ los pr¨®ximos 10 y 11 de junio en el Vicente Calder¨®n. Carmona es experto en Big Data y con su empresa, Origami Sports, controla en su base de datos toda la Europa futbol¨ªstica y gran parte del otro continente. Para ¨¦l, cada futbolista est¨¢ representado por sus n¨²meros y por 'su nota', en la que por cierto, asegura que Messi no tiene discusi¨®n. Salva, como nos dice que le llamemos, no renuncia a las sensaciones del f¨²tbol pero cree que a¨²n se renuncia a mucha informaci¨®n valiosa dentro de "las l¨ªneas de c¨®digo". Los datos son el terreno de juego de este 'matem¨¢tico del f¨²tbol' que nos explica, sin desvelar el truco, como 'su magia' (o eso nos parece a los no iniciados) puede incidir en el terreno de juego.
- ?Y en deporte?
Se empieza en 2008-2009 en la NBA, cuando los equipos empiezan a capturar todos los movimientos de los jugadores en cancha con c¨¢maras que dan la telemetr¨ªa. Consegu¨ªan recopilar datos hasta del ¨¢rbitro o la pelota. Para que te hagas una idea, sacaban hasta tres millones de datos por partido... Ah¨ª es cuando creo que entra fuertemente en el deporte.
- ?A qui¨¦n se le enciende la bombilla para pensar que este m¨¦todo se pod¨ªa aplicar al deporte?
A los dirigentes de los Oakland Athletics de la MLB en el 97, cuando deciden contratar estad¨ªsticos para crear un modelo predictivo de lo que pod¨ªan hacer los jugadores para conseguir jugadores buenos a precio reducido. No es Big Data como tal, digamos que es el concepto inicial sobre el que luego esto evoluciona.
- ?C¨®mo en la pel¨ªcula Moneyball?
S¨ª, creo que la pel¨ªcula la sit¨²an un poco despu¨¦s pero s¨ª, es esa historia real.
- ?Como pas¨¢is este modelo al f¨²tbol, donde las estad¨ªsticas tienen menos influencia a lo largo de la historia que en b¨¦isbol o baloncesto?
- En el f¨²tbol, hoy ya podemos registrar todo como en el resto de deportes. Queda todo registrado, especialmente con bal¨®n. De hecho, hay muchos jugadores que ni lo saben. En un partido normal hay entre 10.000 o 12.000 l¨ªneas de c¨®digo que quedan empaquetadas en un lenguaje infame que luego nosotros desciframos. De ah¨ª, luego podemos saber si un jugador pasa el bal¨®n en cierto punto del campo o en un momento determinado. Despu¨¦s, nosotros buscamos patrones que se repitan para intentar crear un perfil. Yo hago perfiles m¨¢s de cara a los fichajes pero tambi¨¦n se puede aplicar para entrenamientos, an¨¢lisis de rendimiento de cada jugador, etc.
- Dentro del f¨²tbol, ?cuantos aspectos del juego pod¨¦is medir?
- Todo, absolutamente. Puede llegar a ser bastante esquizofr¨¦nico. Te pongo un ejemplo: un jugador centra y no hay nadie al remate, ?vale?. Pues ponte que el portero levanta la mano para pedirla. Eso queda registrado. Si la pide, queda registrado. Si la coge, obviamente tambi¨¦n pero es m¨¢s, si la coge en dos tiempos queda registrada la primera parada y luego cuando la bloca abajo.
- Todos estos datos, ?c¨®mo los convert¨ªs luego en un perfil de un jugador?
- Hay ciertos par¨¢metros descriptivos que son los t¨ªpicos de una p¨¢gina de estad¨ªsticas. Este jugador ha hecho tantos goles y dado tantas asistencias. Luego hay modelos predictivos y tambi¨¦n comparaci¨®n con jugadores similares.
Por ejemplo, hace poco nos pidieron un informe sobre Theo Hern¨¢ndez. Ahora, el mercado de laterales es corto y en el caso de Theo, al jugar solo un a?o profesionalmente complica un poco la tarea porque no tenemos muchos datos. En su caso, tenemos unos par¨¢metros de como ha jugado esta temporada siempre registr¨¢ndolo por cada 90 minutos, no por partido, que distorsiona los datos. En el caso de Theo, analizamos todos los par¨¢metros importantes de un lateral con los que cumpl¨ªa, luego, modelos predictivos de c¨®mo participa en la creaci¨®n de juego y, por ¨²ltimo, comparaciones con otros jugadores. En este caso, nos encajaban tres: Marcelo, que ser¨¢ su competidor directo la pr¨®xima temporada o jugadores tipo Rose del Tottenham o Alex Sandro de la Juve. Adem¨¢s, tambi¨¦n incluimos un rendimiento jornada a jornada de este a?o con el Alav¨¦s.
- ?Hay jugadores m¨¢s f¨¢ciles de medir que otros?
- S¨ª, claro. El portero suele ser complicado, porque tienen muy pocos datos al participar poco en el juego. Aunque tengas muchos datos en el global, tienes pocos en concreto de este jugador. Mira, en un partido, de ese total de 12.000 l¨ªneas de datos, un 75% aproximadamente son pases. Es el otro 25% del que tienes que sacar algo, ya que los pases de un portero suelen ser poco trascendentes.
A m¨ª, personalmente, los jugadores que m¨¢s me cuesta analizar son los mediocentros defensivos como Xabi Alonso. Son centrocampistas defensivos pero son capaces de darse la vuelta y jugar muy bien con bal¨®n. Llorente, Busquets es un mercado de jugadores muy reducido y adem¨¢s, dif¨ªcil de diferenciar estad¨ªsticamente de 'los Kant¨¦', m¨¢s recuperadores.
- ?Qu¨¦ relevancia puede tener el Big Data a la hora de definir un fichaje?
- Sirve, en primer lugar, para priorizar a unos jugadores sobre otros. Un director deportivo te puede dar cinco opciones y t¨², respecto a los datos, ordenarselos del que m¨¢s encaja al que menos. Eso es f¨¢cil. En mi opini¨®n, es m¨¢s ¨²til para la identificaci¨®n de jugadores. Un director deportivo quiere buscar un tipo de lateral izquierdo y hay uno en la segunda alemana que va muy bien o en Holanda, Suecia, Rusia... y estas ligas, que s¨ª tenemos, muy pocas veces se cubren d¨ªa a d¨ªa desde el departamento deportivo de un club. El ejemplo m¨¢s reciente que se me ocurre es el Alexander Isak, que nosotros encontramos bastante r¨¢pido y el Dortmund no tard¨® nada en ficharlo y por 19 millones. Si te anticipas a ese mercado, podr¨ªas tener a Alexander Isak por menos dinero. El principal parecido con Moneyball est¨¢ aqu¨ª, para poder encontrarlo antes y firmarlo por menos dinero. Para optimizar recursos.
- ?Tapan las estad¨ªsticas el talento natural? Por ejemplo, hay jugadores que son menos eficientes pero m¨¢s talentosos. Se me viene a la cabeza ?zil... Tiene un porcentaje de pases acertados m¨¢s bajo que otros pero da pases m¨¢s arriesgados, m¨¢s decisivos.
- Las estad¨ªsticas que la gente conoce son modelos m¨¢s sencillos. Nosotros hemos desarrollado un ¨ªndice de asistencias esperadas, un ¨ªndice sobre la peligrosidad de sus pases y cuando y d¨®nde los hace. Eso hay que tenerlo en cuenta a la hora de valorar al jugador. Hay cosas m¨¢s dif¨ªciles de medir y que hay que valorar como el juego sin bal¨®n, pero claro, eso es subjetivo. Que un jugador se desmarque bien o mal es muy dif¨ªcil de cuantificar. No podemos valorar el medio pero si el fin. Nosotros valoramos el pase con un ¨ªndice entre 0 y 1, siendo 0 un pase de seguridad y 1 un pase que genera una ocasi¨®n clara. Seg¨²n estos par¨¢metros, ?zil, obviamente, est¨¢ entre los mejores del mundo.
- ?Este modelo puede ser m¨¢s beneficioso para equipos de mitad de tabla que para los grandes?
- S¨ª, puede ser m¨¢s beneficioso para equipos que no sean Madrid y Bar?a. Pero hay que tener en cuenta que el Madrid y el Bar?a fichan m¨¢s jugadores de lo que parece. El Real Madrid hace varios mercados de invierno fich¨® a unos cuantos jugadores como Odegaard o Lucas Silva. Luego, en verano, ficharon otros tantos. Claro, hay que tener en cuenta, que un Cristiano s¨®lo se ficha cada 10 a?os y para traerle no hace falta ni Big Data ni nada, todos sabemos que es bueno. Creo que hay una utilidad para los grandes clubes y s¨ª, puede ser menor que para clubes de mitad de tabla o de Segunda pero claro, hay que tener en cuenta que se mueven en un mercado m¨¢s reducido... y a¨²n as¨ª, no siempre aciertan. No te digo que con el 'Big Data' acertasen siempre pero se equivocar¨ªan menos. Luego, entra el factor psicol¨®gico, que eso ya no lo trabajamos nosotros.
- Hablamos mucho de fichajes pero, ?c¨®mo puede ayudar el Big Data a preparar un partido?
- Hay ciertos patrones de juego que son muy claros y te pueden decir como se mueve un equipo, en que minutos hace ciertas cosas, que calidad de ocasiones consigue crear. Servir¨ªa tanto para analizar al rival como a su propio equ?ipo. Ser¨ªa una aplicaci¨®n muy interesante para entrenadores. Aunque ahora la tendencia dentro de los clubes est¨¢ en el uso del Big Data para firmar jugadores que para el an¨¢lisis de juego. Creo esto acabar¨¢ llegando a los entrenadores poco a poco.
- ?Hace el Big Data m¨¢s previsible el f¨²tbol?
Por una parte s¨ª, pero obviamente queda 'magia' dentro de los jugadores. El otro d¨ªa lo hablaba con un jugador de f¨²tbol, esto reduce la incertidumbre y eso que gana el equipo que lo haga. Tambi¨¦n hay gente que esto no quiere ni verlo, ?eh? Hay gente del f¨²tbol que vive m¨¢s de sensaciones y esto es como "?Qu¨¦ me est¨¢s contando?" (r¨ªe). Pienso que los entrenadores j¨®venes pueden sacar aqu¨ª una ventaja sobre la Vieja Escuela.
- ?Les pon¨¦is nota a los jugadores?
S¨ª, es nuestro sistema de evaluaci¨®n. No te puedo desvelar "los secretos del mago" pero hay ciertos par¨¢metros para encajar esta nota tambi¨¦n por donde est¨¢n compitiendo. Damos una puntuaci¨®n objetiva a los equipos y seg¨²n esta se te valora. No ajustamos el nivel del jugador, tal cual, a la Liga en la que juega pero si ponemos al jugador en su contexto. Al final, el jugador no tiene culpa de jugar donde juega.
- ?C¨®mo se valora de cara al director deportivo?
- El primer filtro que hacemos es el an¨¢lisis de los jugadores, el segundo, c¨®mo juega el equ?ipo en el que juega. Nosotros contamos con par¨¢metros de estos respecto a verticalidad, altura de la presi¨®n, etc. Si el equipo que busca este jugador es muy vertical y presiona muy arriba y encontramos un tipo que juega en Suecia en un equipo que presiona muy arriba y juega muy vertical, aunque el nivel de la liga sea distinto, el estilo de juego es similar lo que facilitar la adaptaci¨®n deportiva. El problema viene cuando juega en un sitio totalmente ajeno, m¨¢s all¨¢ del nivel de la competici¨®n. Luego, si tienen una edad joven, se pueden adaptar f¨¢cilmente pero si vienen del f¨²tbol sudamericano, que generalmente es m¨¢s lento, si podr¨ªa suponer un problema.
- ?Cu¨¢ntos clubes ahora mismo aplican esto en Espa?a?
- Entre Primera y Segunda, sumando los que ya lo aplican y los que lo van a aplicar esta temporada que viene, cinco de 42. Sigue mandando m¨¢s el modelo tradicional de sensaciones, sin duda. Hay que pensar en positivo, que hace tres a?os eran cero clubes.
- ?Encuentras reticencias ante este modelo?
- Si, est¨¢ claro. Hay dos tipos de personas, en el f¨²tbol y en la vida, los que est¨¢n en la cola a las 6 de la ma?ana cuando sale alg¨²n cacharro nuevo, que no saben ni que van a comprar pero piensan que es bueno y se adaptan y luego otros, que piensan que es una tonter¨ªa. Luego, hay un grueso de la poblaci¨®n que esperan que el que ha ido a comprar esto a las dos de la ma?ana les diga que es bueno para ir a comprarlo. Con el f¨²tbol es igual, hay unos que se lanzan a por las novedades y se adaptan r¨¢pido, otros, que no est¨¢n en contra de esto pero esperan a ver casos de ¨¦xito antes de adaptarlo y otros a los que les costar¨¢ si es que lo hacen. Respecto a los ojeadores, hace unos d¨ªas hablaba con uno de un club muy grande que tendr¨¢ m¨¢s de 60 a?os. ?l me dec¨ªa: "Yo no tengo ni idea de qu¨¦ me est¨¢s contando pero me parece interesante y creo que esto es el futuro". Esta creo que es la mentalidad correcta, la de intentar adaptarse a las cosas nuevas. Pienso que el crecimiento de esto ser¨¢ exponencial, ahora cinco, en unos a?os, diez y as¨ª.
- Siempre influye. Yo no soy un radical del Big Data, ni de nada en general. Es un sistema m¨¢s de evaluaci¨®n de jugadores. Yo pienso que hay tres partes a la hora de fichar a un jugador: la parte deportiva, la parte psicol¨®gica y la parte contractual. Respecto a la parte deportiva, creo en un modelo mixto. Nunca fichar¨ªa a un jugador sin verle pero tampoco sin ver que n¨²meros tiene. Tirar por un solo lado es un error. Hay mucha informaci¨®n en los n¨²meros, que si sabes que est¨¢ y no la usas, me parece una negligencia y tambi¨¦n creo que hay que ver a los jugadores en el campo, como act¨²an, su car¨¢cter. T¨² no buscas al mejor jugador del mundo, si no al que mejor encaja en tu equipo y creo que la mejor manera de llegar ah¨ª es este modelo mixto.
- Esto me recuerda bastante a los videojuegos, respecto a que si sumas a jugadores con m¨¢s valoraci¨®n tienes mejor equipo.
- Creo que s¨ª. Por ejemplo, el caso de Theo. El Alav¨¦s tiene que reemplazar a Theo pero no puede fichar a otro Theo como tal. El Alav¨¦s puede hacer dos cosas, apostar por un chaval joven y que te salga otro Theo o intentar reemplazar a Theo en el agregado. Si fichan a un centrocampista mejor, el lateral tendr¨¢ que trabajar menos...
- Aunque no sea matem¨¢tica exacta
- Est¨¢ claro, pero creo que es a donde derivar¨¢ el f¨²tbol. Especialmente, no los clubes como el Madrid, que fichan m¨¢s nombres que estructura de juego. El Madrid ganar¨¢ m¨¢s partidos jugando mejor o peor porque tiene individualidades muy buenas. Esto pasar¨¢ m¨¢s en el Betis, como ejemplo. El Betis tiene una lateral muy bueno como es Durmisi. Si ahora viniese alguien a llevarse a Durmisi, intentar¨ªa crear una estructura para intentar suplir su baja con el total de jugadores.
- ?Este sistema puede traer al f¨²tbol el conocido en la NBA como 'robo del draft'?
- Creo que depender¨¢ de la personalidad de cada director deportivo. Hay dirigentes como Monchi, que si usan datos y luego adem¨¢s tienen buen ojo. Me consta que a Vitolo se lo ofrecieron a muchos equipos y nadie le quer¨ªa, pero fue Monchi el que dio el paso y se lo llev¨® a Sevilla. Bueno, esto que me expones, ser¨ªa lo mismo pero usando otro sistema y esto depender¨¢ del que tome la decisi¨®n. Si conocen al jugador creo que se arriesgar¨¢n. Mira, como el caso del Levante. Personalmente, no s¨¦ como trabajan pero, si hacen las cosas est¨¢ndar ser¨¢n un candidato al descenso cuando su objetivo es permanecer y asentarse en Primera. Al final, si quieres resultados distintos, tendr¨¢s que hacer cosas distintas y estos clubes acabar¨¢n apostando por esto.
- ?Cu¨¢nto ten¨¦is en com¨²n con el 'Modelo Monchi'?
- Ellos tienen otro sistema. Hacen onces ideales de cada liga que siguen y de ah¨ª, eligen. Ellos clasifican las Ligas en A,B,C. Por ejemplo, la Premier para ellos no es una Liga A porque est¨¢n fuera de su mercado pero si Francia o B¨¦lgica de donde han sacado varios jugadores. Nosotros tambi¨¦n tenemos onces ideales pero nos basamos m¨¢s en la puntuaci¨®n individual de cada jugador, que por cierto, castiga bastante. El otro d¨ªa mirando la base de datos me di cuenta de que Messi ten¨ªa un siete sobre diez y es el m¨¢s alto de mi base de datos. Nosotros buscamos una puntuaci¨®n en un sitio determinado, por ejemplo, un jugador de 6 en Rusia. Ese es nuestro modelo.
- Para el Big Data, ?hay debate Messi-Cristiano?
Por datos, Messi es el mejor, no hay duda. Y adem¨¢s te digo que tampoco necesitas de este sistema para saberlo (risas).
- Por curiosidad, ?hay alguna sorpresa en vuestro once ideal por notas que no saldr¨ªa en los habituales?
S¨ª, mira. Nuestro once ideal de la Liga tendr¨ªa a Kovacic o Pacheco del Alav¨¦s. El once entero ser¨ªa Pacheco en porter¨ªa. En defensa, Carvajal, Ramos, Piqu¨¦ y Filipe. Ves, aqu¨ª pocas sorpresas. En el centro, Illarra, Kroos, Kovacic y Soriano y arriba, Messi y Luis Su¨¢rez. En el segundo mejor once, Oblak, Yuri, Varane, Bigas, Sergi Roberto, Llorente, Modric, Be?at, Busquets y arriba, Neymar y Cristiano. Hay algunos que sorprenden m¨¢s y otros menos.
- ?El Zamora, para vosotros, no es el portero en el once ideal de la Liga?
- Nada. El Zamora solo mide los goles recibidos pero no cuanto te tiran, que ocasiones te hacen...
- Creo que encajar¨ªa dif¨ªcilmente con el que har¨ªamos nosotros, ?eh?
- Creo que s¨ª. En el de la Premier, por ejemplo, nos criticaron porque solo ten¨ªamos a un jugador del Chelsea y a bastantes del United. Por ejemplo, tiene mucho que ver que el United ten¨ªa cuatro o cinco individualidades muy buenas. Pogba ha sido muy criticado pero, su rendimiento ha sido muy bueno. Creo que es m¨¢s por el precio que ha costado que por otra cosa.
- Con Pogba entonces volvemos al tema de las sensaciones, a lo que transmite sobre el campo y a la nota que os sale a vosotros.
- S¨ª, pero se puede ajustar. Es decir, sacar un rendimiento medio quitando a los dos mejores equipos de la Liga y a los dos peores, como en salto de trampol¨ªn. Al final, aunque la sensaci¨®n es de que ha hecho una temporada irregular, los datos salen muy parecidos y son buenos.?
- Con el Big Data, ?podemos llegar a preveer el rendimiento de futbolistas? Se me ocurre el caso de Dani Alves, que nadie se esperaba que volviese al nivel que ha mostrado este a?o...
- Es complicado medir estas mejoras o empeoramientos en el rendimiento antes de que pase, ya que depende de otras variables como el cambio de domicilio, por ejemplo. Lo que si podemos medir es que lo que han jugado y como han jugado, no lo podemos tener de antemano, pero a partir de la cuarta jornada si pod¨ªamos intuir que este jugador podr¨ªa hacer una buena temporada.
- Ya que compartes muchas horas con directores deportivos, ?te atrever¨ªas a ponerte en su lugar?
- En el Madrid, intentar¨ªa firmar un portero porque en Keylor se ha notado una regresi¨®n de esta temporada a la anterior y firmar¨ªa un central. Ya que me pides nombres, a Rugani, de la Juventus. Un nombre fuera de la quiniela. Tiene 22 a?os, con proyecci¨®n... Ese perfil, otro Varane. Portero, no te voy a decir nombres porque ya sabemos a qui¨¦n van a firmar pero mira, me gusta Lafont, un chaval joven del Toulouse.
- ?Y en la plantilla del Bar?a?
Aqu¨ª habr¨ªa m¨¢s trabajo. No querr¨ªa ni un central ni un portero, si no un lateral que le hiciera la competencia a Jordi Alba o quiz¨¢ otro del lado contrario, ah¨ª no lo tengo muy claro. Seguro, firmar¨ªa a otro centrocampista. Me llevar¨ªa a Thiago, aunque est¨¢ caro. Intentar¨ªa encontrar a uno de su perfil. Mira, o Allan del N¨¢poles, que ayudase a Busquets. Iniesta necesitar¨ªa descansar m¨¢s para tener sus mejores 2000 minutos en los partidos m¨¢s importantes de la temporada. Lo de Arda no ha salido bien y Andr¨¦ Gomes ha sido muy caro, creo que tiene un estigma ah¨ª. De arriba, no tocaba nada de nada, est¨¢ claro.