ESPN.com 11y

Vamos a detener el caballo del WAR

Me vi tentado a comenzar esta columna con las líricas casi obligatorias de "War" (Guerra), una canción tema número 1 en 1970. Pero cuando Edwin Starr cantaba que "War" no era servía para nada, estaba grabando una protesta contra la guerra real. Mi protesta, por el contrario, se trata de algo mucho más amplio, amenazante y grave.

Me refiero a la proliferación del WAR: Victorias por Encima del Reemplazo.

¡Espera! Yo no soy otro escritor viejo cascarrabias de deportes que despotrica reflexivamente contra los últimos avances técnicos. Bueno, sí, soy un periodista viejo cascarrabias de deportes que habitualmente escribe diatribas acerca de las nuevas tecnologías -- de hecho, mis amigos me bromean diciéndome que yo me hubiera quejado hasta de la invención de las bombillas eléctricas ("Por el amor de Dios, ¿cuál es el problema con una simple vela?") -- pero escuchen lo que tengo que decir sobre esta cosa del WAR.

En primer lugar, permítanme enfatizar que hay cosas que me gustan del WAR.

1. A diferencia de la mayoría de las estadísticas veneradas por los cascarrabias (que tienden a ver las carreras impulsadas como la más fiable y masculina de las estadísticas), WAR no sólo reconoce la defensa de un jugador, sino que abarca su defensa como una parte vital de su actuación. Otras estadísticas se centran en la ofensiva, WAR coloca las estadísticas defensivas en una posición clave del cálculo.

2. WAR también es una herramienta muy valiosa para realizar comparaciones generales de jugadores a través de diferentes épocas del deporte, particularmente con grupos de jugadores. El colega Dave Schoenfield recientemente escribió un excelente análisis sobre el valor de selecciones bajas de primera ronda del sorteo y no hubiera podido hacerlo ni remotamente tan bien sin utilizar la métrica del WAR.

3. WAR puede ser una estadística divertida, como cuando se le suman los registros de WAR a jugadores individuales en la lista de entrenamiento de primavera de un equipo y se mide si los Piratas tienen alguna oportunidad de ganar esta temporada.

Así que, afirmativo, me gusta WAR como medida estadística.

Mi problema es este: No me gusta el incremento sobresaturado de la aplicación (y total exceso de confianza) del WAR como LA evaluación definitiva del valor de un jugador.

Esto fue particularmente diferente durante el debate sobre el premio de Jugador Más Valioso entre Mike Trout/Miguel Cabrera en octubre. Por ejemplo, considere este titular en una historia de ESPNLosAngeles.com en septiembre: "Mike Trout es tu Jugador Más Valioso (lo dice WAR)".

Esa es apenas una de muchas historias concentradas en WAR durante la carrera por el Jugador Más Valioso, donde la estadística se convierte en un gran factor del análisis de los jugadores, como destacó el Bleacher Report.

Ahora, Cabrera terminó con el premio de Jugador Más Valioso por amplio margen, así que WAR no fue un factor decisivo en la votación para el premio. (Yo voté por Trout, aunque no basé mi votación en WAR.) Pero encuentro tedioso seguir leyendo todas las referencias a ello, como si WAR fuera la única estadística que debe ser considerada, y el liderazgo de bateo, de jonrones y carreras impulsadas de la liga -- como consiguiera Cabrera para convertirse en el primer ganador de la Triple Corona del deporte desde 1967 -- eran apenas meras notas al calce para tomar en cuenta.

Lo vimos otra vez en los recientes debates sobre el Salón de la Fama, donde hubo más menciones sobre el récord de WAR de los candidatos que lo que encontrarías en una campaña presidencial. Cómo pudo esto haber afectado el caso de Jack Morris es una de las razones por la cual el exceso de confianza en WAR me vuelve un poco loco.

¿Qué hay de malo con WAR?

1.Casi nadie sabe cómo calcular WAR. No estoy hablando sólo de los cascarrabias que tienen problemas para estimar el promedio de bateo con una calculadora (¡oh, los días gloriosos del Ready Reckoner!). Los aficionados que realmente conocen sus estadísticas y su béisbol (así como que están lo suficientemente claros para trabajar con esos nuevos controles remotos "universales" del televisor) no pueden calcularlo. Solamente en la página explicativa de WAR de baseball-reference.com se le dedican más de 1,500 palabras, incluidos varios párrafos explicando cómo ha cambiado la fórmula (pero sin incluir la lista de jugadores que fueron ayudados o afectados por la mayoría de esos cambios).

Si no podemos calcular una estadística por nosotros mismos, entonces ¿cómo podemos verificar si es acertada o no?

2. De hecho, nosotros sabemos que no siempre es acertada porque en dependencia de tu fuente -- FanGraphs o Baseball-reference.com -- puedes obtener puntuaciones de WAR ampliamente diferentes. (Para el récord, ESPN.com utiliza baseball-reference para sus números de WAR). Por ejemplo:

¿Pertenece Morris al Salón de la Fama? No, no pertenece, de acuerdo a baseball-reference.com, que le otorga 39.3 de WAR, empatado en el puesto 145 de la lista de lanzadores de todos los tiempos. Quizás sí pertenece, de acuerdo a FanGraphs, que la otorga un 56.9 de WAR, para el puesto 75 de todos los tiempos.

¿Quién se llevó la mejor parte del canje de Justin Upton/Martín Prado la semana pasada? ¿Atlanta o Arizona? Otra vez, tu análisis depende de tu fuente. Baseball-reference ubica el WAR de carrera de Upton en 13.1 mientras que FanGraphs lo registra en 17.1. Eso es casi una diferencia de una victoria por temporada, lo cual es significativo en términos de WAR. El WAR de Prado es de 15.8 en ambas herramientas y el año pasado fue tan alto como 5.4, según baseball-reference, lo que podría ser una buena noticia para los aficionados de los Diamondbacks. ¿Pero no están la mayoría de los aficionados y expertos halagando a Atlanta por desplumar a Arizona en el cambio?

¿A quién hubieras preferido como tu campocorto el año pasado -- Derek Jeter (el titular del Juego de Estrellas y futuro miembro del Salón de la Fama) o al jugador de los Marineros Brendan Ryan (quien bateó .194 con .555 de OPS)? Esta es una pregunta capciosa, sí. Porque aunque cualquier aficionado en su sano juicio escogería a Jeter (aun con su tobillo inmovilizado) sobre Ryan, baseball-reference le dio a Ryan un WAR de 3.3 la pasada temporada y el WAR de Jeter fue de 2.1, probablemente porque Ryan es mejor capturando pelotas. FanGraphs exhibe exactamente lo contrario: Jeter con 3.2 y Ryan con 1.7.

Y en caso de que pienses que FanGraphs debe presentar un WAR más seguro, considera que Ricky Nolasco tuvo foja de 13-9 con efectividad de 5.06 en el 2009 mientras que sólo lanzó 185 entradas, pero FanGraphs le dio un WAR de 4.3 por esa temporada.

Sí, ya sé que esos son valores atípicos, y que la mayoría de las puntuaciones de WAR entre los dos sitios están mucho más cercanas (como en el caso de los números de Prado). Pero la existencia misma de tales anomalías pone en tela de juicio la precisión general de WAR. Si el promedio de bateo de un jugador varía de .245 a .307 entre ambas listas de clasificaciones, ¿confiaría usted en cualquiera de las dos estadísticas?

3. ¿Qué da lugar a tales diferencias? El factor principal es la manera en que ambas herramientas miden la defensa (lo cual me lleva de vuelta a la Queja 1). Las métricas defensivas utilizadas por baseball-reference (Baseball Info Solutions Carreras Salvadas en Defensa) parecen reducir o elevar sus registros de WAR mucho más que las estadísticas defensivas utilizadas por FanGraphs (Ultimate Zone Rating). Y eso presenta otro problema con WAR.

Promedio de bateo, efectividad, OPS, etc., son el resultado de cálculos matemáticos tan simples y certeros que incluso yo puedo resolverlos armado sólo de lápiz y papel. WAR, sin embargo, es parcialmente un producto de métricas de fildeo que bajo ningún concepto significa certeza.

Si un jugador tiene un promedio de bateo de .333, sabemos que tiene un hit cada tres turnos al bate. Es un hecho estadístico. Pero si decimos que un campocorto tiene una calificación de 12.4 de Ultimate Zone Rating, bueno, eso significa que es probable que sea un jardinero muy bueno, pero también tenemos que asumir que la teoría detrás de UZR es de hecho una medida exacta de la capacidad de fildeo. Puede ser que sea así (más aún con jugadores de cuadro), pero desde luego no es preciso ni indiscutible.

En otras palabras, la mayoría de las estadísticas de béisbol se basan totalmente en cálculos matemáticos indiscutibles. WAR tiene un elemento teórico y exige confianza en él.

Como escribí al principio, WAR puede ser una medida valiosa. El problema es cuando se utiliza como la medida definitiva. Tales como, "Mike Trout tuvo un WAR de 10.7 y Miguel Cabrera tuvo un WAR 6.9, por lo que cualquiera que piense que Cabrera se merecía ser el premio de Jugador Más Valioso de la Liga Americana debe ser registrado al desnudo, atado a un hormiguero y obligado a depender de un teléfono de discado para su conexión a Internet durante el resto de su vida patética".

Mira todas las estadísticas tienen sus limitaciones. Si un jugador tiene un promedio de bateo de .329, eso probablemente significa que es bastante bueno. Sin embargo, para una medida precisa del jugador, necesitamos más información. ¿Cuántos hits extrabases tiene? ¿Cuántas veces toma bases por bolas? ¿Cuántas bases robadas? ¿Cuántas carreras, cuántas impulsadas? ¿Cuántas veces bateó para doble matanza? Lo mismo es cierto para un jugador con 40 jonrones. ¿Tiene un promedio de .300 que los acompaña o un promedio de .230? ¿Batea mucho? ¿Con qué frecuencia toma bases por bolas?

El mismo criterio debería aplicarse a WAR. Tenemos que mirar muchas estadísticas para evaluar a los jugadores, y una de ellas debe ser WAR. Pero no debería ser la única estadística que miremos o citemos.

^ Al Inicio ^