
El béisbol es un deporte con una larga y rica historia en la recopilación de datos relacionados con el desempeño de los equipos, así como, de los jugadores que han competido en él profesionalmente por más de 100 años. Es más, el Béisbol de Grande Ligas (MLB, por sus siglas en inglés), a nivel mundial, debe ser el deporte profesional con la base de datos más extensa en lo concerniente a las métricas estadísticas que se utilizan y recopilan en sus partidos.
En los Estados Unidos de América, el béisbol es denominado como “el pasatiempo nacional” por su arraigo en la sociedad americana y su extensa historia que data de mediados del siglo XIX. Incluso la Guerra Civil Americana entre el 1861 y 1865 sirvió de escenario para su práctica y a la vez ayudó a su diseminación a través del país. Existe una litografía del artista Otto Botticher que muestra un juego de béisbol en la prisión confederada de Salisbury en Carolina del Norte ocurrido en el verano del 1862. Los prisioneros de la unión utilizaban el juego de béisbol como pasatiempo diario y en ocasiones los guardias de la prisión participaban con ellos. [1]
Por ejemplo, el sitio Web Baseball Reference tiene disponibles datos estadísticos de jugadores y equipos que han competido en ese deporte desde la temporada del año 1871. El primer juego de esa temporada se celebró el 4 de mayo entre los equipos Cleveland Forest Citys y Fort Wayne Kekiongas. Sin embargo, como ese partido se celebró bajo la llamada National Association todavía está en disputa si esos dos equipos y la liga en sí pueden ser considerados como las Grandes Ligas. [2]
Ahora bien, la Liga Nacional (considerada como las Grandes Ligas) celebró su primera temporada oficial en el año 1876. El campeón fue el equipo Chicago White Stockings con récord de 52 victorias y 14 derrotas, anotó 624 carreras y permitió 257 carreras. Al Spalding el dueño del equipo y empresario de artículos deportivos para el juego compitió como dirigente y lanzador, logró 47 victorias y 12 derrotas durante esa temporada. [3]
No obstante, treinta años antes, en el 1846 (un año después de haber sido fundado el equipo Knickerbocker Baseball Club en la ciudad de Nueva York), se celebró el primer partido oficial de béisbol contra un equipo de jugadores de cricket. Uno de sus jugadores, Alexander Joy Cartwright, estableció varias de las reglas que todavía configuran el fundamento del juego. Por ejemplo, la forma de diamante del campo interior (“infield”), las líneas del “foul” y la regla del “out” con tres “strikes”.[4] En otras palabras, el béisbol, como un deporte organizado, lleva tres siglos de competencia y recopilación de datos referentes a los equipos y el desempeño de sus jugadores.
En Puerto Rico, según el escritor e historiador del béisbol profesional Jorge Colón Delgado, este deporte se comenzó a practicar en nuestro país allá para el 1896. El autor nos relata que fueron Amos Iglesias Van Pelt (un nuyorican que llegó a Puerto Rico en el 1895) y el cubano Braulio Sánchez (capitán general del ejército español), quienes organizaron dos equipos de béisbol uno llamado Borinquen y el otro Almendares. El primer partido oficial entre ellos se celebró el domingo 9 de enero de 1898 del velódromo de la parada 15 de Santurce. [5]
A principio del siglo pasado debido, en gran medida, al dominio estadunidense del país se proliferó la práctica del béisbol. En el 1938 se fundó nuestra Liga de Béisbol Profesional. Por lo cual, este deporte ha sido practicado en Puerto Rico por más de 120 años. Esa extensa historia social y deportiva ha producidos una pléyade de excelentes peloteros que se han destacado tanto en nuestra liga profesional como en las Grandes Ligas. El 15 de abril de 1942, Hiram Bithorn fue el primer puertorriqueño en participar en un juego oficial del MLB con los Chicago Cubs, en el cual lanzó dos entradas sin permitir carreras. [6] Por esa gesta el estadio de béisbol más importante en nuestro país lleva su nombre desde su inauguración en 1963.
En fin, dada la destacada participación de los puertorriqueños en el MLB y el caudal de datos disponible, estudiaremos el desempeño de los principales peloteros retirados de Puerto Rico en varias de las estadísticas ofensivas más conocidas en el béisbol.

El MLB, gracias a su extensa historia y al uso ingente de diferentes estadísticas (datos), se ha nutrido con una extensa base de información sobre el desempeño de los equipos y los jugadores que han visto acción en esa liga profesional. Los récords de los peloteros que han participado desde el siglo XIX al presente están disponibles a través de distintos sitios web en la Internet. Consideramos los más completos a los dos siguientes.
Dichos websites permiten al usuario, según su interés, escudriñar directamente o bajar los datos históricos de cada pelotero por temporada y de forma acumulada.
Ahora bien, para delimitar y guiar nuestro análisis, solamente, consideraremos los peloteros ofensivos puertorriqueños más destacados en el MLB desde los años 40 del siglo pasado (recuerde que nuestro primer pelotero que participó en MLB lo hizo en el 1942 y era pitcher). Los peloteros retirados escogidos en primera instancia fueron aquellos que han sido elegidos al Salón de la Fama del Béisbol, que son: Roberto Clemente, Orlando Cepeda, Iván Rodríguez, Roberto Alomar y Edgar Martínez.
Luego, para completar nuestra lista con cinco peloteros adicionales recurrimos a la base de datos del sitio Web fangraphs donde recuperamos estadísticas ofensivas de 4,048 jugadores de diferentes nacionalidades que han participado en por lo menos 206 partidos de Grandes Ligas en más de 120 años de historia. Entonces, identificamos 590 jugadores que han participado en más de 1,600 partidos, entre los cuales había 19 peloteros puertorriqueños (incluyendo los cinco peloteros miembros del Salón de la Fama). Para un análisis de selección adicional consideramos los 13 peloteros que están retirados, no fue considerado Yadier Molina pues aún no se ha retirado del MLB.
Finalmente, para incluir otros cinco peloteros puertorriqueños en nuestro análisis, utilizamos el criterio de haber alcanzado al menos un total de 2,000 carreras producidas en sus años de acción en el MLB. Las carreras producidas (CP) es una métrica de reciente cuño en el béisbol, desarrollada en los años 70 del siglo pasado, que busca medir habilidad de un bateador para producir carreras para su equipo. Más adelante explicaremos cómo se calcula, pero por ahora no confunda esta métrica con las carreras impulsadas. [7] Con más de 2,000 CP, entre los trece peloteros retirados, identificamos los cinco siguientes: Bernie Williams, Carlos Delgado, Carlos Beltrán, Juan González y Rubén Sierra.

El uso de cálculos estadísticos como medidas del desempeño en los partidos del béisbol han sido parte esencial del juego desde sus primeros pasos como deporte organizado. El periodista deportivo de “Cricket” del New York Times, Henry Chadwick, es conocido como el “padre del béisbol” pues, a mediados de los años 1850, utilizó su amplio conocimiento en el juego inglés para desarrollar las primeras medidas estadísticas del béisbol. Se le atribuye la primera edición de la guía del béisbol que se vendió al público general. También, publicó el primer “box score” de un juego de béisbol en el 1859 (basado en el “scorecard” del cricket) y creó la abreviatura “K” para designar un ponche. Además, las estadísticas promedio ofensivo de bateo (AVG) y el promedio de carreras permitidas de un lanzador por nueve entradas (ERA). [8, 9]
El legendario Branch Rickey revolucionó la organización de los equipos y de las grandes ligas en la década del 1930 al establecer el sistema de equipos finca para los Cardenales de San Luis. Más tarde en el 1947, como Gerente General del equipo Brooklyn Dodgers, firmó al primer jugador negro en el MLB Jackie Robinson y, en ese mismo año, contrató a Allan Roth como analista estadístico del equipo. Roth comenzó a contabilizar cada lanzamiento que se realizaba en los juegos y convenció a Rickey que el uso de las estadísticas situacionales (equipo local/visitante; lanzador derecho/zurdo; juego día/noche, entre otras) podían ayudar a ganar los juegos. Con el uso de estrategias basadas en ese tipo de análisis llevó el juego de béisbol a otro nivel analítico. Otra aportación de estos dos actores a las estadísticas del béisbol se coaguló en el 1984 cuando la métrica “on-base percentage (OBP)” se convirtió en una estadística oficial del MLB. La misma había sido desarrollada por Rickey y Roth en la década del 1950 para medir el por ciento de veces que un jugador alcanza cualquier base por apariciones al bate.[10]
Por otro lado, durante los años del 1950, Pete Palmer, en su tiempo libre, emprendió la recopilación de datos de diferentes fuentes y desarrolló la primera base de datos del béisbol. La misma consistía en el desempeño por temporada y el total acumulado de los peloteros que habían participado en el MLB. Fue uno de los primeros en profundizar en el análisis situacional al demostrar que el contexto en el que se da el desempeño de cada jugador era crucial para comprender su verdadero impacto en términos de ganar o perder un juego. En el 1978 Palmer, junto a Dick Cramer, inventó la métrica “on-base plus slugging (OPS)”que es aceptada como una medida universal de bateo. La misma mide la habilidad del bateador de llegar a base y batear con poder.[11]
En agosto el 1971 se reúnen, en el Salón de la Fama del Béisbol, 16 investigadores de los datos del juego y forman la “Society for American Baseball Research (SABR)”. El término “sabermetric” se refiere al análisis empírico de las estadísticas del béisbol y fue acuñado por el estudioso del juego Bill James. El término se deriva del acrónimo SABR y las métricas del deporte. James en el 1980 James definió “sabermetrics” como “la búsqueda del conocimiento objetivo del béisbol”. [12, 13]
El uso de modelos estadísticos y econométricos para el análisis del desempeño de los peloteros y los equipos ha crecido exponencialmente desde inicios de este siglo. La presencia de un equipo de analistas de datos en las oficinas gerenciales de los equipos de MLB compuestos por matemáticos, estadísticos científicos de computadora y economistas es parte esencial de sus operaciones. Por eso los procesos de negociación de contrato entre equipos del MLB y los peloteros son aquilatados a través de modelos matemáticos sofisticados basados en la analítica de datos.
Desde la publicación en el 2003 del famoso libro Moneyball escrito por Michael Lewis, del que se han vendido más de un millón de copias, la publicación de textos que tratan la dimensión cuantitativa del juego es abrumadora. Lewis expone cómo el uso creativo del análisis estadístico por parte del equipo Oakland Athletics en un mercado ineficiente. El MLB, al inicio de este siglo, los equipos fallaban en utilizar efectivamente la información disponible del juego con la cual se podía prevalecer ante la inequidad económica que facilitaba a los equipos poderosos adquirir los jugadores estelares.
Ahora, además del Sabermetric, en el béisbol también se habla del Baseball Analytics que se entiende como el uso de métodos estadísticos sofisticados para evaluar el desempeño de los jugadores y las estrategias en los juegos. Sin embargo, la analítica no se queda ahí y añade la dimensión de la inteligencia de negocios en la toma de decisiones. En los últimos años, la analítica ha incorporado el análisis videos con modelos digitales que describen y desentrañan la física que está detrás de las jugadas que ocurren en los partidos.
Está claro que el análisis estadístico del juego ha estado presente desde sus inicios y es parte esencial de las estrategias que se llevan a cabo en el mismo tanto en el terreno de juego como fuera de este, lo que ha evolucionado es el nivel de sofisticación que ha alcanzado.
Una cronología valiosa, y muy bien resumida, del uso de los números y las estadísticas en el MLB fue publicada, en la página web de deportes ESPN, por Alan Schwarz en el artículo “A numbers revolution”. Como plantea directamente el autor, su propósito es mostrar a los fanáticos del béisbol la relevancia de las estadísticas en el juego por más de cien años. [14]

Las gráficas que presentaremos para comparar el desempeño de los peloteros se basan en la teoría del “aging curve in baseball” (curva de envejecimiento en el béisbol). En término sencillos y de forma sucinta, la curva de envejecimiento asume que la productividad ofensiva de un pelotero, en términos de su incremento, pico y descenso, está en relacionada con la edad cumplida. Es obvio que un atleta puede correr más rápido a los 25 años que a los 35, que su coordinación física y visual disminuye con el tiempo y que con los años está más expuesto a las lesiones. Lo antes dicho no aplica por igual a todos los peloteros, pues la experiencia y el conocimiento adquirido con los años asume un peso importante en el desempeño del jugador. Sin embargo, en términos generales, sí existe una tendencia que, con el paso de los años, la producción ofensiva de los peloteros luego de alcanzar un pico empieza a disminuir hasta su retiro. [15]
Bill James en un estudio de los 50 peloteros que ganaron el premio del jugador más valioso entre el 1985 y 2009 encontró que el 60 por ciento de ellos, cuando obtuvieron ese galardón, tenían entre 25 y 29 años y que el 20% tenían exactamente 27 años. Recientemente James (2017) publicó un artículo titulado “Aging Patterns”, donde expuso varios puntos interesantes respecto a la relación entre la edad y distintas estadísticas relacionadas con la producción ofensiva. [16] Los estudiosos estiman que entre los 23 y 32 años los peloteros han mostrado su mejor producción y establecen 27 años como la edad del “peak” en su desempeño ofensivo. [17, 18] En el 2009 Bradbury publicó, en el Journal of Sports Sciences, un artículo donde planteó que la edad pico en la producción de un pelotero era 29 años a diferencia de James que estimó 27 años como la edad pico. [19]
Antes que ellos, Schulz, Mussa, Staszewski y Siegler (1994) encontraron una relación entre la edad y el desempeño de los peloteros. Los autores establecieron que el pico ofensivo ocurría entre los 27 y 30 años en las estadísticas estándares del béisbol como el promedio de bateo y el promedio de carreras permitidas por un lanzador. En el caso de los jugadores ofensivos elite detectaron que tenían un periodo de tiempo más prolongado en el pico y experimentaron una disminución más lenta en su desempeño. [20]
De manera sencilla podemos visualizar la gráfica de la curva de envejecimiento como una U invertida, esto es, de la forma siguiente ∩ o como una J invertida con la forma ᘃ.

El análisis gráfico consiste en comparar la producción ofensiva por edad de nuestros peloteros con la del pelotero que históricamente ha acumulado los mejores números en la métrica estudiada. En las gráficas se compararán las estadísticas ofensivas tradicionales siguientes: promedio de bateo (AVG), cuadrangulares (HR) y carreras impulsadas (RBI).
Utilizamos las estadísticas tradicionales (AVG, HR, RBI) y no las desarrolladas por los trabajos de sabermetrics, ─ por ejemplo, On-base plus slugging (OPS) que es la suma de on-base percentage (OBP) y slugging percentage (SLG) ─, pues son las más conocidas por los fanáticos del juego y de uso diario en la prensa. Por otro lado, la fórmula del cálculo de la métrica avanzada WAR (Wins Above Replacement), que intenta medir la contribución total de un jugador a su equipo a base del número de victorias adicionales que su equipo ha logrado por encima del número de victorias esperadas del equipo si ese jugador fuera sustituido por un jugador de reemplazo de la misma posición, difiere levemente entre los sitios Baseball-Reference, Fangraph y Baseball Prospectus.
Al análisis gráfico de esas tres estadísticas, altamente conocidas por los fanáticos del béisbol, le agregamos las carreras producidas (CP), la cual es una métrica de reciente cuño. La estadística CP fue desarrollada en los años 70 del siglo pasado. La misma busca medir habilidad de un bateador para producir carreras para su equipo. Las carreras producidas se calculan sumando las carreras anotadas y carreras impulsadas, a ese total se le restan los cuadrangulares conectados para evitar el doble conteo. Tenga en cuenta que cuando un pelotero conecta un cuadrangular, en términos estadísticos, le acreditan una carrera impulsada y una carrera anotada.
Los líderes históricos seleccionados, en términos acumulados no por temporada, en cada una de las categorías ofensivas consideradas son los siguientes: Ty Cobb (.366 AVG), Barry Bonds (762 HR), Hank Aaron (2,297 RBI) y Ty Cobb (4,066 CP). La comparación gráfica entre esos líderes históricos y los peloteros puertorriqueños se hará a base de la edad cumplida, la temporada correspondiente y su desempeño en la estadística considerada.

Tomando en consideración lo dicho en la sección sobre la curva de envejecimiento en el béisbol, las gráficas tienen como la variable independiente la edad del pelotero y como variable dependiente su producción ofensiva. En otras palabras, asumimos que la edad afecta el desempeño ofensivo del pelotero o que el desempeño ofensivo es una función de su edad. Basándonos en lo discutido en la sección Curva de Envejecimiento en el Béisbol y para ilustrar con mayor detalle visual el comportamiento esperado por edad de los peloteros las gráficas están divididas en dos intervalos de edad como se establece a continuación.
- El primer intervalo gráfico comienza en la edad que inició el pelotero su carrera en el MLB hasta los 28 años.
- El segundo intervalo parte desde los 29 años hasta la edad de la última temporada que participó como pelotero.
Al definir esos dos intervalos para las gráficas de todos los peloteros, la comparación de la trayectoria ofensiva ocurre para una misma edad, además, de esa forma podemos visualizar la tendencia en la trayectoria del jugador respecto a la curva de envejecimiento del béisbol. Sabemos que los peloteros comienzan a competir y concluyen su participación en el MLB a diferentes edades , por cual, las gráficas de los jugadores diferirán en términos de la edad de inicio y de terminación, pero tendrán muchas de sus temporadas en edades en común. Además, todas las gráficas muestran un Valor Crítico de Referencia (valor que los expertos del juego han considerado históricamente como medida de excelencia ofensiva), el cual se representa por una línea horizontal entrecortada.
Las gráficas globales se subdividen en dos categorías, en la primera se consideran los cinco peloteros exaltados al Salón de la Fama y en la segunda están los cinco peloteros seleccionados por el autor. En ambos casos, encabezando cada gráfica global aparece la gráfica correspondiente al pelotero que históricamente ha tenido el mejor desempeño acumulado en la estadística ofensiva analizada. Además, en cada una de las estadísticas consideradas se incluye una tercera gráfica comparativa en la cual el usuario puede establecer una comparación entre cualesquiera dos peloteros seleccionados por él. Por “default” aparece la comparación entre el pelotero con mejor desempeño histórico y un pelotero puertorriqueño.
El fin de esta estrategia gráfica es llevar a cabo una comparación de la producción ofensiva entre peloteros de diferentes épocas, pero a la misma edad.
Deseamos establecer que toda comparación de la ofensiva de peloteros de épocas diferentes o en periodos similares tiene muchos peros. Por ejemplo, los parques de pelota son muy diferentes entre sí, unos benefician a los bateadores y otros no según su localización geográfica o la configuración de sus verjas. [21] Por otro lado, los parques de las décadas previo a los años 70 del siglo pasado tenían unas dimensiones gigantescas. Las reglas de MLB no limitan el diseño de los parques, pero desde 1958 la Regla 1.04 estableció la distancia mínima desde el “Home Plate” hasta las cercas del “Outfield” (Left Field y Right Field 325 pies y el Center Field 400 pies). [19] Lo único que históricamente no ha cambiado en el campo de juego es el diseño básico del diamante o cuadro interior. Desde su establecimiento en la década de 1840, la distancia entre las bases ha sido de 90 pies y 60 pies del montículo al “Home Plate”. [22]

El promedio de bateo (AVG), es una de las estadísticas ofensivas más antiguas y universales para medir el éxito de un bateador en el béisbol y se declara campeón bate al pelotero que alcanza el promedio más alto en la temporada. El AVG se calcula dividiendo los incogibles (“hits”) logrados de un jugador entre su total de turnos al bate. Sus posibles valores están definidos entre cero (0.000) y uno (1.000). En esta estadística ofensiva se considera como un estándar de éxito un promedio de .300 (coloquialmente decimos que batió para trescientos). Ese promedio de .300 será nuestro valor crítico de referencia en las gráficas comparativas de esta métrica.

El cuadrangular es el batazo con el mayor glamour en el béisbol pues cuando ocurre cambia la atmosfera del partido y de los fanáticos. Además, ha estado en las estadísticas del juego desde sus inicios. Hasta la fecha de publicación de este trabajo en el MLB ha habido 57 peloteros con más de 400 cuadrangulares. Al calcular, entre esos peloteros, el promedio de cuadrangulares por cada 140 juegos encontramos que es igual a 30HR/140juego. Utilizamos 140 partidos pues asumimos que muy pocos peloteros, por diferentes razones, juegan los 162 juegos de una temporada. Por lo cual, el promedio de 30 HR/140juegoso será nuestro valor crítico de referencia en la gráfica correspondiente a esta métrica.
Una trivia respecto a esa medida de cuadrangulares por cada 140 juegos es que el pelotero puertorriqueño Juan “Igor” González ocupa la tercera posición empatado con el dominicano Sammy Sosa y el americano Barry Bonds con 36 HR/140 juegos. Mark McGwire y Babe Ruth ocupan la primera y segunda posiciones con 44 y 40 cuadrangulares por cada 140 juegos respectivamente.

Las carreras impulsadas es una de las estadísticas más conocidas del juego mide el número de peloteros que anotan una carrera debido a que otro jugador conectó un incogible (Hit), una base por bola, un sacrificio o una jugada de selección (“fielder’s choice”). Entre la comunidad de expertos y fanáticos el impulsar 100 carreras en una temporada se considera como un desempeño admirable, por lo cual, ese valor será nuestro valor crítico de referencia. Le mencionamos que el MLB reconoce las carreras impulsadas de forma oficial a partir de 1920.

Como ya mencionamos, las carreras producidas es una estadística que busca medir la habilidad de un bateador para producir carreras para su equipo. Se calcula sumando las carreras anotadas y carreras impulsadas, a ese total se le restan los cuadrangulares conectados para evitar el doble conteo. Recuerden que un cuadrangular se cuenta como una carrera impulsada y una carrera anotada. Para establecer el valor crítico de referencia identificamos en nuestra base de datos los peloteros que han participado en más de 1600 partidos (590 peloteros), luego , para cada uno de ellos, calculamos la razón de carreras producidas por cada 140 juegos y entre ellos calculamos el promedio correspondiente el cual resultó ser igual a 130CP/140juegos.
Otra nota interesante es que el pelotero con la razón mayor de CP/140juegos fue Dan Brouthers quien jugó para varios equipos de la Liga Nacional entre 1879 y 1896 (aunque participó en dos partidos en el 1904). Brouthers logró una razón de 227CP/140juegos por su parte Ty Cobb, quien es el líder en el total de carrearas producidas con 4,066 y el único con más de 4,000 CP ocupa la posición decimoquinta con 188CP/140juegos. [23]

-
Civil War baseball. (2016, January 24). National Museum of American History.
-
MLB scores, standings, box scores for Thursday, May 04, 1871. (n.d.). Baseball-Reference.com.
-
1876 Chicago white stockings statistics. (n.d.). Baseball-Reference.com.
-
Historia del béisbol en Puerto Rico. (2020, July 7). Béisbol 101.
-
The man who made baseball’s box score a hit. (2009, July 30). NPR.org.
-
Henry Chadwick. (2012, January 8). Society for American Baseball Research.
-
Allan Roth. (2014, June 2). Society for American Baseball Research.
-
Henry Chadwick award: Pete Palmer. (2011, February 3). Society for American Baseball Research.
-
A guide to Sabermetric research. (n.d.). Society for American Baseball Research.
-
The beginner’s guide to aging curves. (2015, December 10). Sabermetrics Library.
-
Creating aging curves for Statcast metrics. (2019, July 25). The Hardball Times.
-
Nate Silver. The signal to noise. 2012. Penguin Books. New York New York. P.81.
-
MLB Transformers: The Ultimate Hitter’s and Pitcher’s Parks. (2015, April 24). Kings of Cork.

Artículos relacionados, periódico El Nuevo Día: