Ir directamente al contenido
TriLaunchpadTriLaunchpad
El revolucionario sistema de integridad de la clasificación de IA de Strava: eliminando a los tramposos para siempre

El revolucionario sistema de integridad de la clasificación de IA de Strava: eliminando a los tramposos para siempre

El Enfoque de Aprendizaje Automático de Strava para la Integridad de las Clasificaciones

En el mundo en constante evolución del fitness y la tecnología, Strava lidera la carga con un enfoque innovador para mantener la integridad de sus clasificaciones. Imagina que acabas de terminar una agotadora carrera o un paseo en bicicleta, estás empapado en sudor, con el corazón latiendo a mil, y subes tu actividad a Strava. Pero aquí está el truco: ¿cómo asegura Strava que estos registros sean puros, sin contaminar por viajes accidentales en coche que podrían distorsionar el panorama competitivo? Entra la maravilla del aprendizaje automático.

El innovador modelo de Strava 'Coches en Segmentos' es un guardián digital que asegura que cada kilómetro registrado fue impulsado por el esfuerzo humano, no por la potencia de un motor. Este modelo examina cada actividad subida, empleando un algoritmo sofisticado que asigna una puntuación de probabilidad de 0 a 1. Si esta puntuación supera un cierto umbral, es una señal de alerta de que parte de tu viaje podría haber sido motorizado, lo que incita a los usuarios a ajustar el registro o mantenerlo privado.

Pero, ¿cómo funciona esta magia digital? Es más simple de lo que podrías pensar, pero brillantemente complejo en su ejecución. Al finalizar tu subida, el modelo se sumerge en los datos, extrayendo más de 57 características distintas de tu actividad. No son solo números aleatorios; son métricas cuidadosamente calculadas como promedios de velocidad, variaciones de aceleración e incluso el intrigante "tirón" – la tasa de cambio de aceleración.

Una característica particularmente fascinante es el "Coeficiente de Sendrix", llamado así por uno de los ciclistas más rápidos de Strava, Jimi Sendrix. Mide la rapidez y frecuencia con la que un ciclista puede acelerar a una cierta velocidad antes de que la fatiga aparezca, una hazaña que ningún coche podría imitar.

Estas características se ponderan luego utilizando los valores SHAP, un método que ayuda a determinar cuánto influye cada característica en la decisión del modelo hacia "bicicleta" o "coche". Por ejemplo, alcanzar una velocidad máxima de 80 mph inclinaría fuertemente la balanza hacia "coche", ya que lograr tal hazaña en dos ruedas es casi implausible solo con la fuerza humana.

La belleza de este sistema reside en su mecanismo de aprendizaje. Strava ha entrenado su modelo utilizando un clasificador de árbol de decisión potenciado por gradiente con XGBoost, una reconocida biblioteca de aprendizaje automático. Este entrenamiento implicó miles de actividades, claramente marcadas como que incluían vehículos o que eran puramente impulsadas por humanos. Este riguroso régimen de entrenamiento permite al modelo discernir con una precisión reportada del 81% si un paseo o una carrera ha sido contaminada por ayuda mecánica.

Mirando hacia el futuro, Strava no se detiene aquí. Planean implementar modelos adicionales para refinar aún más la precisión de sus clasificaciones, incluyendo la diferenciación entre bicicletas eléctricas y bicicletas convencionales y asegurando que las carreras no se registren erróneamente como paseos.

Esta iniciativa de Strava no se trata solo de mantener una clasificación precisa; se trata de preservar el espíritu del juego limpio en la comunidad atlética global. Es un testimonio de cómo la tecnología puede ser aprovechada para mejorar nuestros esfuerzos deportivos, asegurando que cada gota de sudor cuente y cada récord establecido sea una verdadera medida de la resistencia y la fuerza de voluntad humanas.

En esencia, Strava está estableciendo un nuevo estándar para el espíritu deportivo digital, donde la tecnología y la honestidad van de la mano, inspirándonos a todos a superar nuestros límites, de manera justa y equitativa. Así que la próxima vez que te ates los cordones de tus zapatillas o te subas a tu bicicleta, tómate un momento para apreciar al aliado invisible y de alta tecnología que asegura que tus esfuerzos sean juzgados con precisión, motivándote a seguir esforzándote por alcanzar tus mejores marcas personales.

¿Para qué se utiliza el modelo de aprendizaje automático 'Coches en Segmentos'?

El modelo de aprendizaje automático 'Coches en Segmentos' se utiliza para identificar si alguna parte de cualquier actividad subida a Strava fue grabada en un vehículo, como coches, motocicletas, trenes o aviones. Ayuda a asegurar que solo las actividades válidas de ciclismo y carrera aparezcan en las clasificaciones de Strava.

¿Cómo determina el modelo si una actividad fue grabada en un vehículo?

El modelo calcula una serie de 57 características a partir de los datos de la actividad, como la velocidad media, la aceleración y otras métricas, para diferenciar entre vehículos y bicicletas. Utiliza estas características para generar una puntuación de probabilidad que indica la probabilidad de que se haya utilizado un vehículo en la actividad.

¿Qué sucede si el modelo identifica un vehículo en una actividad subida?

Si la probabilidad del modelo de que haya un vehículo supera un cierto umbral, la actividad se marca antes de que llegue a cualquier clasificación. Luego se le pide al usuario que recorte la parte del vehículo o que haga la actividad privada.

¿Qué es el 'Coeficiente de Sendrix' y cómo se utiliza?

El 'Coeficiente de Sendrix' es una característica desarrollada con uno de los ciclistas más rápidos del personal de Strava, Jimi Sendrix. Mide la velocidad con la que un ciclista puede acelerar desde parado hasta 20 mph y cuántas veces puede hacerlo antes de agotarse. Esta característica ayuda al modelo a diferenciar los coches de las bicicletas al considerar las limitaciones del rendimiento humano.

¿Qué son los valores SHAP y cómo contribuyen a las decisiones del modelo?

Los valores SHAP se utilizan para explicar la contribución de cada característica a la decisión final del modelo. Indican si una característica es más indicativa de un vehículo o una bicicleta, lo que ayuda a proporcionar transparencia en cómo el modelo evalúa cada actividad.

¿Cómo se entrenó el modelo de aprendizaje automático?

El modelo fue entrenado utilizando un clasificador de árbol de decisión potenciado por gradiente con XGBoost, una biblioteca de aprendizaje automático ampliamente utilizada. Fue entrenado con decenas de miles de actividades que contenían vehículos para identificar y marcar con precisión dichas actividades.

¿Cuáles son los planes futuros para mejorar la integridad de las clasificaciones de Strava?

Los planes futuros incluyen lanzar modelos para evitar que las actividades de bicicleta incorrectas interrumpan las clasificaciones de carrera y para diferenciar entre bicicletas eléctricas y paseos regulares. Strava también reprocesará los 10 primeros resultados para garantizar la precisión y la equidad.

#MachineLearning #LeaderboardIntegrity

Fuente: https://stories.strava.com/articles/removing-cars-from-leaderboards

Descubre artículos únicos con temática de triatlón, incluyendo camisetas elegantes, pegatinas, fundas para teléfono y decoración para el hogar, perfectos para entusiastas y atletas de deportes de resistencia. Compra ahora
🏊‍♂️🚴‍♂️🏃‍♂️ Prepárate para tu próxima carrera
Encuentra el equipo de triatlón perfecto en TriLaunchpad — tu viaje en triatlón comienza aquí. Ver todas las colecciones →
Deja un comentario

Su dirección de correo electrónico no será publicada..

Carrito 0

Su carrito está vacío.

Empieza a comprar