Stravas revolutionäres KI-Leaderboard-Integritätssystem: Betrüger endgültig eliminieren

Stravas Ansatz für maschinelles Lernen zur Sicherstellung der Integrität von Bestenlisten

In der sich ständig weiterentwickelnden Welt von Fitness und Technologie nimmt Strava eine Vorreiterrolle ein, indem es einen bahnbrechenden Ansatz zur Wahrung der Integrität seiner Bestenlisten verfolgt. Stellen Sie sich vor, Sie haben gerade eine anstrengende Fahrt oder einen Lauf beendet, schwitzen, das Herz pocht, und Sie laden Ihre Aktivität auf Strava hoch. Aber hier ist der Haken: Wie stellt Strava sicher, dass diese Aufzeichnungen rein und unverfälscht sind, nicht durch versehentliche Autofahrten verfälscht werden, die die Wettbewerbslandschaft verzerren könnten? Hier kommt das Wunder des maschinellen Lernens ins Spiel.

Stravas innovatives Modell „Cars on Segments“ ist ein digitaler Gatekeeper, der sicherstellt, dass jeder aufgezeichnete Kilometer durch menschliche Anstrengung und nicht durch PS erbracht wurde. Dieses Modell prüft jede hochgeladene Aktivität und verwendet einen ausgeklügelten Algorithmus, der eine Wahrscheinlichkeit von 0 bis 1 zuweist. Wenn dieser Wert einen bestimmten Schwellenwert überschreitet, ist dies ein Warnsignal, dass ein Teil Ihrer Reise motorisiert gewesen sein könnte, was die Benutzer dazu veranlasst, den Eintrag entweder anzupassen oder ihn privat zu halten.

Aber wie funktioniert diese digitale Zauberei? Es ist einfacher, als Sie vielleicht denken, und doch brillant komplex in der Ausführung. Nach Abschluss Ihres Uploads taucht das Modell in die Daten ein und extrahiert über 57 verschiedene Merkmale aus Ihrer Aktivität. Dies sind nicht nur zufällige Zahlen; es sind sorgfältig berechnete Metriken wie Geschwindigkeitsdurchschnitte, Beschleunigungsvarianzen und sogar der faszinierend benannte „Ruck“ – die Änderungsrate der Beschleunigung.

Ein besonders faszinierendes Merkmal ist der „Sendrix-Koeffizient“, benannt nach einem der schnellsten Radfahrer von Strava, Jimi Sendrix. Er misst, wie schnell und häufig ein Radfahrer auf eine bestimmte Geschwindigkeit beschleunigen kann, bevor die Ermüdung einsetzt – eine Leistung, die kein Auto nachahmen könnte.

Diese Merkmale werden dann mithilfe von SHAP-Werten gewichtet, einer Methode, die dabei hilft zu bestimmen, wie stark jedes Merkmal die Entscheidung des Modells in Richtung „Fahrrad“ oder „Auto“ beeinflusst. Zum Beispiel würde das Erreichen einer Höchstgeschwindigkeit von 80 Meilen pro Stunde die Waage stark in Richtung „Auto“ neigen, da eine solche Leistung auf zwei Rädern unter menschlicher Kraft allein nahezu unmöglich ist.

Die Schönheit dieses Systems liegt in seinem Lernmechanismus. Strava hat sein Modell mithilfe eines Gradient-Boosted-Decision-Tree-Klassifizierers mit XGBoost, einer renommierten Machine-Learning-Bibliothek, trainiert. Dieses Training umfasste Tausende von Aktivitäten, die eindeutig als fahrzeughaltig oder rein menschlich betrieben gekennzeichnet waren. Dieses rigorose Trainingsprogramm ermöglicht es dem Modell, mit einer gemeldeten Genauigkeit von 81 % zu erkennen, ob eine Fahrt oder ein Lauf durch mechanische Hilfe verfälscht wurde.

Strava bleibt hier nicht stehen. Sie planen, weitere Modelle einzuführen, um die Genauigkeit ihrer Bestenlisten weiter zu verfeinern, einschließlich der Unterscheidung zwischen E-Bikes und herkömmlichen Fahrrädern und der Sicherstellung, dass Läufe nicht fälschlicherweise als Fahrten protokolliert werden.

Diese Initiative von Strava dient nicht nur dazu, eine Bestenliste genau zu halten; es geht darum, den Geist des Fairplay in der globalen Sportgemeinschaft zu bewahren. Es ist ein Beweis dafür, wie Technologie genutzt werden kann, um unsere sportlichen Bemühungen zu verbessern und sicherzustellen, dass jeder Schweißtropfen zählt und jeder aufgestellte Rekord ein wahres Maß für menschliche Ausdauer und Willenskraft ist.

Im Wesentlichen setzt Strava einen neuen Standard für digitale Sportlichkeit, bei dem Technologie und Ehrlichkeit Hand in Hand gehen und uns alle dazu inspirieren, unsere Grenzen fair und ehrlich zu überschreiten. Wenn Sie also das nächste Mal Ihre Sportschuhe schnüren oder auf Ihr Fahrrad steigen, nehmen Sie sich einen Moment Zeit, um den unsichtbaren Hightech-Verbündeten zu würdigen, der dafür sorgt, dass Ihre Bemühungen genau beurteilt werden, und Sie motiviert, immer wieder nach persönlichen Bestleistungen zu streben.

Wofür wird das Machine-Learning-Modell „Cars on Segments“ verwendet?

Das Machine-Learning-Modell „Cars on Segments“ wird verwendet, um zu identifizieren, ob ein Teil einer auf Strava hochgeladenen Aktivität in einem Fahrzeug, wie z. B. Autos, Motorrädern, Zügen oder Flugzeugen, aufgezeichnet wurde. Es hilft sicherzustellen, dass nur gültige Rad- und Laufaktivitäten in den Strava-Bestenlisten erscheinen.

Wie bestimmt das Modell, ob eine Aktivität in einem Fahrzeug aufgezeichnet wurde?

Das Modell berechnet eine Reihe von 57 Merkmalen aus den Aktivitätsdaten, wie z. B. Durchschnittsgeschwindigkeit, Beschleunigung und andere Metriken, um zwischen Fahrzeugen und Fahrrädern zu unterscheiden. Es verwendet diese Merkmale, um eine Wahrscheinlichkeit zu erzeugen, die die Wahrscheinlichkeit angibt, dass ein Fahrzeug bei der Aktivität verwendet wurde.

Was passiert, wenn das Modell ein Fahrzeug in einer hochgeladenen Aktivität identifiziert?

Wenn die Wahrscheinlichkeit des Modells, dass ein Fahrzeug vorhanden ist, einen bestimmten Schwellenwert überschreitet, wird die Aktivität markiert, bevor sie in eine Bestenliste gelangt. Der Benutzer wird dann aufgefordert, den Fahrzeugteil zu entfernen oder die Aktivität privat zu machen.

Was ist der „Sendrix-Koeffizient“ und wie wird er verwendet?

Der „Sendrix-Koeffizient“ ist ein Merkmal, das mit einem der schnellsten Mitarbeiter-Radfahrer von Strava, Jimi Sendrix, entwickelt wurde. Er misst, wie schnell ein Radfahrer aus dem Stand auf 20 Meilen pro Stunde beschleunigen kann und wie oft er dies tun kann, bevor er erschöpft ist. Dieses Merkmal hilft dem Modell, Autos von Fahrrädern zu unterscheiden, indem es die Grenzen der menschlichen Leistung berücksichtigt.

Was sind SHAP-Werte und wie tragen sie zu den Entscheidungen des Modells bei?

SHAP-Werte werden verwendet, um den Beitrag jedes Merkmals zur endgültigen Entscheidung des Modells zu erklären. Sie geben an, ob ein Merkmal eher auf ein Fahrzeug oder ein Fahrrad hindeutet, und tragen so zur Transparenz bei der Bewertung jeder Aktivität durch das Modell bei.

Wie wurde das Machine-Learning-Modell trainiert?

Das Modell wurde mithilfe eines Gradient-Boosted-Decision-Tree-Klassifizierers mit XGBoost, einer weit verbreiteten Machine-Learning-Bibliothek, trainiert. Es wurde an Zehntausenden von Aktivitäten trainiert, die Fahrzeuge enthielten, um solche Aktivitäten genau zu identifizieren und zu kennzeichnen.

Was sind die Zukunftspläne zur Verbesserung der Integrität der Strava-Bestenlisten?

Zukünftige Pläne umfassen die Veröffentlichung von Modellen, um zu verhindern, dass falsche Fahrradaktivitäten die Laufbestenlisten stören, und um zwischen E-Bikes und normalen Fahrten zu unterscheiden. Strava wird auch die Top-10-Ergebnisse erneut verarbeiten, um Genauigkeit und Fairness zu gewährleisten.

#MachineLearning #LeaderboardIntegrity

Quelle: https://stories.strava.com/articles/removing-cars-from-leaderboards

Entdecken Sie einzigartige Merchandise-Artikel zum Thema Triathlon, darunter stilvolle T-Shirts, Aufkleber, Handyhüllen und Wohnaccessoires – perfekt für Ausdauersportler und Athleten. Jetzt einkaufen

🏊‍♂️🚴‍♂️🏃‍♂️ Machen Sie sich bereit für Ihr nächstes Rennen
Finden Sie die perfekte Triathlon-Ausrüstung bei TriLaunchpad – Ihre Triathlon-Reise beginnt hier. Alle Kollektionen ansehen →