Direkt zum Inhalt
Stravas revolutionäres KI-Leaderboard-Integritätssystem: Betrüger endgültig eliminieren

Stravas revolutionäres KI-Leaderboard-Integritätssystem: Betrüger endgültig eliminieren

Stravas Machine-Learning-Ansatz zur Integrität von Bestenlisten

In der sich ständig weiterentwickelnden Fitness- und Technologiewelt ist Strava mit einem bahnbrechenden Ansatz zur Wahrung der Integrität seiner Bestenlisten führend. Stellen Sie sich vor, Sie haben gerade eine anstrengende Radtour oder einen Lauf hinter sich, sind schweißgebadet und Ihr Herz rast, und Sie laden Ihre Aktivität auf Strava hoch. Doch hier liegt der Haken: Wie stellt Strava sicher, dass diese Aufzeichnungen rein sind und nicht durch versehentliche Autofahrten verfälscht werden, die das Wettbewerbsumfeld verzerren könnten? Hier kommt das Wunder des maschinellen Lernens ins Spiel.

Stravas innovatives „Cars on Segments“-Modell fungiert als digitaler Gatekeeper und stellt sicher, dass jeder aufgezeichnete Kilometer durch menschliche Anstrengung und nicht durch Pferdestärken zurückgelegt wurde. Das Modell prüft jede hochgeladene Aktivität mithilfe eines ausgeklügelten Algorithmus, der einen Wahrscheinlichkeitswert von 0 bis 1 zuweist. Überschreitet dieser Wert einen bestimmten Schwellenwert, ist dies ein Warnsignal, dass ein Teil der Fahrt möglicherweise motorbetrieben war. Nutzer können die Aufzeichnung dann entweder anpassen oder privat halten.

Doch wie funktioniert diese digitale Zauberei? Sie ist einfacher als gedacht, aber in der Ausführung unglaublich komplex. Nach Abschluss des Uploads analysiert das Modell die Daten und extrahiert über 57 verschiedene Merkmale Ihrer Aktivität. Dabei handelt es sich nicht um Zufallszahlen, sondern um sorgfältig berechnete Messwerte wie Durchschnittsgeschwindigkeiten, Beschleunigungsabweichungen und sogar den faszinierenden Namen „Jerk“ – die Änderungsrate der Beschleunigung.

Ein besonders faszinierendes Feature ist der „Sendrix-Koeffizient“, benannt nach einem der schnellsten Strava-Radfahrer, Jimi Sendrix. Er misst, wie schnell und häufig ein Radfahrer auf eine bestimmte Geschwindigkeit beschleunigen kann, bevor er ermüdet – eine Leistung, die kein Auto nachahmen könnte.

Diese Merkmale werden dann mithilfe von SHAP-Werten gewichtet. Diese Methode hilft zu bestimmen, wie stark jedes Merkmal die Entscheidung des Modells zugunsten von „Fahrrad“ oder „Auto“ beeinflusst. Beispielsweise würde das Erreichen einer Höchstgeschwindigkeit von 130 km/h die Waage deutlich zugunsten von „Auto“ neigen, da eine solche Leistung auf zwei Rädern allein mit menschlicher Kraft nahezu unmöglich ist.

Die Stärke dieses Systems liegt in seinem Lernmechanismus. Strava hat sein Modell mithilfe eines gradientenbasierten Entscheidungsbaum-Klassifikators mit XGBoost, einer renommierten Bibliothek für maschinelles Lernen, trainiert. Dieses Training umfasste Tausende von Aktivitäten, die klar als entweder fahrzeugbezogen oder rein muskelbetrieben gekennzeichnet waren. Dank dieses rigorosen Trainingsprogramms kann das Modell mit einer Genauigkeit von 81 % erkennen, ob eine Fahrt oder ein Lauf durch mechanische Hilfsmittel beeinträchtigt wurde.

Strava gibt sich aber noch nicht damit zufrieden. Das Unternehmen plant, weitere Modelle einzuführen, um die Genauigkeit seiner Bestenlisten weiter zu verbessern. So soll beispielsweise zwischen E-Bikes und herkömmlichen Fahrrädern unterschieden werden und sichergestellt werden, dass Läufe nicht fälschlicherweise als Fahrten erfasst werden.

Bei dieser Strava-Initiative geht es nicht nur darum, die Bestenliste aktuell zu halten, sondern auch darum, den Fairplay-Geist in der globalen Sportgemeinschaft zu bewahren. Sie zeigt, wie Technologie genutzt werden kann, um unsere sportlichen Bemühungen zu verbessern und sicherzustellen, dass jeder Tropfen Schweiß zählt und jeder Rekord ein echter Maßstab für menschliche Ausdauer und Willenskraft ist.

Im Grunde setzt Strava einen neuen Standard für digitalen Sportsgeist, bei dem Technologie und Ehrlichkeit Hand in Hand gehen und uns alle dazu inspirieren, unsere Grenzen fair und ehrlich zu überschreiten. Wenn Sie also das nächste Mal Ihre Turnschuhe schnüren oder aufs Rad steigen, nehmen Sie sich einen Moment Zeit, um den unsichtbaren Hightech-Verbündeten zu würdigen, der dafür sorgt, dass Ihre Leistungen präzise bewertet werden und Sie motiviert, weiterhin nach Ihren persönlichen Bestleistungen zu streben.

Wofür wird das maschinelle Lernmodell „Cars on Segments“ verwendet?

Das Machine-Learning-Modell „Cars on Segments“ dient dazu, zu erkennen, ob Teile einer auf Strava hochgeladenen Aktivität in einem Fahrzeug wie Auto, Motorrad, Zug oder Flugzeug aufgezeichnet wurden. Es trägt dazu bei, dass nur gültige Rad- und Laufaktivitäten in den Strava-Bestenlisten erscheinen.

Wie ermittelt das Modell, ob eine Aktivität in einem Fahrzeug aufgezeichnet wurde?

Das Modell berechnet aus den Aktivitätsdaten 57 Merkmale wie Durchschnittsgeschwindigkeit, Beschleunigung und weitere Messwerte, um zwischen Fahrzeugen und Fahrrädern zu unterscheiden. Anhand dieser Merkmale wird ein Wahrscheinlichkeitswert generiert, der die Wahrscheinlichkeit angibt, dass bei der Aktivität ein Fahrzeug verwendet wurde.

Was passiert, wenn das Modell in einer hochgeladenen Aktivität ein Fahrzeug identifiziert?

Überschreitet die Wahrscheinlichkeit des Modells, dass ein Fahrzeug vorhanden ist, einen bestimmten Schwellenwert, wird die Aktivität markiert, bevor sie in die Bestenliste aufgenommen wird. Der Benutzer wird dann aufgefordert, den Fahrzeugteil auszuschneiden oder die Aktivität als privat zu kennzeichnen.

Was ist der „Sendrix-Koeffizient“ und wie wird er verwendet?

Der „Sendrix-Koeffizient“ ist eine Funktion, die gemeinsam mit einem der schnellsten Strava-Radfahrer, Jimi Sendrix, entwickelt wurde. Sie misst, wie schnell ein Radfahrer aus dem Stand auf 32 km/h beschleunigen kann und wie oft er dies tun kann, bevor er erschöpft ist. Diese Funktion hilft dem Modell, Autos von Fahrrädern zu unterscheiden, indem sie die Grenzen der menschlichen Leistungsfähigkeit berücksichtigt.

Was sind SHAP-Werte und wie tragen sie zu den Entscheidungen des Modells bei?

SHAP-Werte dienen dazu, den Beitrag jedes Merkmals zur endgültigen Entscheidung des Modells zu erläutern. Sie geben an, ob ein Merkmal eher auf ein Fahrzeug oder ein Fahrrad hindeutet, und sorgen so für Transparenz bei der Bewertung der einzelnen Aktivitäten durch das Modell.

Wie wurde das Machine-Learning-Modell trainiert?

Das Modell wurde mithilfe eines Gradient-Boosted-Decision-Tree-Klassifikators mit XGBoost, einer weit verbreiteten Machine-Learning-Bibliothek, trainiert. Es wurde anhand von Zehntausenden von Aktivitäten mit Fahrzeugen trainiert, um diese präzise zu identifizieren und zu kennzeichnen.

Welche Pläne gibt es für die Zukunft, um die Integrität der Bestenliste von Strava zu verbessern?

Zukünftig sollen Modelle veröffentlicht werden, die verhindern, dass falsche Fahrradaktivitäten die Laufbestenlisten stören, und die zwischen E-Bikes und normalen Fahrten unterscheiden. Strava wird außerdem die Top-10-Ergebnisse neu aufbereiten, um Genauigkeit und Fairness zu gewährleisten.

#Maschinelles Lernen #LeaderboardIntegrität

Quelle: https://stories.strava.com/articles/removing-cars-from-leaderboards

Entdecken Sie einzigartige Triathlon-Artikel, darunter stylische T-Shirts, Aufkleber, Handyhüllen und Wohnaccessoires – perfekt für Ausdauersportler und Sportler. Jetzt einkaufen
Hinterlasse einen Kommentar

Deine Email-Adresse wird nicht veröffentlicht..

Warenkorb 0

Dein Warenkorb ist leer

Beginn mit dem Einkauf