Drei Flags, um einen Curve-Fit-Backtest zu erkennen, bevor du ihm vertraust

Jeder Discord kann einen 200%-Backtest zeigen. Die meisten sind nachträglich getunt und kollabieren morgen. So erkennst du sie.

Drei Flags, um einen Curve-Fit-Backtest zu erkennen, bevor du ihm vertraust

Jeder Tippgeber-Discord kann dir einen 200%-Backtest zeigen. Die meisten sind curve-fit — in der Rückschau auf alte Daten getrimmt und fallen morgen auseinander. Hier sind die drei Flags, die du ohne Technik-Background erkennen kannst.

IN-SAMPLE vs OUT-OF-SAMPLE ROI Curve-Fit +38 % IN-SAMPLE −4 % OUT-OF-SAMPLE Legitim +12 % IN-SAMPLE +10 % OUT-OF-SAMPLE Ein echter Edge überlebt den Test, auf den er nicht getunt wurde. Curve-Fit kollabiert.

Flag 1 — Kein Out-of-Sample-Fenster

Ein legitimer Backtest teilt die Daten: Modell auf Jahre 1–4 tunen, in Jahr 5 unangetastet testen. Wenn die „Ergebnisse" nur eine ROI-Zahl zeigen ohne den Hinweis „getestet auf 20XX–20YY, das das Modell nicht gesehen hat", gehe von Curve-Fit aus.

Flag 2 — Verdächtig enge Strategie-Definition

„Über 2.5 wetten in Spielen, in denen das Auswärtsteam 3 der letzten 5 gewonnen hat und das Heimteam dienstags gespielt hat." Das ist keine Strategie — das beschreibt 11 historische Spiele. Mit genug Parametern passt du eine Hummel an deinen Kühlschrankmagneten. Echte Strategien werden vor den Daten definiert, in einfachen Worten.

Flag 3 — Kein Drawdown ausgewiesen

Jede echte Wett-Strategie hat eine schlimmste Verluststrähne. Wenn Marketing nur die Equity-Kurve ohne maximalen Drawdown zeigt — was war die schlimmste −10u-Phase, wann war sie — verstecken sie den Zeitraum, in dem du abbestellt hättest.

Wie GSS das löst

Jedes Verified System publiziert seinen 365-Tage-Out-of-Sample-ROI, seinen schlechtesten rollenden 30-Tage-Drawdown und das vollständige Wett-Ledger. Der Schwellwert (Probability-Cutoff) ist vor dem Test-Zeitraum fixiert — kein nachträgliches Tuning. Degeneriert ein System später, läuft das Badge ab. Kein leises Rebrand.