Data-driven NFL betting: DVOA, EPA, CLV en geavanceerde statistieken

NFL-quarterback bekijkt het speelveld voorafgaand aan de snap met de offensive line in formatie

Waarom basisstats je structureel laten betalen

De eerste keer dat ik tegen mezelf zei “ik snap het echt”, was bij een Patriots-Bengals wedstrijd in 2019. New England stond aan de leiding in passing yards en first downs. Cincinnati had drie turnovers verloren. Op papier was het een klassieke Patriots-wedstrijd. Cincinnati won met 16. Mijn reactie: hoe kan dat? Het antwoord lag in de cijfers die ik niet had bekeken — Cincinnati’s EPA per play in de tweede helft was dramatisch hoger dan in de eerste, hun success rate op derde down was 64%, en hun defensieve dropback EPA was die wedstrijd structureel beter dan New England’s passing offence. Yards en first downs zeiden niets. EPA zei alles.

Basisstats — yards, completions, first downs, gemiddelde score — zijn systematisch ondergeprijsd in moderne NFL-markten. Reden: bookmakers werken al jaren met opponent-adjusted en down-and-distance-gewogen data zoals DVOA, EPA en CLV. Wie nog wedt op gemiddelde scores van vorige week, speelt tegen modellen die context­gewogen meten. Het is geen eerlijke confrontatie.

De NFL trok in seizoen 2025 het op één na hoogste gemiddelde kijkers per wedstrijd ooit — dat populariteitsniveau vertaalt zich direct in wedvolume, meer professionele aandacht en scherpere lijnen. Wie wil winnen in 2026, moet werken met dezelfde input-categorieën als de bookmakers — context-aware metrics die rekening houden met tegenstander, situatie en down.

Dit stuk leert je geen Wikipedia-definities. Ik leg uit wat DVOA werkelijk meet en wat het niet meet, hoe je EPA per play vertaalt naar pre-game wedbeslissingen, waarom CLV de enige korte-termijn-prestatie-indicator is die er werkelijk toe doet, en waar de bekende valkuilen liggen — overfitting, survivorship bias, garbage time. Aan het eind heb je een mentaal raamwerk om data te lezen, niet om de specifieke percentages voor week 12 te onthouden.

Waarom traditionele stats tekortschieten in moderne NFL-markten

Een vraag die ik graag stel aan beginnende bettors: “wat zegt 350 passing yards over de kwaliteit van een quarterback?” Het correcte antwoord is: vrijwel niets. 350 yards tegen een top-3 defense in een 17-14 nederlaag is een uitstekende prestatie. Dezelfde 350 yards tegen een onderste-tier defense in een 42-7 overwinning, waar 200 daarvan kwamen in garbage time tegen een prevent defence, is een middelmatig cijfer. Het getal is identiek. De waarde verschilt fundamenteel.

Traditionele NFL-stats meten output zonder context. Yards, completions, rushing attempts, tackles — allemaal optellingen die niet rekening houden met de tegenstander, de wedstrijdsituatie, of de down-and-distance waarin de actie plaatsvond. Voor het analyseren van een seizoenstrend zijn ze nog enigszins bruikbaar als gemiddelden. Voor het inschatten van een individuele wedstrijd zijn ze gevaarlijk omdat ze valse zekerheid geven.

Wat traditionele stats systematisch missen: opponent strength (een quarterback die elk weekend tegen toptiens speelt heeft andere stats dan iemand die alleen tegen onderste-tier defenses speelt), garbage time (yards die in de laatste 3 minuten van een 28-7 wedstrijd verzameld worden tellen voor de stat-totalen maar zeggen weinig over werkelijke vaardigheid), en down-and-distance context (een 6-yard play op 3rd-and-3 is een succes, dezelfde 6 yards op 3rd-and-10 is een mislukking).

Hier komt waar advanced metrics bestaan voor. DVOA corrigeert voor opponent strength. EPA weegt elke play op zijn impact op de uitkomst van de drive. Success rate filtert garbage time deels uit door op down-and-distance te wegen. Geen van deze metrics is perfect — modellen zijn nooit perfect — maar ze vertegenwoordigen wel een fundamenteel andere kijk op wat een team werkelijk presteert versus wat de scorecard suggereert.

Voor de bettor heeft dit één implicatie. Een team dat traditioneel als “goed” gepresenteerd wordt in mediaverhalen — vanwege impressive yardage totalen, een trade om media-mooie reden, of recente clutch wins — kan door advanced metrics als middelmatig of zelfs ondergemiddeld worden gekwalificeerd. De markt verwerkt vaak beide signalen, maar de timing verschilt. Mediaverhalen drijven public money en lijnbeweging op donderdag. Advanced metrics drijven sharp money en lijnbeweging op woensdag-vrijdag. Wie de twee uit elkaar kan houden, vindt edge.

DVOA uitgelegd en toegepast op wedbeslissingen

DVOA staat voor Defense-adjusted Value Over Average. Het werd in de vroege jaren 2000 ontwikkeld door Aaron Schatz bij Football Outsiders en heeft sindsdien een soort goudstandaard-status verkregen onder advanced NFL-metrics. Achter de naam zit een eenvoudig idee: in plaats van te kijken hoeveel yards een team in totaal heeft gemaakt, kijken we naar hoe waardevol elke individuele play was vergeleken met wat een gemiddelde team-prestatie tegen dezelfde tegenstander op datzelfde moment zou zijn geweest.

Concreet werkt het zo: voor elke play in het seizoen wordt de “verwachte waarde” berekend op basis van de situatie (down, distance, veldpositie, klok). Een 5-yard run op 1st-and-10 vanaf eigen 30-yardlijn heeft een baseline-verwachting. Wat het team daadwerkelijk presteerde, wordt afgezet tegen die baseline. Vervolgens wordt het resultaat gecorrigeerd voor de kwaliteit van de tegenstander — een 5-yard run tegen een top-3 run defence is veel meer waard dan tegen een onderste-tier defence.

Het eindresultaat is een percentage. Positieve DVOA betekent boven gemiddeld; negatieve DVOA betekent onder gemiddeld. Een offense DVOA van +20% betekent dat het team gemiddeld 20% beter heeft gepresteerd dan een gemiddelde team in dezelfde situaties. Een defense DVOA van -15% betekent dat de defense gemiddeld 15% beter is dan gemiddeld — hier is negatief gunstig, omdat een defence minder punten toelaat.

Voor de bettor zijn drie DVOA-toepassingen direct nuttig. Eerste: DVOA-totaal vergelijken tussen twee teams die elkaar treffen. Een wedstrijd tussen een team met offense DVOA +25% en defense DVOA -10% tegen een team met offense +5% en defense +10% is statistisch een grote mismatch — ook al ziet de win-loss-record er minder eenduidig uit. De markt prijst die DVOA-spread vaak niet volledig in als de records dichter bij elkaar liggen.

Tweede: aanvaller-versus-verdediger DVOA. In een wedstrijd waarin team A passing offence sterk is en team B passing defense zwak is, krijgt team A een passing-edge waar je op kunt wedden — niet noodzakelijk op de winnaar, maar wel op player props voor de quarterback of receivers. Deze matchup-asymmetrie is concreet meetbaar in DVOA-split-cijfers (passing offence DVOA versus passing defense DVOA, rushing offence versus rushing defense).

Derde: early-season versus late-season DVOA. Een vaak overgenomen vraag van data-bettors is wanneer DVOA betrouwbaar wordt. Het korte antwoord: rond week 4 tot 6 stabiliseert DVOA voldoende voor pre-game gebruik. Voor die periode geeft het te veel ruis omdat opponent-correctie nog onvoldoende sample heeft. Vroeg-seizoen-DVOA is meer signaal dan voor-seizoen-projecties, maar minder betrouwbaar dan mid-seizoen-DVOA.

Wat DVOA niet meet: spelers-niveau-prestaties (DVOA is team-niveau), in-game-momentum, of garbage-time correctie volledig. De originele DVOA-formule probeert garbage time deels te filteren, maar wedstrijden met grote scoreverschillen kunnen de cijfers nog steeds verstoren. Wie DVOA serieus gebruikt, kruist de cijfers met EPA per play in scheidende situaties.

EPA per play en success rate als pre-game inputs

EPA — Expected Points Added — is misschien wel de elegantste advanced metric in NFL. De grondgedachte: aan elke veldsituatie (down, distance, veldpositie) is een verwacht aantal punten verbonden dat een team uit die situatie zal scoren. Een eerste down op de eigen 20 levert gemiddeld minder verwachte punten op dan een eerste down op de tegenstander 35. Elke play verandert die situatie, en daarmee de verwachte punten. EPA meet hoeveel een individuele play de verwachting heeft verschoven.

Stel: team A heeft 1st-and-10 op eigen 30. Verwachte punten in die situatie zijn 1,2. Quarterback gooit een complete pass van 15 yards. Nieuwe situatie: 1st-and-10 op eigen 45. Verwachte punten: 1,6. De play voegde 0,4 EPA toe. Een 50-yard touchdown­pass zou veel hogere EPA hebben. Een interceptie zou diep negatieve EPA hebben.

EPA per play (de gemiddelde EPA over alle plays van een team) is een van de scherpste seizoens-prestatie­indicatoren beschikbaar. Het meet niet alleen of een team punten maakt, maar of het consistent in elke situatie value toevoegt. Een offense met +0,15 EPA per play is structureel beter dan een offense op +0,05, ook al kan de scoring soms gelijk uitvallen door variantie.

Success rate is een complementaire metric. Een play is “succesvol” als hij voldoende yards behaalt om de drive levend te houden — typisch 40% van de benodigde yards op 1st down, 60% op 2nd down, 100% op 3rd en 4th down. Een team kan een hoge EPA hebben dankzij een paar explosieve plays terwijl de meeste plays mislukken. Een team kan een hoge success rate hebben met consistent middelmatige plays. Beide metrics samen geven een vollediger beeld dan elk afzonderlijk.

Voor de bettor: EPA per play is de input die ik consistent als eerste check bij elke wedstrijd-analyse. Niet als enige input, maar als anker. Wanneer twee teams duidelijk verschil in EPA per play hebben en de spread dat verschil niet adequaat weerspiegelt, is dat een signaal. Wanneer een team een hoge winrate heeft maar mediocre EPA per play, is dat een team dat geluk heeft gehad — gunstige variantie, niet onderliggende kracht. De markt corrigeert dergelijke teams pas later in het seizoen, wat een raam voor edge biedt.

De praktische valkuil bij EPA: garbage time. Veel rauwe EPA-cijfers tellen plays mee die in zware achterstand of voorsprong zijn gespeeld, wanneer beide teams hun strategie aanpassen aan de score in plaats van aan winnen. Garbage-time-filtering — alleen plays binnen één score van elkaar tellen, of alleen first-half plays — is de standaard­correctie. Voor pre-game beslissingen gebruik ik EPA zonder garbage time. Wie dat niet filtert, krijgt een team beeld dat structureel afwijkt van de werkelijke vaardigheid in betekenisvolle situaties.

CLV als prestatie-indicator voor gevorderde bettors

Op een conferentie in Amsterdam vroeg een collega-analist me: “wat is je rendement vorig seizoen?” Mijn eerlijke antwoord: “ik weet het niet, daar kijk ik niet naar.” Hij keek me aan alsof ik een ketterij had uitgesproken. Wat ik vervolgens uitlegde — en wat de basis is van moderne data-driven betting — was dat winrate en rendement variantie-gevoelige korte-termijn-metingen zijn die je weinig vertellen over je werkelijke vaardigheid. CLV vertelt je dat wel.

Closing line value is het verschil tussen de prijs waarop je een wed plaatste en de prijs waarop diezelfde markt sloot vlak voor kickoff. Plaatste je een spread op -3,5 en sloot de lijn op -2,5? Dan heb je een halve punt CLV in je voordeel. Plaatste je hetzelfde -3,5 en sloot de lijn op -4? Dan verloor je een halve punt CLV. Het idee: de slotlijn is de meest informatie-rijke prijs die de markt produceert — alle sharp money is verwerkt, alle blessure-informatie is bekend, alle modellen zijn bijgewerkt. Wie consistent betere prijzen krijgt dan de slotlijn, doet iets goed.

De wiskunde achter CLV als prestatie-indicator is robuust. Een half punt positieve CLV op NFL-spreads tilt een 50%-winrate-speler naar bijna 53% — wat over honderden weddenschappen het verschil tussen break-even en structureel winstgevend uitmaakt. Het verschil tussen -2,5 en -3,5 op een NFL-spread is ongeveer 16% CLV waard, omdat NFL-wedstrijden vaker met exact 3 punten verschil eindigen dan met enige andere marge. Een half-point hook op een key number is geen optische illusie; het is keiharde meetbare waarde.

Waarom is CLV superieur aan winrate als korte-termijn-prestatie­meting? Variantie. Winrate kan over 50 of 100 wedden ver afwijken van je werkelijke vaardigheid. Een 50%-bettor kan toevallig 58% halen, een 55%-bettor kan toevallig op 48% staan. CLV daarentegen materializeert zich na 50 tot 100 wedden in een stabiel signaal — de gemiddelde slotlijn-verbetering is zelf een gemiddelde dat snel naar je vaardigheidsniveau convergeert. Wie consistent positieve CLV haalt, is wiskundig gezien een bettor met edge, ook als de wedstrijduitslagen die periode tegen hem werken.

Praktisch CLV tracken is eenvoudig: noteer in je logboek de prijs bij plaatsing en de slotprijs. Bereken het CLV-percentage per wed. Een gemiddeld CLV van +0,5% tot +1,5% over een seizoen is een sterk signaal. CLV van -1% of slechter is een sterke aanwijzing dat je structureel slechte timing of slechte selectie hebt.

De diepe waarde van CLV is dat het je leert over je eigen proces, niet alleen over je resultaten. Plaats je consistent dinsdag, terwijl de lijn op woensdag-vrijdag scherpt? Dan zou je CLV gemiddeld positief moeten zijn. Plaats je zaterdagavond, op het moment dat de markt het meest scherp is? Dan moet je werkelijk superieure analyse hebben om positieve CLV te halen.

“Team X is 8-2 against the spread in zijn laatste 10 thuiswedstrijden” — een zin die je in elk NFL-betting-artikel ziet. De vraag is altijd dezelfde: is dit betekenisvol of toeval? Het korte antwoord: meestal toeval, soms signaal, en bijna nooit een directe wedindicatie.

ATS staat voor “against the spread” — het meet hoe vaak een team de spread heeft gedekt over een gegeven periode. Op het eerste gezicht aantrekkelijk omdat het direct meet wat je interesseert (winnen tegen de spread). Bij nader inzien fragiel: een sample van 10 wedstrijden is statistisch te klein om iets betekenisvols te concluderen, zelfs een sample van 50 wedstrijden geeft maar zwakke signalen.

Bij DraftKings in NFL-seizoen 2024 wonnen majority-handle wedden op point spreads slechts 51,8% en majority-ticket wedden 51,9% — bewijs dat zelfs grote samples van marktconsensus geen consistente edge bieden. Als de combinatie van duizenden bettors die hun geld in een richting zetten niet boven 52% komt, hoe zou een tien-wedstrijd ATS-streak van één team dan wel een betekenisvol signaal moeten zijn?

Toch zijn ATS-trends niet helemaal waardelos. Wat ze wel kunnen vertellen — als je er de juiste statistische bril bij opzet — is iets over hoe de markt een team consistent verkeerd inschat. Wanneer een team al meerdere seizoenen achter elkaar betere ATS-prestaties heeft dan andere, kan dat duiden op een systematische marktinefficiëntie: de bookmakers prijzen dit team verkeerd om redenen die niet snel corrigeren (bijvoorbeeld een coach die de markt blijft onderschatten, of een speelstijl die statistisch zwak lijkt maar consistent wint).

Hoe filter je dan voor relevantie? Drie regels die ik zelf hanteer. Eerste: ATS-trends die zich uitstrekken over minimaal twee seizoenen en 30+ wedstrijden — kortere periodes zijn meestal ruis. Tweede: ATS-trends die rationeel verklaarbaar zijn op basis van speelstijl, coach-tendens of roster-structuur. Als je geen “waarom” kunt formuleren achter de trend, dan is het waarschijnlijk een toevallig patroon. Derde: ATS-trends die nog steeds gelden na correctie voor key personnel — als de quarterback die de trend droeg is vertrokken, geldt de trend niet meer.

De meest misleidende ATS-trend is “Team X heeft de spread niet gedekt in 7 van de laatste 10”. Dat is geen indicator dat ze de volgende keer wel zullen dekken, noch dat ze de volgende keer ook weer falen. Het is gewoon historie. Tenzij je een specifieke reden hebt waarom de huidige wedstrijd anders is — gebruik de trend niet als beslissingsinput.

Home-road en divisional splits: variabelen die nog steeds tellen

“Home field advantage is dood” is een populaire stelling in de NFL-analytische gemeenschap. Het klopt niet helemaal — maar het is dichter bij de waarheid dan het ooit was. Wat dat betekent voor je wedbeslissingen is interessanter dan de stelling zelf.

In een eerdere periode waardeerden bookmakers home field advantage op consistent 3 punten — een spread voor een evenwichtige wedstrijd zou de thuisploeg standaard 3 punten favoriet maken. In de huidige markt is dat dichter bij 1,5 tot 2 punten, en bij specifieke wedstrijden zelfs minder. De redenen zijn deels meetbaar: reisafstand met privé­vluchten en moderne accommodatie verzwakt het lange-reis-effect, wedstrijden in domes elimineren weers­voordeel, en moderne teams zijn beter in het neutralis­eren van crowd-noise via communicatie­systemen.

Voor de bettor: gebruik home field advantage als variabele, niet als constante. Een outdoor stadion in december tegen een dome-team uit Florida geeft nog wel echt thuisvoordeel. Twee dome-teams die elkaar in een dome treffen geven vrijwel geen verschil. Een team dat al twee opeenvolgende weken op de weg speelt heeft een groter nadeel dan de markt vaak meeneemt. Een team dat na een Monday Night thuiswedstrijd op zondag verhuist naar de westkust heeft een aanzienlijk groter reisnadeel dan de standaard 1,5 punten.

Divisional splits zijn een tweede dimensie. Teams die elkaar twee keer per seizoen treffen kennen elkaars schema-vormingen en personeelstendensen veel beter dan teams in andere divisies. Het resultaat is dat divisional games statistisch dichter bij de spread eindigen dan inter-divisional games — minder blowouts, meer covers binnen 3 punten. Voor wedstrijden waar je een teaser overweegt is dit relevant: de waarschijnlijkheid van een wedstrijd die binnen 6 punten eindigt, is hoger bij divisional duels.

Een derde split die de moeite waard is om in gedachten te houden: prime-time prestaties. Sommige teams presteren historisch beter onder de schijnwerpers (Monday Night, Sunday Night, Thursday Night) dan in dagvensters. Dit is geen mystiek — het correleert met coaching staf-kwaliteit en voorbereidingsdiepte. Een team met een sterke offensive coördinator dat extra dagen voorbereiding krijgt, presteert structureel beter. Een team met een zwak coaching staf wordt door extra voorbereidingstijd niet beter.

Hoe gebruik je deze splits? Niet als enkelvoudige beslissingsinput. Wel als marginale aanpassingen op je primaire DVOA/EPA-analyse. Wanneer je modelbasis een wedstrijd op spread -3 prijst en het is een divisional thuiswedstrijd na een lange westkust-trip voor de tegenstander, kun je de spread mentaal met een halve punt naar -3,5 corrigeren.

Quarterback versus defense: matchup-modeling in praktijk

De wedstrijden die ik het liefst aanraak in NFL zijn die waar één quarterback duidelijk superieur is in een specifieke vaardigheid, en de tegenstander defensief precies die vaardigheid structureel laat lekken. Matchup-modeling — het systematisch identificeren van deze asymmetrieën — is misschien wel de meest praktische toepassing van advanced metrics voor de serieuze analytische bettor.

Het werk begint met split-DVOA en split-EPA. Een quarterback heeft niet één DVOA — hij heeft DVOA tegen verschillende defense-typen: man coverage versus zone, hoge versus lage pressure-rate, hoge versus lage interceptions-rate vorig jaar. Een defense heeft niet één DVOA — ze heeft DVOA tegen passing versus rushing, tegen play-action versus drop-back, in de rode zone versus tussen de 20-yard lines. Wanneer twee teams elkaar treffen, identificeer je waar de offense het sterkst is en waar de defence het zwakst is, en kijk je of die elkaar overlappen.

Een concreet voorbeeld uit een willekeurige Week 8. Team A heeft een quarterback met top-5 EPA tegen zone-coverage maar mediocre EPA tegen man-coverage. Team B speelt vorig seizoen 78% van zijn snaps in zone-coverage, één van de hoogste percentages in de league. Dat is een structurele mismatch in team A’s voordeel die de spread niet altijd adequaat reflecteert — vooral wanneer de pers vorige week schreef over team A’s “worsteling tegen pressure” zonder context dat die pressure uit man-coverage kwam.

Rushing matchups zijn vergelijkbaar maar simpeler. Een team met top-tien rushing offence DVOA tegenover een team met bottom-tien rushing defence DVOA is een wedstrijd waar je de rushing-output structureel hoger inschat dan de markt. Dat vertaalt naar rushing yards-props voor de starting running back, naar over op het totaal (meer rush attempts = meer klok-consumptie = mogelijk minder punten, dus complexer), of naar het team-totaal.

Special teams worden zelden in matchup-modellen meegenomen, en dat is een fout. Een team met een top-vijf field goal kicker tegen een team met bottom-vijf field goal blocked-rate is een wedstrijd waar de impliciete kicking yards systematisch hoger ligt. Voor totalen en alternate spreads zit hier vaak verborgen edge.

De kunst is om dit gestructureerd te doen zonder in cherry-picking te vervallen. Voor elke wedstrijd die ik analyseer, doorloop ik dezelfde checklist: offence-defence DVOA-spread, EPA per play met garbage time gefilterd, passing versus rushing splits, defensieve scheme (man/zone-percentage), red zone efficiëntie van beide kanten, en special teams-context. Pas wanneer drie of meer van die zes punten in dezelfde richting wijzen, classificeer ik de wed als kandidaat. Dat dwingt mij om niet alleen op één indrukwekkend cijfer te wedden.

Databronnen en gereedschap voor de Nederlandse NFL-bettor

Sharp Football Analysis claimt zelf dat geen andere NFL-analist een vergelijkbaar track record kan voorleggen — hun gepubliceerde totaal-selecties over 19 seizoenen tonen een consistent winrate-niveau boven de break-even-drempel. Of die claim onbetwistbaar is, kan ik niet onafhankelijk verifiëren, maar het stelt wel een interessante vraag: welke databronnen zijn voor de Nederlandse NFL-bettor in 2026 werkelijk bruikbaar?

De Engelstalige data-ecosysteem voor NFL is enorm. Voor advanced metrics zijn Football Outsiders (DVOA), Pro Football Focus (PFF-grades, snap counts), Sharp Football Analysis (totalen-analyse, key numbers), en hobby­netwerken zoals nflfastR (open-source EPA-data) de standaard­bronnen. Voor injury reports vertrouw ik op officiële NFL-rapporten via NFL.com en Sportradar-data via ESPN. Voor lijn­bewegingen gebruik ik VSiN en Action Network.

Voor de Nederlandse bettor zijn deze bronnen toegankelijk maar niet altijd op het ideale moment. Tijdsverschil is praktisch relevant: blessure-aankondigingen die op Amerikaanse donderdag­avond binnenkomen, bereiken jou pas vrijdag­ochtend. Lijn­bewegingen die op zaterdag­avond Amerikaanse tijd plaatsvinden, gebeuren wanneer je waarschijnlijk slaapt. Zaterdag­ochtend Nederlandse tijd is een goed moment om injury reports en lijn­bewegingen na te lopen voordat je je zondag plant.

Eigen tooling is voor de meeste hobby-bettors een te grote investering. Een spreadsheet met DVOA-data per week, EPA per play, je eigen log van wedden en CLV — dat is de minimale werkbare set. Wie comfortabel is met Python kan via nflfastR direct EPA-data ophalen en eigen analyses doen. Voor wie geen programmeerervaring heeft, leveren publieke tools zoals rbsdm.com en pff.com bruikbare alternatieven.

Wat ik niet meer gebruik en de Nederlandse bettor ook beter kan laten: Twitter-tipsters, Telegram-kanalen die “locks” verkopen, en Discord-communities die hun winrate niet onderbouwen. De gepubliceerde prestaties van zelfs de meest gerespecteerde analisten zit op rond 55-60% winrate — wie 70% of 80% claimt zonder gedetailleerde, openbare logboeken, verkoopt iets dat statistisch niet bestaat in deze markt.

Een laatste opmerking over data-versheid. NFL-statistieken zijn levende cijfers — een team-EPA dat na week 5 wordt gepubliceerd is over week 6 alweer veranderd. Werk altijd met cijfers van na de meest recente speeldag, en vooral met cijfers die opponent-corrections hebben gekregen. Een DVOA-table die op dinsdag verschijnt na maandagavond is bruikbaar; een tabel die nog van vorige week is, mist het meest recente datapunt en moet voorzichtig worden gehanteerd.

Overfitting en survivorship bias: waarom mooie modellen exploderen

De grootste fout die ik in mijn vroege betting-jaren maakte was een model bouwen op vijf seizoenen historische data, het laten zien dat het in 56% van de wedstrijden de winnende kant had geprojecteerd, en het vol vertrouwen op het volgende seizoen toepassen. Het volgende seizoen kwam ik uit op 47% winrate. Dat is overfitting in zijn meest pijnlijke vorm.

Overfitting gebeurt wanneer je model zo aangepast is aan historische data dat het kenmerken oppikt die toevallig in die data zaten, in plaats van werkelijke onderliggende patronen. Het model presteert geweldig op de data waarop het is gebouwd (in-sample), maar valt op zijn gezicht zodra je het op nieuwe data (out-of-sample) test. Bij NFL is dit risico bijzonder groot omdat samples relatief klein zijn — 17 wedstrijden per seizoen per team, en regelmatige roster-mutaties die historische patronen invalide maken.

Survivorship bias is de tweede grote valkuil. Wanneer je naar “winnaars” kijkt — analisten met 60% historische winrate, teams die de afgelopen drie jaar consistent ATS hebben gedekt — bekijk je per definitie de subset die overleefde. De honderden tipsters die dezelfde periode op 40% winrate eindigden en hun account hebben gesloten, zie je niet. Een 60%-winrate over 100 wedden is volledig consistent met een populatie van break-even bettors waarbij toevallige variantie sommigen omhoog en anderen omlaag duwt. De winnaars worden zichtbaar; de verliezers verdwijnen.

Garbage time is een derde valkuil specifiek voor NFL. Plays in laatste minuten van blowout-wedstrijden tellen mee voor totaal-stats maar zeggen niets over werkelijke vaardigheid. Een quarterback die 80 yards verzamelt in de laatste 3 minuten van een 35-7 nederlaag tegen een prevent defence, bouwt nominaal-mooie stats op die in de week erna in mediaverhalen als “ondanks verlies indrukwekkend” worden gepresenteerd. Wie zonder garbage-time-filter werkt, koopt dat verhaal en betaalt voor structureel verkeerde modelinput.

De praktische tegen­maatregelen. Tegen overfitting: bouw je model op een subset van je data en test het op een uitgehouden subset voordat je het toepast. Tegen survivorship bias: vertrouw geen historische track records van tipsters zonder gedetailleerde, openbare logboeken die elke wed in real-time documenteren. Tegen garbage time: filter altijd op situatie (binnen één score-verschil, eerste drie kwarten alleen) voordat je EPA-cijfers of DVOA-vergelijkingen gebruikt.

Wie wil verdiepen in hoe sharp money zich systematisch onderscheidt van public consensus — en hoe lijn­bewegingen die kennis tonen — verwijs ik naar onze diepte­gids over het verschil tussen sharp money en public money in NFL-wedmarkten. Daar gaan we in detail op de specifieke signalen die je in lijn­data kunt herkennen.

Veelgestelde vragen over data-driven NFL betting

Wat is het minimaal aantal weddenschappen om CLV als prestatie-indicator betrouwbaar te interpreteren?

CLV materializeert zich aanzienlijk sneller dan winrate als statistisch betrouwbaar signaal. Vanaf 50 tot 100 weddenschappen wordt het gemiddelde CLV een redelijk betrouwbare indicator van je marktpositionering. Vergelijk dat met winrate, die pas vanaf 300 tot 500 weddenschappen statistisch onderscheidend wordt tussen break-even en winstgevend. De reden is variantie: CLV meet elke wed direct na plaatsing tegen de slotlijn, zonder dat je hoeft te wachten op de wedstrijduitslag, waardoor de gemiddelde meting veel sneller convergeert naar je werkelijke vaardigheidsniveau.

Geeft DVOA early-season betrouwbaardere signalen dan late-season?

Nee, het tegenovergestelde. Early-season DVOA (week 1 tot 4) heeft te weinig sample om de opponent-correctie betrouwbaar uit te voeren — je weet nog niet hoe goed elke tegenstander werkelijk is, dus de correctie zelf is onbetrouwbaar. Vanaf week 4 tot 6 begint DVOA te stabiliseren omdat de opponent-pool zich heeft uitgebreid. Late-season DVOA (week 12 en later) is doorgaans het meest informatie-rijk omdat alle teams elkaar hebben gespeeld via gemeenschappelijke tegenstanders. De uitzondering: roster-mutaties (blessures, trades) maken een deel van die historie irrelevant — een team met een nieuwe starting quarterback in week 10 heeft eigenlijk een nieuwe DVOA-curve die nog niet stabiel is.

Hoe filter ik EPA per play voor garbage time zonder relevante data te verliezen?

De meest gebruikte filter is plays binnen één score-verschil — typisch 8 punten of minder — en alleen in de eerste drie kwarten van de wedstrijd. Dat elimineert de last-minute volume die ontstaat wanneer beide teams hun strategie aanpassen aan de eindscore. Een striktere filter is plays binnen 14 punten in de eerste twee kwarten. Hoe strikter de filter, hoe kleiner het sample, dus er is een trade-off tussen ruisreductie en statistische betrouwbaarheid. Voor pre-game wedbeslissingen gebruik ik de standaardfilter van plays binnen 8 punten in de eerste drie kwarten — dat geeft genoeg sample om team-niveau-patronen te zien zonder de garbage-time-vervuiling die ongecorrigeerde EPA-cijfers misleidend maakt.

Opgesteld door de editors van 'Wedden op nfl'.