Tiebreak

clp
Posts: 92
Joined: Tue Jul 10, 2018 14:28
Real name: Kees Pippel
Location: IJmuiden

Re: Tiebreak - AVG 400

Post by clp » Mon Aug 31, 2020 14:30

Ratingsystemen voorafgaande aan het Elo-systeem, b.v. Ingo en Harkness, gedroegen zich (veelal) lineair, volgens Elo rechthoekig. Een bekend systeem, inmiddels min of meer vergeten, is de "regel van 400":

De AVG 400 performance rating voor een toernooi wordt zo bepaald (bron wiki EN):
  1. Per overwinning, de rating van de tegenstander plus 400,
  2. Per nederlaag, de rating van de tegenstander minus 400,
  3. en deel de som door het aantal gespeelde partijen.
Omgekeerd, gegeven een ratingverschil DP, dan is de verwachte score gelijk aan DP / 800 + 50%. Deze formule is een lineaire benadering van de verwachte Elo score. Een DP = 200 geeft 75% als verwachte score (Elo = 75,9%).

De Amerikaanse schaakbond (USCF) gebruikt dit schema ("the old provisional rating formula") nog steeds voor beginnende spelers en spelers met een 0 of 100% score. Zie: Mark E. Glickman & Thomas Doan, The US Chess Rating system, Special rating formula, p.9.

Wat gebeurt er als het ratingverschil groter is dan 400? In dat geval wordt de verwachte score groter dan 100%. De werkelijke score zal altijd minder zijn, met als gevolg ratingverlies. De speler die wint zal ratingpunten verliezen. De speler die verliest gaat erop vooruit. Bijvoorbeeld:
  • X1 --> X3, X2 --> X3, X3 --> X4
Stel nu dat X1 een extra partij speelt tegen X4 en wint, dan zal in de lineaire ratings de extra overwinning bestraft worden. De nieuwe volgorde wordt dan: X2 > X1 > X3 > X4. We kunnen eenvoudig controleren dat AVG 400: 166⅔, 300, -100, -366⅔.

Dit fundamentele gebrek is door Elo gerepareerd door het lineaire verband te vervangen door een S-vormige curve tussen 0 en 100%. In excel: verwacht scorepercentage = NORM.VERD.N(ratingverschil; 0; 2000/7; WAAR).

De volgorde van de AVG 400 rating is gelijk aan de volgorde van recursive buchholz (en de least squares rating).
  • AVG 400 = (lsq * 800) / par (par = 1,2,3 voor schaken, dammen en voetbal respectievelijk).
  • least squares rating = 0.208⅓, 0.375, -0.125 -0.458⅓, par =1

clp
Posts: 92
Joined: Tue Jul 10, 2018 14:28
Real name: Kees Pippel
Location: IJmuiden

Re: Tiebreak

Post by clp » Fri Oct 02, 2020 17:09

x = Vladimir Milshin
y = Russisch kampioenschap 2020
  • rElo..... relatieve Elo rating (Elo - Ch 3.4)
  • lsq...... least squares / recursive Buchholz
  • grs12... generalized row sum
  • f-bets.. fair bets
https://toernooibase.kndb.nl/opvraag/st ... r=21&taal=

Pl                Name N + - Pts  s|Rk rElo|Rk   rBhz|Rk  grs12|Rk f-bets|score
 1 Alexander Getmanski 7 3 0  10  3| 2  283| 2  0.568| 2  4.441| 3  15.42| 2223
 2    Vladimir Milshin 7 3 0  10  3| 1  296| 1  0.608| 1  4.539| 1  16.99| 1111
 3     Ilya Deriglazov 7 3 0  10  3| 3  258| 3  0.513| 3  4.349| 2  16.05| 3332
 4    Sergey Belosheev 7 2 0   9  2| 4  219| 4  0.425| 4  3.077| 4  12.49| 4444
 5       Ivan Trofimov 7 3 2   8  1| 5   90| 5  0.179| 5  1.399| 8   2.94| 5558
 6         Igor Pavlov 6 1 1   6  0| 6   79| 6  0.117| 7  0.205| 6   5.38| 6776
 7       Evgeni Gurkov 6 1 1   6  0| 9 -122| 9 -0.211| 8 -0.503| 7   3.56| 9887
 8   Aleksei Bolshakov 6 1 2   5 -1| 8  -98| 8 -0.211| 9 -1.532| 9   1.83| 8999
 9 Alexander Rastegaev 7 1 1   7  0| 7   60| 7  0.115| 6  0.426| 5    6.1| 7665
10   Anatoli Tatarenko 6 1 3   4 -2|11 -249|11 -0.497|10  -3.24|10   1.36| bbaa
11      Dmitry Valikov 6 1 3   4 -2|12 -263|12  -0.53|11 -3.391|11   0.86| ccbb
12      Vasiliy Markin 6 1 4   3 -3|10 -185|10 -0.418|12 -4.105|13   0.39| aacd
13   Alexandr Chekeyev 6 0 4   2 -4|13 -368|13 -0.657|13 -5.664|12   0.62| dddc
14               Dummy 0 0 0   0  0|14     |14       |14       |14       | eeee

==> Unaniem voor Vladimir, met dank aan zijn overwinning op Igor Pavlov.
Last edited by clp on Thu Oct 08, 2020 23:44, edited 1 time in total.

clp
Posts: 92
Joined: Tue Jul 10, 2018 14:28
Real name: Kees Pippel
Location: IJmuiden

Re: Tiebreak - Zelfconsistent en monotoon

Post by clp » Mon Oct 05, 2020 11:28

Het tiebreaksysteem kent aan alle spelers een tiebreakrating toe. In de context van een tiebreaksysteem noemen we een speler X1 zwakker (<), even sterk (=) of sterker (>) dan X2, als de rating van X1 kleiner, gelijk of groter is dan de rating van X2.

X --> Y betekent: X wint van Y.
X <-> Y betekent: X wint van Y en Y wint van X.

Zelfconsistentie (SC) van een tiebreaksysteem komt neer op het volgende (zie: preferences, p.2).
Stel dat twee spelers een zelfde aantal partijen in een toernooi hebben gespeeld en de eerste speler:
  1. behaalt een beter resultaat tegen even sterke of sterkere tegenstanders of
  2. behaalt tegen sterkere spelers een gelijk resultaat
dan moet de eerste speler hoger worden geplaatst dan de tweede speler in de ratingvolgorde.

Om naast zelfconsistent ook monotoon (SCM) te zijn, is het vereist dat als de eerste speler uitsluitend extra "overwinningen" behaalt en / of de tweede speler uitsluitend extra "verliezen" heeft, dan moet de eerste speler hoger blijven dan de tweede speler in de rating-volgorde.

Een ratingsysteem is niet-SCM als er tenminste één tegenvoorbeeld bestaat.
Omgekeerd, als er geen tegenvoorbeeld bestaat dan is de ratingmethode consistent en monotoon.
  1. Relatieve Elo-rating op een ondeelbaar domein, en de GRS-methode voldoen aan SCM.
  2. Directe methoden, zoals wedstrijdpunten, Buchholz en SB zijn tamelijk ongevoelig voor de kracht van de tegenstander en daarom onverenigbaar met zelfconsistentie.
  3. Recursieve buchholz, AVG 400 en de least-squares-methode voldoen aan zelfconsistentie, maar zijn niet monotoon. Als het ratingverschil groot genoeg is dan wordt winst beloond met ratingverlies, en verlies met ratingwinst.
  4. De Fide performance rating (Rp) wordt bepaald op basis van de gemiddelde tegenstanderrating. Een lage rating van een tegenstander kan de gemiddelde rating zover naar beneden halen, dat een overwinning daar niet tegenop kan wegen.
  5. Hetzelfde effect zien we in het moyenne systeem: overwinningen tegen spelers met een zwakker moyenne kunnen bestraft worden met verlies.
Nietmonotoon, verlies door winst

X1 --> X3,
X2 --> X3, X3 --> X4 (zie: fusion fig5).

De SCM-tiebreakvolgorde is gelijk aan: X1 = X2 > X3 > X4.
De AVG 400-rating is gelijk aan: 300, 300, -100, -500.

Stel nu dat X1 een extra partij speelt tegen X4 en wint. Als gevolg van deze overwinning duikelt X1 naar de tweede plaats en schuift X2 op naar de eerste plaats. De bijbehorende AVG 400-rating is gelijk aan: 167, 300, -100, -367. De winnaar verliest en de verliezer wint ratingpunten.

Dit onrecht wordt hersteld als ook X2 van X4 wint:
De AVG 400-rating wordt: 200, 200, -100, -300. Alle lineaire ratingen zijn behept met dit euvel. Elo heeft dit probleem opgelost door de "rechthoekige" verwachtingsfunctie te vervangen door een s-vormige kromme tussen 0 en 100%.

Wedstrijdpunten voldoen niet aan SCM
 
    X1     X2
    |      |
    v      v
    X3 --> X4

De wedstrijdpuntenvolgorde is gelijk aan: X1 = X2 = X3 > X4 (zie: fusion fig3).

Er geldt:
X1 > X2: X1 en X2 hebben beiden gewonnen. De tegenstander van X1 (X3) is sterker dan de tegenstander van X2 (X4).
X1 > X3: de tegenstander van X1 (X3) is sterker dan de tegenstander van X3 (X4). X3 heeft verder uitsluitend verloren.
X2 > X3: X2 en X3 hebben beiden gewonnen van X4, maar X3 heeft verder uitsluitend verloren.

Dit is in tegenspraak met X1 = X2 = X3.

De SCM-volgorde is gelijk aan: X1 > X2 > X3 > X4.

SCM: geen tegenvoorbeeld
Indien X1 --> X2 --> X3 --> X1 dan geldt X1 = X2 = X3.

Een rondtoernooi heeft een unieke SCM-volgorde

    X1 <-> X3    
    |      ^
    v      |
    X2 ----+


In dit voorbeeld is de unieke SCM volgorde is gelijk aan: 1,2,3 voor X1, X2, X3 achtereenvolgens.
We kunnen dit (informeel) als volgt inzien: we voegen voor iedere speler een remise tegen zichzelf toe. Nu hebben alle spelers dezelfde tegenstanders ontmoet. De SCM volgorde is gelijk aan de volgorde van de wedstrijdpunten.

De SCM volgorde is niet per definitie uniek
Stel nu dat X2 in het vorige voorbeeld een twee extra partijen speelt tegen X3 en wint.

Pl Nn |  X1  X2  X3| N + = - P  s| Rk rElo| Rk  GRS0| Rk GRS3| Rk   GRS6 | 
 1 X1 | xxx   2 1  | 2 1 1 0 3  1|  1  153|  1  21/7|  1    2|  2   65/39| 
 2 X2 | 0   xxx 222| 4 3 0 1 6  2|  2   85|  2  12/7|  1    2|  1   80/39| 
 3 X3 | 1   000 xxx| 4 0 1 3 1 -3|  3 -238|  3 -33/7|  3   -4|  3 -145/39|
 
We zien drie toegestane SCM-volgordes:
(1) X1 > X2 > X3 (GRS, epsilon = 0, y = 9, =LSQ = rBhz = AVG 400)
(2) X1 = X2 > X3 (GRS, epsilon = 3, y = 12)
(3) X1 < X2 > X3 (GRS, epsilon = 6, y = 15)

Relatieve Elo op een deelbaar domein is niet strikt monotoon
Stel X1 en X2 winnen van X3. Dan zijn X1 en X2 "oneindig" sterker dan X3. Meer overwinningen voor X1 of X2 tegen X3 voegen niets toe.

Referenties
Pavel Chebotarev & Elena Shamis, From Incomplete Preferences to Ranking via Optimization, arXiv:math/0602552v1, 1997.
Pavel Chebotarev & Elena Shamis, Preference fusion when the number of alternatives exceeds two: indirect scoring procedures, arXiv:math/0602171v3 , 1999.

clp
Posts: 92
Joined: Tue Jul 10, 2018 14:28
Real name: Kees Pippel
Location: IJmuiden

Re: Tiebreak - Recursive Buchholz

Post by clp » Tue Oct 13, 2020 09:52

clp wrote:
Wed Jun 19, 2019 11:25

Calculation:
s ............. Score percentage - 50% (plus-score percentage)
Eenvoudiger is het om de bepaling van scoringspercentage aan te passen:

Let
N ............ Number of games
s ............ aggregate skew symmetric score
Rb ........... Recursive Buchholz ratings
RbOpp ...... Average Opponents Rb-ratings
vectors indexed by players.

Rb is a solution of:

Rb = RbOpp + s / N
ΣRb = 0

Op deze manier gedefinieerd is de recursive Buchholz (rBhz) de helft van aan de least squares rating.

Stel we bepalen de recursieve Buchholz rating (rBhz') op basis van het score percentage - 50%, in plaats van s / N.

Als de uitslagen optellen tot een constante , bijvoorbeeld 2-0, 0-2, 1-1 of 1-0, 0-1, ½-½ dan heeft dat geen effect op de volgorde: rBhz is rechtevenredig aan RBhz' met een factor gelijk aan de maximale score, schaken = 1, dammen = 2.

Echter bij voetbal uitslagen, 0, 1, 3, ontstaat er een verschil zoals uit het volgende voorbeeld blijkt:

 Cross tab.| Skew Sym.|N Pt  s  |  %± s/N |Rbhz  rBhz'|lsq|
  A . 1 3  |  . 0  1½ |2  4  1½ | 1/6 3/4 | 1/2  5/27 | 1 |
  B 1 . 1  |  0 .  0  |2  2  0  |-1/6  0  |  0  -1/27 | 0 |
  C 0 1 .  |-1½ 0 .   |2  1 -1½ |-1/3 3/4 |-1/2 -4/27 |-1 |


Post Reply