Autor Thema: Verbesserte Methoden fuer Renndoppel (auch fuer Matches), EPC-Abschaetzung  (Gelesen 13413 mal)

artie-1970

  • Newbie
  • *
  • Beiträge: 9
Servus zusammen,

endlich ist mein Artikel zu Dopplerentscheidungen in reinen Rennspielen fertig. Meine neue Methode funktioniert aehnlich wie der Keith-Count, ist aber einfacher UND genauer. Sie funktioniert auch in Matches (mit variablem Dopplerfenster) und kann auch fuer extrem kurze Rennen halbwegs sinnvoll missbraucht werden. Ein weiteres Abfallprodukt meiner Untersuchung ist eine Methode fuer die EPC-Abschaetzung, die ebenfalls einfacher UND genauer ist als bisherige Verfahren (z. B. von Joachim Matussek).

Tom Keith war so freundlich, meinen Artikel auf seiner Seite unterzubringen:

   http://www.bkgm.com/articles/Reichert/insights-with-isight.pdf

Oder hier:

   http://www.bkgm.com/articles/page04.html#races

Als Appetithappen findet ihr weiter unten die Abschnitte "Abstract" und "Discussion", die einen Ueberblick geben, was im vollstaendigen Artikel zu finden ist.

Fragen und Kommentaren sehe ich freudig entgegen ...

Tschoe!

Axel

[schnipp]

Abstract

You are an ambitious backgammon player? You like the Keith count, but
wish it were simpler? You like the Keith count, but think it lacks
accuracy? You like the Kleinman count or Trice’s Rule 62, but have no
idea how their accuracy compares with the Keith count? You like the
Keith count, but would prefer a method that gives winning percentages
and works even in match play? You like Bower’s interpolation for the
Thorp count, but like the Keith count better? You like the concept of
the EPC, but have no idea how to calculate it for a complicated
position? You have heard rumors about a “gold standard table”, but do
not want to calculate square roots over the board or distinguish between
long and short races? You want a method for cube handling in races that
can be used for positions with wastage? You want a method for cube
handling in races that can be abused for mutual two-checker bear-offs?

Then you should read this article.

[...]

Discussion

This paper presented a general, parametrized framework for adjusted pip
counts and decision criteria for cube handling in pure races without
contact. The positional features considered for adjusted pip counts were
checkers already borne off, high stacks on low points, gaps on high
points, and crossovers needed before the bear-off starts. For decision
criteria a distinction between long and short races was considered, but
turned out to be unnecessary, since long races are rare. The point of
last take was determined using a denominator and a further shift. In
turn, doubling and redoubling point were shifted from the point of last
take.

Having the framework in place, lower and upper limits for all the
parameters were specified. Two objectives were defined: The total cube
error should be minimized (tested against a database containing the
correct cube actions for around 50000 real life endgame positions), and
the total effort should be minimized (quantified using the total number
of pips added/subtracted by the adjustments). Several multi-objective
optimizations were done using the software solution Isight. First, an
adjusted pip count and a decision criterion were found. The resulting
method for cube handling in races has both a lower effort and error than
existing methods. It can be reasonably used even for cub-offs. It is
crucial that the decision criterion be valid for positions with wastage
in order to match an adjusted pip count successfully. Second, a method
for approximating EPCs was found, with both a lower effort and EPC error
than existing methods. This method is not suitable for cube handling.
Third, a method for approximating CPW was found, with a decision
criterion that resulted in exactly the same cube action as the method
found before.

Indeed, a connection between these two methods was found: The trans-
formation formula describing it can be used to convert any decision
criterion based on a point of last take and a (re)doubling window into
an equivalent method working with percentages. This allows for the use
in match play, for which the percentages will have to be adapted based
on score.

[schnapp]

Wolfgang

  • Hero Member
  • *****
  • Beiträge: 1.772
Hallo Axel,

vielen Dank! Ich hatte gestern abend verzweifelt versucht das Dokument herunterzuladen, ging aber nicht. Diesmal hat alles geklappt.
Ich freue mich auf die Lektüre  :-A

LG
Wolfgang

murshman

  • Sr. Member
  • ****
  • Beiträge: 454
    • Annies Bistro / Parlez-vous Gourmet ?
Hallo Artie, ich habe Deine Formel mal gegen einen alten Klassiker getestet (siehe unten).

Ich rechne für Weiß 45 + 3*2 (für die Steine auf dem ace) + 2*1 (für die Steine auf dem 3er) + 1 + 1 (für die beiden Lücken auf 4 und 6) = 55
Für Schwarz: 60 + 3*1 (für die Steine auf dem deuce) + 1 (für die Lücke auf der 5) = 64

Wenn ich 55 um ein Sechstel erhöhe, komme ich für Weiß auch auf ~64.

Ist die Formel so richtig angewendet? Dann wäre die Stellung aber ein Pass?!



is Player 2

  score: 0
  pip: 60
Unlimited Game
Jacoby Beaver
pip: 45
  score: 0

  is Player 1
XGID=-E-E-E-------------e-e-e--:0:0:1:00:0:0:3:0:10
on roll, cube action?

Analyzed in 4-ply No double Double/Take
  Player Winning Chances: 76,34% (G:0,00% B:0,00%) 76,34% (G:0,00% B:0,00%)
  Opponent Winning Chances: 23,66% (G:0,00% B:0,00%) 23,66% (G:0,00% B:0,00%)
  Cubeless Equities +0,527 +1,054
Cubeful Equities
No double:+0,788 (-0,115)
Double/Take:+0,904
Double/Pass:+1,000 (+0,096)
 
Best Cube action: Double / Take

eXtreme Gammon Version: 2.10

Teilweise wird von Ihnen eine große Gefahr für den Markt Northeim erwartet.

artie-1970

  • Newbie
  • *
  • Beiträge: 9
Servus murshman,

du hast voellig richtig gerechnet, auch wenn ich erst in meinem eigenen Artikel nachlesen musste, wie das mit dem Sechstel ging: Seitdem ich die "Transformationsformel" entdeckt habe, benutze ich immer die Variante, die auch fuer Matches geeignet ist (Abschnitt 8, "Summary", auf Seite 28), die natuerlich exakt die gleichen Dopplerentscheidungen liefert. Testen wir es:

p = 80 - 55/3 + 2*(64 - 55) = 79,66 % > 76 %

Also Redouble, Pass.

Das ist natuerlich falsch (wusste ich auch, denn auch ich habe die Methode fuer diesen "alten Klassiker" getestet). Ich bin mir auch sehr sicher, dass sich sehr viele Positionen finden lassen, fuer die eine gegebene Methode die falsche Dopplerentscheidung liefert, aber das ist hier nicht der Punkt. Wichtig fuer mich ist, dass die Methode fuer eine sehr grosse Bandbreite realer Positionen (50000 auf FIBS aufgetretene Rennen) im Schnitt bessere Ergebnisse liefert und einfacher anzuwenden ist als die Konkurrenz. Und das ist mit harten Zahlen belegt.

Und, ehrlich gesagt, der alte Klassiker ist nett fuer eine Wette, aber ich rechne nicht ernsthaft damit, jemals im Rahmen meines Backgammon-Lebens auch nur einmal in die Naehe einer solchen Position zu kommen. Deshalb habe ich auch die Parameteroptimierung mit Hilfe der FIBS-Datenbank gemacht und nicht mit irgendwelchen vollstaendigen, generierten Datenbanken, die sehr viele fuer die Spielpraxis irrelevante Positionen enthalten. Das hiesse den Schwerpunkt falsch zu setzen, analog wie Rennen laenger als 100 Augen je Spieler eine ziemlich seltene Spezies sind.

Mach also bitte dein Urteil ueber meine Methode nicht an der einen Position fest (nicht, dass du das vorhattest).

Tschoe!

Axel

Dexter

  • Sr. Member
  • ****
  • Beiträge: 400
Hi Artie,
ein toller Artikel und ich hoffe, ich habe bald mal Zeit, den nicht nur zu überfliegen!
Bei der 'Murschman'- Position (grüß dich Udo  :-W) habe ich grad versucht, deine EPC- Formel anzuwenden. Wenn ich da keinen Fehler begangen habe,  ???
müsste da ein Count von 65 für weiß und 70 für schwarz rauskommen, oder? Das wäre dann ja schon wesentlich näher am Ergebnis dran...oder?

artie-1970

  • Newbie
  • *
  • Beiträge: 9
Servus Dexter,

auch du hast richtig gerechnet. Die korrekten EPCs sind laut GNU Backgammon uebrigens 67,3 zu 72,7. Trices Kriterium aus "Backgammon Boot Camp" teilt den EPC durch 49/6 und subtrahiert 3 Augen, macht fuer Weiss knapp 5. Das ist der maximale Rueckstand, den sich Schwarz erlauben darf. Er hat genau 5, also hauchduennes Pass. Ja, ist in DIESER Position naeher an der Wahrheit dran, aber insgesamt funktioniert die EPC-Geschichte VIEL schlechter als meine Methode (Gesamtfehler fuer die Endspieldatenbank 1909 statt 1064). Schon der normale Keith-Count ist mit 1262 deutlich besser.

Tschoe!

Axel

RodGammon

  • DBGV
  • Full Member
  • *
  • Beiträge: 95
Hallo Axel,

 :-A  :-A  :-A
wenn es so etwas wie einen Oscar für Backgammon Theorie gäbe, dann wärst Du 2014 nicht nur nominiert, sondern ein haushoher Favorit auf diese Trophäe. Ausgezeichnete Arbeit!  :-Y

Deine Methode ist:

- für Pipcounts bis 60 Pips anderen Methoden (scheinbar) überlegen
- eineindeutig anwendbar (bei EPC gibt es einen Wastage Estimate von ca 5-8 pips und wenn man nur einen EPC daneben liegt, dann kann die Cube Entscheidung falsch ausfallen. Isight kommt ohne Schätzungen aus und beruht ausschließlich auf Arithmetik)
- eleganter und leichter anzuwenden als EPC
- leicht zu merken (ähnliches Format wie der Keith Count).

Wer bisher OTB EPC anwendet (oder es versucht ;))  und weiß, wie kompliziert das manchmal unter Zeitdruck sein kann, der atmet angesichts der Isight Methode erleichtert auf. Großartig!!!  :-A

Gruß
RodGammon

P.S.: auch bei EPC kann man Stellungen konstruieren, in denen EPC eine falsche Cube Entscheidung liefert. Natürlich funktioniert KEINE vereinfachende Methode in 100% der denkbaren Fälle. Aber was sagt es uns, ein Gegenbeispiel gefunden zu haben, wenn die Methode für die meisten anderen Fälle gut anwendbar ist und zum richtigen Ergebnis kommt und es außerdem keine bessere Methode mit so hoher Eleganz zu geben scheint?
« Letzte Änderung: 16. Juni 2014, 22:09:00 von RodGammon »

negheonegu

  • Hero Member
  • *****
  • Beiträge: 2.871
    • Kunstmüllerei
Sieht sehr interessant aus, danke.

Wenn msn sich sagt ausgespielte checker sind eigentlich auch crossover kann man sogar noch eine Regel sparen  ;)
If everything seems to be going well, you have probably overlooked something

http://www.kunstmuellerei.com/

artie-1970

  • Newbie
  • *
  • Beiträge: 9
Servus RodGammon,

vielen Dank fuer die Blumen.

Die Einschraenkung "bis 60 Pips" kannst du meiner Meinung nach fallen lassen. Und ja, ich fand das Konzept der EPCs zwar elegant, aber nie so richtig praxistauglich. Auf bgonline.org, wo ich den Artikel auch schon angepriesen habe, gab es Kommentare, dass man mit ein paar Referenzstellungen ja schon recht weit kaeme, und der Rest sei dann Abgleich des eigenen Bauchgefuehls mit Hilfe der EPC-Anzeige von z. B. GNU Backgammon. Ich fand das immer unbefriedigend, und das war auch Teil der Motivation fuer mich, meine zugegebenermassen laengliche Untersuchung derart auszubauen ...

Tschoe!

Axel

artie-1970

  • Newbie
  • *
  • Beiträge: 9
Servus negheonegu,

nehmen wir an, du hast noch 2 Felderwechsel, dein Gegner 1. Du hast noch 9 Steine abzutragen, dein Gegner 10. Dann wuerdest du 1 Strafpunkt fuer die Felderwechsel bekommen und dein Gegner 1 Strafpunkt fuer die noch abzutragenden Steine. Du kannst also NICHT Felderwechsel mit abzutragenden Steinen verrechnen, denn sonst wuerde keiner der beiden Spieler Strafpunkte kassieren, da 2 + 9 = 1 + 10. Fuer die CPW-Formel bliebe zwar der Pip-Unterschied gleich, aber die Rennlaenge wuerde anders sein als bei Anwendung der korrekten, im Artikel beschriebenen Methode.

Du kannst also nicht noch eine Regel sparen (wobei ich nicht getestet habe, ob diese Variante nicht sogar womoeglich besser ist). Bei Gelegenheit ...

Danke fuer die Anregung.

Tschoe!

Axel

negheonegu

  • Hero Member
  • *****
  • Beiträge: 2.871
    • Kunstmüllerei
Kleine Frage zu den gaps:

eine Seite gap auf 4 die andere gap auf 5, im Beispiel gibst du jedem einen Strafpip. Un die Formulierung ist ja auch nicht 'ein Strafpip für jedes gap meht als Gegner zwischen 4 und 6 point'

wie wichtig schätzt du es ein die pips beiden Seiten zu geben anstatt sie wegzulassen?
If everything seems to be going well, you have probably overlooked something

http://www.kunstmuellerei.com/

negheonegu

  • Hero Member
  • *****
  • Beiträge: 2.871
    • Kunstmüllerei
Habe mich eben mal mit der Formel an 1000 Cube action begeben
859:
Achtung falscher score soll unlimited sein
         

   

                     
      is Player 2

      score: 5
      pip: 39    
     11 point match      
     pip: 37
      score: 6

       is Player 1    
 
XGID=-EBCBAA------------c--cdd-:1:1:1:00:6:5:0:11:10
on roll, cube action?

 

eXtreme Gammon Version: 2.10


ist jetzt vielleicht ein wenig unfair, andere sind meistens ok oder nur knapp vorbei.

Frage ist ob die nach der Methode falschen Ergebnisse ein Sytem aufweisen.

(Wenn man die Analyse nur über die Fehler laufen lassen würde, welche Formel würde herauskommen und wieviele der Fehler wären damit "behoben"

Hier sind drei checker hinter den gaps und die gap Zahlen spielen direkt auf die Punkte auf denen schon stacks sind.
« Letzte Änderung: 20. Juni 2014, 21:44:04 von negheonegu »
If everything seems to be going well, you have probably overlooked something

http://www.kunstmuellerei.com/

murshman

  • Sr. Member
  • ****
  • Beiträge: 454
    • Annies Bistro / Parlez-vous Gourmet ?
Zitat
...Mach also bitte dein Urteil ueber meine Methode nicht an der einen Position fest...

Hallo Axel,

ich denke, mein Problem liegt darin, dass ich bisher in bezug auf dieses Thema einen anderen Denkansatz verfolgt habe. Etwa folgendermaßen:

Warum brauchen wir überhaupt eine Methode bzw. Formel? Weil es das gibt, was Trice "wastage" nennt: basierend auf der Steinformation (Stacks und Gaps) gehen Pips verloren. Und die besagte klassische Stellung (wo Weiß 45 zu 60, d.h. mit 15 Pips führt und trotzdem der Gegner ein Take hat) war für mich immer der Inbegriff des Konzeptes "Wastage".

Also wähle ich eine Methode, die mit dieser Stellung zurecht kommt (und prüfe erst danach, ob die Methode auch für normale Stellungen funktioniert).

Dein Ansatz, wenn ich Dich recht verstehe, ist dem entgegengesetzt: Du sagst, die Stellung ist so unrealistisch, dass es irrelevant ist, ob die Methode für sie funktioniert oder nicht. Das ist eine interessante Überlegung. Werde darüber nachdenken.







Teilweise wird von Ihnen eine große Gefahr für den Markt Northeim erwartet.

negheonegu

  • Hero Member
  • *****
  • Beiträge: 2.871
    • Kunstmüllerei
Stellung von oben sollte unlimited gewesen sein. Ist auch nicht als Kritik gedacht (keine der anderen Methoden scheint hier zu funktionieren).
Hier funtionierts z.B besser als andere Ansätze:
http://forum.hardyhuebener.de/backgammon/index.php?topic=3470.0

If everything seems to be going well, you have probably overlooked something

http://www.kunstmuellerei.com/

artie-1970

  • Newbie
  • *
  • Beiträge: 9
Servus negheonegu,

Zitat
Frage ist ob die nach der Methode falschen Ergebnisse ein Sytem aufweisen.
(Wenn man die Analyse nur über die Fehler laufen lassen würde, welche Formel würde herauskommen und wieviele der Fehler wären damit "behoben"

Wenn sie ein System aufweisen, dann keines, das in meinem Geruest fuer Justierung/Entscheidung erfassbar waere, denn sonst haette der Optimierer im Rahmen des Designraumes bessere Parameter waehlen koennen. Diese Idee nuetzt also nicht, man muesste das Geruest aendern/erweitern.

Tschoe!

Axel

artie-1970

  • Newbie
  • *
  • Beiträge: 9
wie wichtig schätzt du es ein die pips beiden Seiten zu geben anstatt sie wegzulassen?

Keine Ahnung, habe ich nicht ausprobiert und war auch nicht Bestandteil meines Geruestes. Aber deine Ideen zur weiteren Vereinfachung finde ich interessant, vielleicht lassen sich ja ohne viel Einbusse an Genauigkeit einige Parameter noch zusammenfassen (Crossover und abgetragene Steine, alle Luecken, ...). Kommt auf meine Liste, mal sehen, wann ich sie abarbeite.

Tschoe!

Axel

artie-1970

  • Newbie
  • *
  • Beiträge: 9
Wenn msn sich sagt ausgespielte checker sind eigentlich auch crossover kann man sogar noch eine Regel sparen  ;)

Ja, kostet aber Genauigkeit: Statt 1064 Gesamtfehler liegst du dann bei 1177 Gesamtfehler. Lohnt sich nicht, meiner Meinung nach.

Tschoe!

Axel

artie-1970

  • Newbie
  • *
  • Beiträge: 9
eine Seite gap auf 4 die andere gap auf 5, im Beispiel gibst du jedem einen Strafpip. Un die Formulierung ist ja auch nicht 'ein Strafpip für jedes gap meht als Gegner zwischen 4 und 6 point'

wie wichtig schätzt du es ein die pips beiden Seiten zu geben anstatt sie wegzulassen?

Das habe ich jetzt ausprobiert, kostet fast nichts an Genauigkeit (Gesamtfehler 1068 statt 1064), ist aber deutlich einfacher. Mit anderen Worten: Luecken (4, 5, 6) fuer beide Spieler zaehlen, der, der mehr Luecken hat, bekommt die Lueckendifferenz als Straf-Pips.

Tschoe!

Axel

rawo

  • Hero Member
  • *****
  • Beiträge: 510
    • Backgammon in Aachen
eine frage zur ISIGHT-Formel: bisher habe ich den keith-count verwendet. dort wird abschließend der adjusted pipcount mal ein siebtel genommen, das ergebnis wird dann immer abgerundet. bei ISIGHT wird das ergebnis mal ein sechstel genommen. es gibt keine aussage (es sei denn, ich habe sie überlesen), dass hier ebenfalls konsequent abgerundet wird. demnach wird bei ISIGHT am ende mathematisch korrekt gerundet?
"Ein Leben ohne Mops ist möglich, aber sinnlos..." (in Memoriam Vicco von Bülow)