Pre-Pondering Visions

Démarré par quentin, 23 Juillet 2010, 14:02:50

« précédent - suivant »

quentin

Suite au thread ANT et à la sortie de preordain, j'ai eu envie de valider "mathématiquement"  ce qui n'était juste la qu'une impression sur la comparaison des cartes ponder, preordain et serum visions, dans le role de "card quality engine".

Ca donne ca :



Gné ? Me direz vous.
Ca se lit comme ca :
A gauche, les différentes possibilités concernant les 3 cartes du dessus de la libal.
B = bad = "mauvaise" carte
G = good = "bonne" carte
C'est une approche volontairement simpliste de considérer qu'il n'y a que des cartes soit bonnes soit mauvaises.

Ensuite, pour chaque carte, dans la première colonne, ce que l'on se retrouve à tirer comme cartes parmi ces 3, les cartes inconnues étant remplacées par des ?.
Pour ponder, il y a 2 colonnes, l'une supposant qu'on n'a pas de shuffle effet à disposition, l'autre que oui. Encore une fois dans un souci de simplification, j'ai assumé qu'on ne shufflait avec ponder que dans un cas de 3 mauvaises cartes.

J'ai différencié 2 optiques : une optique de filtrage, c'est à dire dans un contexte de card quality, ou on considère qu'environ 50% des cartes dans le deck sont bonnes, et une optique de recherche, dans un contexte de combo ou besoin de solution, ou on considère qu'environ 20% des cartes dans le deck sont bonnes.

J'ai ensuite "scoré" le triple tirage, en donnant 2 points à une bonne carte tirée en premier, 1 point à une bonne carte tirée en 2 ou 3, 0 à une mauvaise carte, puis 0.2 ou 0.5 à une carte au hasard selon l'optique considérée (recherche ou filtre), le double si tirée en premier.

Enfin, j'ai encore une fois selon l'optique calculé les probabilités d'occurence des répartitions de 3 cartes évaluées. Je n'ai pas pris en compte la légère différence de probabilité induite par le fait qu'on replace une carte en dessous du paquet par rapport à shuffler.

Au final, en multipliant le score de chaque ligne par sa probabilité, on obtient une sort d'espérance mathématique moyenne de ce qu'on peut piocher se la carte et la configuration. Pour finaliser le tout, j'ai combiné le ponder sans shuffle effect avec le ponder avec shuffle effect, en estimant qu'on disposait du shuffle effect dans 30% des cas en type 1 entre les fetches et les tutors.

On obtient :

En mode filtre (50% de bonnes cartes) :
1. Ponder shuffle 3.19
2. Preordain 2.88
3. Ponder mix 2.79
4. Serum visions 2.63
5. Ponder no shuffle 2.62

En mode search (20% de bonnes cartes) :
1. Ponder shuffle 1.68
2. Ponder mix 1.55
3. Ponder no shuffle 1.50
4. Preordain 1.42
5. Serum visions 1.12

Je laisse chacun tirer les conclusions de cette petite analyse, même si dans l'ensemble preordain semble tout à fait comparable à ponder et un bon cran au dessus de serum visions. Je suis preneur de toutes remarques /suggestions sur la méthodologie.

lowkick

Citation15:23:33 ‹CwaM› on a vu Loic se péter sa propre rod
15:23:42 ‹CwaM› c pas un play débile qui confirme un fait
Citation‹Watanabe› sinon, je mange pas de champignons, ca me rend malade :(
28/10/2010 16:18:03 ‹Watanabe› (les vrais champi je parle)
28/10/2010 16:18:14 ‹Watanabe› (note que meme les faux comme Toad me rendent aussi malade :p)
Citation05/11/2010 14:58:51 ‹CwaM› je me dois de plussoyer Loic
Citation18/11/201010:20:42 ‹nicofromtokyo› stoi l'origine du monde.

Watanabe

Merci pour l'analyse Quentin, j'ai trouvé ca super intéressant.

Je pense que le raisonnement est très bon, je mettrai juste 2 réserves sur lesquelles malheureusement l'espérance mathématiques ne va pas beaucoup aider :
- Dans quel jeu les 3 cartes sont jouées. Le role est vraiment différent, par exemple pour du legacy dans TT tu joues Ponder très souvent pour chopper ton 2nd land.
- Ce point que tu énumères et sur lequel malheureusement tu ne peux rien :
CitationEncore une fois dans un souci de simplification, j'ai assumé qu'on ne shufflait avec ponder que dans un cas de 3 mauvaises cartes.

Néanmoins, merci pour l'étude j'ai trouvé ca vachement bien !  :wub:
Le site de la GT Team :
http://www.team-gt.com/site/


European Eternal Reference : Eternal Central !

astre

membre du fan club des tachikoma
http://fr.wikipedia.org/wiki/Tachikoma

quentin

#4
Citation- Dans quel jeu les 3 cartes sont jouées. Le role est vraiment différent, par exemple pour du legacy dans TT tu joues Ponder très souvent pour chopper ton 2nd land.

Ben justement, c'est pour ca que j'ai distingué l'option "filtre" et l'option "search".
Dans un controle, controle/combo, ou un aggro/controle legacien, c'est l'option "filtre" qui nous intéresse. Le ponder-like est dans ce contexte utilisé pour lisser la sortie, en allant chercher la land qui manque, un counter de plus, etc., ou en mid game, en filtrant out les lands excédentaires.
L'option search correspond à une approche combo (type ANT), ou au mode pompier d'un controle (ou est mon STP).
Alors ok 50% et 20%, c'est des choix empiriques pas forcément bien représentatifs de toutes les situations, mais le but ici n'est pas d'avoir une estimation au millimètre de la valeur des cartes, mais plutot de ce rendre compte d'ou se situe d'une manière générale preordain entre ponder et serum visions. Et je pense que ca montre quand même qu'on est nettement plus près de ponder, ce qui constitue un encouragement à explorer les possibilités autour des archétypes jouant ponder+preordain.

Citation- Ce point que tu énumères et sur lequel malheureusement tu ne peux rien :
Citation
Encore une fois dans un souci de simplification, j'ai assumé qu'on ne shufflait avec ponder que dans un cas de 3 mauvaises cartes.

En fait c'est une conséquence logique de la méthode de scoring.
GBB = 2 points.
Shuffle = ??? = 2 points en mode 50%, moins si mode moins de 50%, donc c'est mathématiquement dans cette approche de scoring inintéressant de shuffler.

Deathknight

Très intéressant. Cela donne une bonne idée de l'efficacité relative.
Je vais m'acheter un Preordain :-)
Le site de la GT Team :
http://www.team-gt.com/site/

neonico

C'est pas une critique hein, je précise de suite. Juste une précisions maintenant que j'ai commencé à playtester avec Preordain.

J'ai quand même l'impression que overall, ce modèle mathématique d'évaluation est loin de la réalité. En pratique, pour avoir pas mal joué les deux dans un deck, j'ai v raiment pas l'impression qu'on puisse évaluer à 1à à 15% la différence des deux en faveur de Ponder, tant j'ai quasi toujours préféré preordain.

Ceci étant, l'approche est très interressante, et ça prouve au minimum que la carte est aussi bonne (à part dans un cas de figure)


CitationYes,Tarmogoyf is probably better than Chameleon Colossus, but comparing it to Tarmogoyf is like comparing your girlfriend to Carmen Electra - one's versatile and reliable, the other's just big and cheap.(And you'd run both if you could get away with)

Citation de: Question posée au Ask The Judge
Q: I have Ashnod's Coupon, which says that it is invalid in Quebec in the flavor text. Can I still use it in Quebec? I think so, because flavor text is not rules text, but my friend disagrees.

Citation de: SubwarBF le 13 Juillet 2009, 19:59:15
R.I.P Nico, c'était lui le plus grand, pas ce pédophile de Michael

Blog Magic Eternal : http://magiceternal.wordpress.com/

belcherized

Merci Quentin, intéressante analyse.
J'ai été à l'essentiel, j'ai regardé d'abord les pourcentages finaux ;)
Même si c'est difficile de mathématiser les différences entre les cartes, tout a l'air de prouver que Preordain se trouve au final assez proche de Ponder (soit un peu mieux dans certains contextes, et parfois juste un peu mois bon), et ça, c'est une très bonne nouvelle :P

Célien, tu peux ranger tes Serum Visions dans le carton;)...
Le meilleur site de Magic94 (Oldschool) :
http://www.oldschool-mtg.blogspot.fr/

Toad:
"Je pense que Flash avec Reveillark est le meilleur deck construit de l'histoire de Magic. J'ai joué Long avec 4 Burning Wish et 4 Lion's Eye Diamond, Stax avec 4 Trinisphere, Academy avec 4 Tolarian Academy, Jar avec 4 Memory Jar, Slurpy avec 4 Mind's Desire ...

A côté de Flash, on dirait des decks Bloc."

nicofromtokyo

On pourrait avoir la même chose avec des mots à la place des chiffres?  :oops:

En gros: Ponder>Preordain>Serum.

Est-ce que tu as tenu compte du fait que Preordain était dispo en 4 et Ponder seulement en 1? Une bonne carte en x4, c'est presque mieux qu'une très bonne carte en x1, non?

quentin

@nico : mon but était justement d'étayer ou de démystifier des impressions par une approche rigoureuse.
Ce qui serait intéressant ce serait de voir à quels cas correspondent ceux ou tu trouves que preordain est mieux que ponder dans la pratique, et dans quel contexte en termes de jeu cela s'inscrit.

Typiquement je suis parti sur une optique de 30% de chances d'avoir un shuffle effect, ce qui est relativement propre au T1. En plus des fetchs, il y a tous les tutors qui viennent s'ajouter à la panoplie des options de shuffle, ce qui donne un pourcentage assez élevé. Clairement, moins le deck contient de shuffle effects, plus ponder est tiré vers le bas.
De même, le cas ou ponder est le plus à son avantage, est celui ou aucune des 3 cartes ne convient. Ce cas varie beaucoup en fonction de combien de cartes on jugerais "bonnes" dans son deck, comme le montre le tableau, cela fait seulement 10% des cas quand 1 carte sur 2 est bonne, mais cela en fait 50% des cas quand 1 carte sur 5 est bonne. Donc clairement également, plus le deck est dans une optique controle / de filtrage, par opposition à une optique de recherche / creusage, et moins ponder a d'avantages sur preordain.

Enfin, je le redis, la méthode de scoring est forcément prone à l'approximation, on est bien rarement dans un modèle ou les cartes sont soit très bonnes soit très mauvaises, et on a plein de niveaux de gris, qui vont influencer les choix qu'on fait sur les 2/3 cartes qu'on voit, et selon le contexte altérer lequel des cantrips aurait été le plus adapté.

@NFT : heu je pige pas bien ou les chiffres t'empechent la lecture ?
Au pire tu regardes juste le classement final, c'est avec des chiffres mais je t'aide, c'est dans l'ordre du mieux au moins bien ;).

nicofromtokyo

Et Brainstorm dans tout ça?

neonico

En fait quentin, je pense que la faiblesse de ce modèle mathématique, et ce qui fait que tu arrives à ce résultat notamment dans les cas GBB et BGB est que tu ne tiens pas compte de la vitesse ou tu vas revoir d'autres cartes. Dans ces 2 cas de figure, le score de filter de preordain devrait être supérieur à celui de ponder, ors il ne l'est pas.


CitationYes,Tarmogoyf is probably better than Chameleon Colossus, but comparing it to Tarmogoyf is like comparing your girlfriend to Carmen Electra - one's versatile and reliable, the other's just big and cheap.(And you'd run both if you could get away with)

Citation de: Question posée au Ask The Judge
Q: I have Ashnod's Coupon, which says that it is invalid in Quebec in the flavor text. Can I still use it in Quebec? I think so, because flavor text is not rules text, but my friend disagrees.

Citation de: SubwarBF le 13 Juillet 2009, 19:59:15
R.I.P Nico, c'était lui le plus grand, pas ce pédophile de Michael

Blog Magic Eternal : http://magiceternal.wordpress.com/

quentin

Citation de: neonico le 25 Juillet 2010, 10:52:56
En fait quentin, je pense que la faiblesse de ce modèle mathématique, et ce qui fait que tu arrives à ce résultat notamment dans les cas GBB et BGB est que tu ne tiens pas compte de la vitesse ou tu vas revoir d'autres cartes. Dans ces 2 cas de figure, le score de filter de preordain devrait être supérieur à celui de ponder, ors il ne l'est pas.

Heu si bien sur, dans le cas de ponder sans shuffle c'est évalué à GBB = 2pts, dans le cas de preordain à GB? = 2.5 / 2.2 pts (selon le scoring d'une carte inconnue).
Donc le fait que tu vois une carte de plus plus rapidement est assimilé dans le modèle.
Après on peut discuter a combien une carte inconnue devrait être évaluée, mais ca me semble logique de l'évaluer à la valeur de son taux de présence dans le deck.

CitationEt Brainstorm dans tout ça?

BS est clairement très au dessus des autres, sans même tenir compte du fait qu'il soit instant. Je ne l'ai pas inclus dans le modèle pour cette raison et car il est aussi dépendant des cartes que tu as en main.

neonico

Jdis de la merde, j'ai pas vu que tu trouves Preordain > Ponder Mix, autant pour moi.


CitationYes,Tarmogoyf is probably better than Chameleon Colossus, but comparing it to Tarmogoyf is like comparing your girlfriend to Carmen Electra - one's versatile and reliable, the other's just big and cheap.(And you'd run both if you could get away with)

Citation de: Question posée au Ask The Judge
Q: I have Ashnod's Coupon, which says that it is invalid in Quebec in the flavor text. Can I still use it in Quebec? I think so, because flavor text is not rules text, but my friend disagrees.

Citation de: SubwarBF le 13 Juillet 2009, 19:59:15
R.I.P Nico, c'était lui le plus grand, pas ce pédophile de Michael

Blog Magic Eternal : http://magiceternal.wordpress.com/

La Divine Mandarine

Citation
On obtient :

En mode filtre (50% de bonnes cartes) :
1. Ponder shuffle 3.19
2. Preordain 2.88
3. Ponder mix 2.79
4. Serum visions 2.63
5. Ponder no shuffle 2.62

En mode search (20% de bonnes cartes) :
1. Ponder shuffle 1.68
2. Ponder mix 1.55
3. Ponder no shuffle 1.50
4. Preordain 1.42
5. Serum visions 1.12

Je laisse chacun tirer les conclusions de cette petite analyse, même si dans l'ensemble preordain semble tout à fait comparable à ponder et un bon cran au dessus de serum visions. Je suis preneur de toutes remarques /suggestions sur la méthodologie.

Je comprends rien du tout à ces chiffres. Le 3,19 après "ponder shuffle" par exemple, ça correspond à quoi ?
"Je connais ce style. C'est MON style."

Premiers signes...