モンテカルロ法による相手の得点予想

戻る

1.はじめに

モンテカルロ法で相手の得点を予想する。

2.プログラム内容

仕組みは単純で、場の状況からランダムに相手のあがり形を作り点数を計算、平均を取る。 シュンツ、コーツの比率は4:1にした。 実際に作ってみたところ染め手を表現出来ない事がわかった。 染め手っぽい相手は染め手の確率が高いはずだが、ランダムのため染め手以外も評価してしまい、結果低い点数を見積もっていた。 そこで「捨て牌のプラスマイナス3牌を含むメンツは構成しない」というルールを設けた。 そうすると染め手っぽい相手にはちゃんと染め手を構成する確率が上がった。 しかしこの縛りは厳しすぎて、1回もあがり形を構築できない場合があった。 そこで次のようにした。 ・「捨て牌のプラスマイナス3牌を含むメンツは構成しない」というルールで100回モンテカルロ ・「捨て牌のプラスマイナス2牌を含むメンツは構成しない」というルールで100回モンテカルロ ・「捨て牌のプラスマイナス1牌を含むメンツは構成しない」というルールで100回モンテカルロ ・「捨て牌を含むメンツは構成しない」というルールで100回モンテカルロ ・上記の平均得点を計算し結果とする

3.実験

鳳凰卓の牌譜からロンあがりの局面を抽出し、平均二乗誤差(誤差の偏差)を求めた。 局面数は976になった。 ・結果 誤差平均=3292.198 平均二乗誤差=3000 真値平均=4020.923 真値偏差=3166.692 これが良いのか悪いのかわからない。 というのも、爆打の論文(http://www.logos.ic.i.u-tokyo.ac.jp/~mizukami/paper/GPW_paper_2014.pdf の6.3 得点の予測の精度)でも平均二乗誤差を用いているのだが 評価値 上級者:0.40 論文:0.37 となっている。評価値って何ですのん。教えてぇ>爆打の人とか

4.課題

・手出しの考慮。手出し牌の側の牌は手に使われている確率が高いはずである。 ・序盤、中盤、終盤の考慮。序盤で切られた牌の周辺の牌は手に使われている確率が低いはずである。 ソースバックアップ
inserted by FC2 system