サイトコンテンツ
役立ち情報&ご案内
アクセスランキング
波でネットリンク集
波でネット競馬情報局
IPATより便利な即PATの投票
相互リンクのご案内
問い合せ
競馬情報
全国の競馬場を上空から
■東京競馬場 ■阪神競馬場
■中山競馬場 ■京都競馬場
■全国版は
波でネット無料競馬情報
競馬関連リンク
JRA日本中央競馬会
競走馬のふるさと案内所
競走馬理化学研究所
日本競走馬協会
おもしろリンク
3人の男達
『胃ケイレンオッズなんて・・・そんな胃の痛くなる奴のおかげでなぁ・・・』
本格的競走馬育成ゲーム!
無料でオンライン シュミレーション
ワンセグ携帯受信チューナー
競馬中継&情報を
いつでも、どこでも携帯端末で
生活応援サイト「ただTEL」はおトクがいっぱいのサイトです
大迫力・大画面で競馬中継!
超小型ヘッドマウントディスプレイ『DV920 Video Eyewear』
2メートル先に42インチ相当の大画面 3D(立体映像)も楽しめます。本製品は2006年1月ラスベガスで開催されたCES(コンシューマエレクトロニクスショウ)で優秀賞を受賞
水中でも聴けるMP3
FMチューナー搭載・FM録音対応
★お得なキャンペーン実施中!
[本]アイデアのつくり方
ソフトの検証
Zソフトの検証
├ 回収率の評価
├ 回収率の分泌
├ 過去分析→未来予測
└ 検証方法
予想ソフトを検証していると、過去のデータ(成績)にはよくあてはまるが、今後のデータにはあまりあてはまらないという傾向がどうしても必ずでてきます。
過去のデータで検証してみると回収率150%なので、実際に馬券を買ってみると、回収率80%にしかならなかった、という経験はありませんか?
これは「新しい法則」が過去のデータに対して最適化されているためですね。
これは避けようのないことです。
過去の成績を細かくモデル化しすぎたため、「過去のデータにだけうまく適合する」ということになってしまうわけです。
だから推計学では一般に、できるだけ少ないパラメータで表現できるモデルがよいモデルだといわれているそうです。
ところが、競馬予想で高い回収率を実現しようとすれば、どんなロジックにせよ、ある程度パラメータが増えてしまいますね。
したがって、予想法の開発段階での検証の場合、特に危険率を低くして慎重に検証する必要があります。
本題
【1】回収率の評価
ある予想方法によって月間の回収率が150%をマークしたとして、その予想方法で今後100%超の回収率を維持できるという保証はありません。
次の月には回収率はがくんと落ちたりして、年間では回収率100%を割ってしまうということは当然考えられます。
月間150%という実績があっても、サンプル数としては充分ではなかったということです。
それでは3ヶ月ならいいのか、半年ならいいのか、ということになると、なかなか明確な答えはできないというのが現状です。
また反対に、新しい予想ロジックを考えだして運用したとして、1ヶ月間の回収率が80%にしかならなかったとすると、普通は「この方法はうまくいかない」と判断するでしょう。
しかし、次の月には回収率150%をマークする可能性があるわけです。
これらは、どちらも大雑把な勘に頼って予想方法のよしあしを判断していることに問題があると考えます。
たしかに問題は複雑で、同じ月間150%といっても、万馬券を一発あてたことによる150%のときと、地道に馬券を当て続けて150%の回収率をマークしたときとでは信頼性が当然違ってきます。
こういう問題も含めて、統計理論の力を借りて科学的に回収率を検定する方法を考えてみました。
@回収率の検定
統計学の本によりますと、n回の試行のうち確率Pで起こった事象の、真の確率は
平均 P
標準偏差 平方根(P(1 - P)/n) の正規分布になります。
馬券の話に置き換えてみると、ある人が馬券を100回買ったとして、的中率が10%だったとすると、この人の買い方の本当の的中率は、平均が10%、標準偏差が3%(=平方根(0.1(1 - 0.1)/100))の正規分布をしているということです。
正規分布では、平均値±標準偏差×2の範囲に全体の95.4%が含まれることがわかっているので、この人がずっとこの方法で馬券を買い続けた場合には、通算的中率は4%〜16%のあいだであることを95.4%の確からしさで推定できます。
的中率の分布と、回収率の分布は正比例すると考えれば、この公式を変形して回収率の推定に応用することができます。
ある予想方法で、n回馬券を買ったとして、的中率はpで、回収率はk%だったとすると、
((K - 100)/K) - (2 * 平方根(P(1 - P)/n)) が正のときには、
真の回収率が100%を超える
((K - 100)/K) + (2 * 平方根(P(1 - P)/n)) が負のときには、
真の回収率が100%を超えることはない
以上の推定は97.7%の信頼度があります。
ただし、この式があてはまるためには、nが充分大きく(100以上)、買う馬券の倍率があまり差がない(たとえば1000円前後の配当の馬券ばかりねらった結果なら可)ことが必要です。
実際には、300円くらいの馬券から万馬券までねらう馬券の幅は相当ありますからこの式をそのまま採用することは現実的ではありませんが、基本的な考え方という意味では大きな間違いはないはずなんですが。
たとえばA、B、Cの3つの予想法があって、以下の成績だったとします。
予想法 馬券購入数 的中率 回収率
A 200 10% 170%
B 500 5% 160%
C 1000 15% 120%
この結果を公式にあてはめて100%を超える予想法かどうかを検証すると、真の回収率が100%を超えると判定できるものは、Cだけとなります。
真の回収率が100%を超えるかどうかを検定する方法について書きましたが、的中率を4%〜16%というように幅をもって推定したように、同じく回収率も幅をもって推定することが可能です。
たとえば、15倍のオッズの馬券のみを100回買って、そのうち10回が的中したとします。この場合、的中馬券はみな15倍の配当ですから、回収率は150%となります。
100回の試行で的中率10%の場合は、前に述べたように推定母集団の的中率は4%〜16%と区間推定できます。
今後同じ方法で15倍の馬券を買い続けたとすると、100回のうち最低4回は的中し、うまくすると16回くらいは的中するということですから、4回しか当たらなかった場合の回収率は60%、16回あたれば回収率は240%になります。
つまり、回収率を60%〜240%と、区間推定することができるわけです。
この場合、最低の回収率が100%を下回っていますから、必勝法とは判定できない
という結論を得ることができます。
回収率の区間推定値はつぎのように計算できます。
試行回数をn、的中率をp、回収率をk%とすると、
真の回収率=k × (p ± 2×平方根((1−p)×p/n) )/p
式の中の"2"は、信頼水準95.4%で推定する場合の定数で、信頼水準が90%でよいのなら、2のかわりに1.645を使います。また99%の信頼水準を求めるのなら、定数は2.58となります。
このやりかたで、真の回収率を区間推定すれば、新しい予想方法を開発する際にも助けになります。
たとえば、ある種牡馬の産駒について過去の単勝馬券成績をしらべたところ、短距離では回収率が120%というデータを得たとします。
そこで、このデータは意味のあるデータなのかどうか、ということを区間推定によって検定するわけです。
そうして真の回収率の区間推定値をもとめたところ、85%〜155%という結果が得られたとします。
最低値が100を割っていますから、これだけをもって必勝法とすることはできませんが、最低値の85という数値は単勝馬券の平均回収率の80%を超えていますから、まったく無意味なデータではなさそうだということがわかり、この馬の産駒の短距離はプラスファクターとして評価してよいことになります。
また、別の馬の産駒は短距離で60%の回収率しかなかったとします。
そこでこの馬は短距離では消し、という評価をくだすことが可能でしょうか。
この馬の回収率推定値を計算したところ、30%〜90%でした。
すると、このケースでは最高値が80%を超えていますから、「この馬の産駒は短距離は消し」という仮説はあまり信用できないということがわかるのです。
予想ソフトの能力をはかる指数としても、単勝回収率区間推定値の最低値を採用すると、かなり客観的に評価することができます。
最低回収率が高いほうがよりよいソフトです。最低でもの回収率は期待できるわけですから。もちろん必勝法というからには最低回収率が100%をこえていなければなりませんが、これはやはりなかなか難しいですね。
本命系の予想ソフトで高い回収率をマークするものはあまりないといわれるのは、的中率が高くなると推定回収率のばらつきが小さくなることが原因です。
的中数 馬券数 的中率 回収率 回収率区間推定値
穴系ソフトA 50 500 10% 120% 88%〜152%
本命ソフトB 100 500 20% 105% 86%〜124%
上の例のように、回収率に差があっても、回収率最低推定値はあまり差がないのが普通です。
本命系の予想法で回収率の高い方法がのぞまれるのは、本命系の予想方法のほうが今後もおなじように高い回収率をマークすることが期待できるからにほかなりません。
また、別の見方をすれば、穴系のソフトの回収率を検証するためには、相当長い期間が必要であり、本命系のソフトの場合はある程度短い期間でもかまわない、ということもできます。
日本初、Windows Mobile5.0を搭載したW-ZERO3に新モデル登場。新しく加わったダイヤルキーでケータイとしての操作性も兼ね備えました。 | |
W-ZERO3 [es]/WS007SH |
【2】回収率の分布
たとえば、1000人の人が、それぞれ100レースの馬券を買った場合のことを考えてみます。
すると、それぞれの買った馬券は異なるので、回収率が30%の人もいれば、120%の人もいるわけですが、80%前後の人が一番多く、0%の人や300%の人はめったにいないという分布が予想できます。この分布を正規分布とみなすこともできる。
ところで、的中率がほぼ正規分布することは、的中数の分布が二項分布であることからまちがいないわけですが、回収率も正規分布するとみなしてよいかという問題があります。
1000人の人に100レースの馬券を買わせたとき、「買う馬券は8倍前後の単勝馬券に限る」という条件をつけたとします。
そうすると、10%のレースを当てた人が10×800円の配当を得て、回収率80%となり、15%のレース当てた人が15×800円の配当、つまり回収率120%となるわけで、的中率と回収率は完全に正比例します。
また、買う馬券に「単勝オッズ4〜20倍の中から偏らずに選ぶ」という条件をつけたとすると、平均的には単勝6.7倍の馬券だけを買ったのと同じ的中率の分布になります。
このとき、1的中あたりの配当は平均670円ですから、10レース当てた人の平均回収率は67%、20レース当てた人の平均回収率は134%となり、的中率と回収率はやはり正比例します。ただし、10レース当てた人の中には20倍の馬券をとった人もいて、この人の回収率は67%よりも高くなります。
また20レースあてた人の中には5倍くらいの馬券しか当たらなかった人もいて、この人の回収率は134%よりも低くなります。
ですが、全体の平均で考えるとやはり的中率と回収率は正比例の関係とみなすことができます。
このように、同じようなオッズの馬券を買った場合の的中率と回収率の関係がほぼ正比例するので、的中率の分布が正規分布になるのなら、回収率の分布も正規分布になると推定したわけです。
したがって予想ソフトの検定をする場合には、そのソフトの選んだ馬券と同じような倍率の馬券を無作為に買ったときに、対象予想ソフト以上の回収率が偶然得られる確率を求めればいいわけです。
重要なことは、100レースの的中率、回収率がわかれば、それだけの情報からそのソフトの今後の的中率または回収率の分布が推定できるということです。
最初の100レースの結果がわかった時点で、そのソフトの回収率の分布は推定できる、ということは、次の100レースの回収率は95%の確率で最初に推定した正規分布の±1.96区間にはいっているということを断定できます。
少ない見本から全体を推定するのが推計学ですから、サンプルは100レースでも充分です。
たとえば、こんど予想ソフトをつくったとして、これから100レースの予想結果を実証してみると、的中率10%、回収率200%だったとします。
100レースの実証レースでは実際に馬券を買わなかったのですが、このデータからみて、今後ソフトの買い目の通り馬券を買っても大丈夫かどうか検定するわけです。
1万レースも待つわけにはいきませんので、最初の100レースの結果だけから、このソフトの回収率の区間推定をすると、95%の確率でこのソフトの真の回収率は80%〜320%の間にあるということがわかります。
このソフトが本当は320%もの高回収率である可能性もあるかわりに、80%の回収率しかない平凡なものである可能性もあるということです。
したがって、はじめの100レースの結果からだけでは、今後実際に馬券を買うわけにはいきません。回収率80%のソフトだったとき困りますからね。
そこで、あと100レース様子をみることにしたとします。
すると、通算200レースで的中率18%、回収率160%になったとしましょう。
この200レースのデータで区間推定すると、95%の確率でこのソフトの真の回収率は113〜207%の間にあるということがわかります。
サンプルが少し増えたので、区間推定の幅がだいぶ縮まります。そして、最低でもこのソフトのいう通りに馬券を買えば、113%の回収率を期待してもよいということがわかりましたので、いよいよ実戦に投入しようという段になるわけです。
あと、区間推定は、実証回収率100%を超えるソフトの検定をするためだけではなく、100%に満たないソフトが本当はこれから100%を超えるかもしれないという可能性を検定する用途にもつかえます。
たとえば、あるソフトの100レースの実証結果が的中率10%、回収率80%だったとして、真の回収率を区間推定してみると、33〜127%という答えがでてきます。
つまり、実証レースでは80%の成績しかのこせなかったものの、まだこのソフトが100%以下の回収率しかないと決めつけることはできない、ということがわかるわけです。
天下統一 -乱世の覇者- + 天下統一クロニクル バリューパック
戦国歴史シミュレーション「天下統一 乱世の覇者」と、ゲームが更に楽しくなる専用データベース「天下統一クロニクル」のセットパッケージ
釣道 2 -海釣り編-
リールや竿は釣り具メーカーのシマノが実名で登場、日本近海の62種の魚が釣れる本格的な海釣りシミュレーションゲーム
【一服〜一酔】
競馬の予想システムを考える過程で、様々なファクターの取り捨てをするわけですが、このとき、ふと連想することがあります。
それは、川を泳ぐ さかな をつかまえる網です。
えーと 昆虫採集などで使うアミを想像してもらえばいいんですけど。
さかなを的中馬券とし、アミがそれを捕まえる競馬の予想ロジックとします。
で、「魚の大きさ=オッズ」、「アミ輪の大きさ=ファクターの絞込み」とし、
アミの目合いは、輪の大きさに比例して大きくなるとします。
川には小さい魚ほど多く存在し、大きくなるにつれて減少していきます。
アミで魚を捕まえるのには、大きなアミの方がいいわけですが、これだと小さい魚は、すべてアミの目合いから逃げてしまいます。
アミが小さくなるほど、魚を逃がさずに捕まえられるのですが、大きな魚は、輪が小さすぎてアミに入りません。
「小さい魚ばかり食べても、たくさん捕まえないと腹がいっぱいにならないし、大きな魚を狙うと、なかなかとれずにいつも腹がすいた状態になってしまう、一体どのくらいのアミが効率良く、平均してさかなをとれるのかなぁ」
なんてことが、頭の中にぼんやり浮かんできます。
(プログラムの予想ロジックを考えたことがある人は、似たような経験があるでしょうね。)
3.5型QVGA TFTカラー液晶&30GB HDD搭載!またオーディオ再生で最長約25時間、「ワンセグ」視聴で最長約7時間の長時間駆動を実現しているのでお出かけのおともとしても最適!7月中旬発売! | |
デジタルオーディオプレーヤー特集 | 金利・手数料はジャパネットが負担! |
【3】過去分析→未来予測
そもそも過去のレースを分析しただけで近未来のレースを予測することが可能なのか?
また過去を分析するために必要なファクターとは?
過去レースの分析に必要な母集団を、どこからどの程度もってくるのが最適か?
*母集団
よく競馬解説者がこのレースは先行馬有利とか差し馬は不利とか口にしますが、母集団である馬の中で先行馬と差し馬がどの位の割合でいたかの情報が無ければ解説内容の意味が了解出来ないのと、重賞など1年に1回しかないレースでは10年で10レースの情報しか集まりませんので統計学レベルでは多分なにも結論は出ないと考えた方が正解だと思います。過去のレースを検証する場合、この母集団をどう設定するかが、非常に大事になってきます。
@ 分析種類
過去のデータが未来においても通用するのはオッズや 競馬場のある条件下における人(騎手や調教師の能力や思惑)の意志が影響する部分のほうが、競走馬自身の過去データ(馬の強さ指数)よりも可能性が高いのでは と考えます。
つまり競走馬の過去のデータから未来を予想するのは難しいと・・・
しかしあるレースの各数値の出方からそのパターンを分析できれば結果から近未来の予測が成り立つ可能性もあるとは思いますが。
勝ち馬を絞るのに常用される手段があります。例えば、過去の連対馬は全て前走の○○記念3着以内で、斤量が1Kg減で、5歳馬であったので、これが今回の勝ちパターンとか、消す馬は,今回が芝コースであれば芝コース未経験馬で斤量50Kg以下であった馬等等です。
これは一見合理的で何も問題は無いと思われるかも知れませんが、理論的にはこの方法で浮かび上がった勝ちパターンは、確かに過去のレースにおいては最も確率が高かったのは事実ですが、これから起こるレースにおいては、勝ちパターンを多重化するほど浮かび上がった勝ちパターンが起こる相対的な確率は小さくなります。
従って、勝ちパターンが起こるか起こらないかの2つに区分した場合、多分99%起こらない(多重化が3段階以上であれば)と言えます。
予想理論にパターン分析を応用する場合は、この事実を常に頭において構築しなければいけません。
ジュエリー感覚で身に着けられるスタイリッシュなボディ採用!お手持ちのコンポなどから直接録音可能な「ダイレクトレコーディング」機能搭載!さらに高音質でスタイリッシュなネックストラップヘッドホンを付属! | |
デジタルオーディオプレーヤー特集 | 金利・手数料はジャパネットが負担! |
【4】絞り込み
回収率を上げる方法の1つに絞り込みがあると思います。
「絞り込み」とは、あるソフトの予想実績について条件別に集計して成績の悪い条件を買い目から除外したり、馬連の何点目は回収率が低いので買わないようにする、ということなど。
仮に上記のような理解であれば、絞り込みという方法は、絞り込むためのフィルターが複雑になるほど回収率が向上しますが、同時にデータの質がどんどん下がっていきます。
実際の馬券実績データがもっとも質のよいデータ(恣意的な作為がなされていない)なわけで、この場合に回収率の推定値にもっとも信頼がおけます。
また、買い目を除外する場合は、除外する条件の成績が統計的に有意に悪いかどうかということが、元データの質を下げないためのコツです。
絞り込みのロジックが信頼できるかどうかを調べる方法は、今後「絞り込みなし」と「絞り込みつき」の2つの予想方法である程度のレースを実証し、その結果に対して検定するのが最善だと思います。
(1)絞り込みの原則論
@高配当に依存しすぎないように。
A @とも関連しますが、ある程度の的中率を。(ソフトにもよるが)
Bわかりやすいファクターでの絞り込みを。
たとえば長距離は駄目という絞り込みはわかるが、距離1000ー1400mと
2000ー2200mを狙うというのはチョット。
C整合性のある絞り込みを。
Bとも関連しますが、例えば上位3点狙いならともかく、
1,2,6点目だけ狙うというのはチョット。
D過去のケースを未来に適用しても、思った程の効果は出ない。
これまでの経験では大体実戦で回収率は2割減と考えております。
E1ー2ケ月で再評価を。
競馬は日々変わっていくものです。ソフトも変わります。
Bについて
私なら距離1000ー1400mだけとか、または2000ー2200mだけというような絞り込みをしますね。
またほかの絞り込みを進めてから再評価します。
単勝確率についても同様です。途中を落とすということはなるべく行いません。
Cについて
やはり間をとばした点目の絞り込みには危険がつきまとうと思います。
この場合なら上位1、2点目狙いや下位4、5、6点狙いを検討しますね。
下位の買目でも、単勝1番候補の軸馬が絡んでいる買目なら、間をとばしても意味があると思います。ソフトの買目作成のアルゴリズムにもよりますが...。
まとめると以下のようになります。
1.最近1年分のデータから回収率140ー160%程度のなるべく無理のない絞り込み法を数ソフトについて見つけ出す。
2.即実戦に使用。ただし特定の1ソフトに頼らず、数ソフトの買目をオッズも参考に購入。 これにより危険性を減らす。
3.星取り表を付け、調子の良いもの悪いものを見つけ出す。
4.調子の悪いものは再評価。ただこれまでの経験上120%程度の回収率が得られればまあまあと考える。
5.そのほか、条件移動や季節の変わり目、などでは必ず再評価。
(2)絞り込み判別法
生物系の実験などでよく用いられる手法なのですが、まず、レースをランダムに2つのグループに分けます。例えば、全てのレースに通し番号を振り、奇数番号をAグループ、偶数番号をBグループとします。
次に、Aグループのレースの成績のみについて絞り込みを検討します。
いくつかの有効そうな絞込条件が得られましたら、その条件でBグループの評価をします。
つまり、Bを未来のレースにみたててシュミレーションするわけです。
Bでも好成績をおさめればその絞り込みは有効であるといえますし、うまくなければ、超高配当などの特殊な場合に引っ張られた絞り込みといえます。
サンプル数が多ければとても有効な手法です。
上記のように手元のデータを2つに分けるという考えかたもありますが、これまでの連勝での絞り込みはどうしても回収率を上げるためにはある程度は高配当に依存しなければなりません。
そうなると1年間3000R以上のうちの100R程度にたよるわけで、これを2つにわけて絞り込みを行うと、そのわけ方による影響が少なからず出てきてしまうと考えています。
ですからもし本命狙いの絞り込みで、高回収率が得られるソフトが登場すれば、その的中率の高さにより、絞り込みに使用するサンプルデータが少々すくなくとも大丈夫かもしれません。
また20ー40倍程度にその回収率を頼るソフトでもある程度はサンプルデータを減らすことが可能かもしれません。
現在使用している検証方法は、入手可能の全ての過去データ(2年以上)を絞り込みサンプルデータとして使用し、検証は絞り込み後に得られた的中・回収率などを基準に、1年ごと・1ヶ月ごと・開催地ごとに分散して、比較する方法をとっております。
(出来るだけ無理のない絞り込みでサンプルn数を増やし、絞り込みデータの出現性(有効性)と分布を確認しております。)
結局絞り込みには完成なしと考えています。
絞ったら即、実戦に用いてます。
つまり私が用いた検証という単語は、私の財布を用いてのものとなります。
そしてこれまではいつも複数のソフトに絞りこみをおこなって、同時に実戦に用い、各ソフト単位で星取り表をつけて、成績の悪いものは再評価したり、購入金に変更を加えています。
サンプルn数が少ない場合は当然良い結果になりますが、n数を増やすことで絞り込み条件が、偏った的中レースに依存したものか、ある程度の頻度と分布で的中しているレースかを確認して、絞り込みの評価を行っております。(今年は良いが去年はダメと言うパターンも有りますから・・・)
結局、最終的な評価は実戦でしかわかりませんが・・・?
実戦で使用する為には、何かの検定結果がないと使えませんから。
ここで一般論となりますが、スピード系ソフトは基本的に900万、1500万が苦手です。
この理由は推測になりますが、やはり勝ち上がりたくない馬がいるのではないかと言われています。よって900万、1500万は削ります。
新馬戦、未出走については絞り込みの方針でその採択が決まると思います。
つまり本命サイド狙いなら削れませんが、これらのレースが一般的にやや本命サイドになることが多い以上、中穴、大穴狙いなら、思いきって削ってよいと思います。
本命サイド狙いは再度トライすることとして、ここでは中穴、大穴狙いで結論として未勝利、500万、オープンのみで絞りました。
回収率では函館が異常に悪く、東京がこれにつぎ、最高は中京の158.7%でした。
時期にもそう差のない札幌と函館でなぜ回収率にこれほどの差がでたのかははっきりしません。
また東京が不調なのはスピード系ソフト一般の傾向と思います。
場所による絞り込みはいろいろな考え方があると思いますが、ここでは直線の長い東京と北海道を除いてみます。
(3)勘違いだらけの”絞り込み”
”絞り込み”とは統計学的にはどういう事か、”絞り込み”をしたら分析データーでは良い回収率を得られたが、実際のレースでは回収率が上がらない、この原因は何処にあるのか、などについてです。
実践は絞り込みでの回収率の大体2割減とわりきって考えておりますが、的中率の低い絞り込み、つまり大穴待ちではかなりの辛抱が必要で短期的には結構沈み込むものと考えております。
@絞り込みとデーターの良いとこ取り
1 データーを絞り込んだら期待値が1.20になった。
2 データーの良いとこ取りをしたら期待値が1.20になった。
1を見ますと納得してしまうかもしれませんが、2を見たなら”なーんだデーターの
良いとこだけを取ったんだから期待値が良くなるのは当たり前ではないか”と思うでしょう。 と言う事で用語の使い方は重要ですね。
期待値を上げるだけでしたら1ヶ月を給料日の25日からの15日間とその前の15日間に分けてもよいでしょう。
給料日から15日間 0.85
給料日前の15日間 1.20 (念の為ですが、この数値はあくまで例です。)
あるいは競馬開催日の気温と平均気温とを比較して絞り込む等、幾等でも絞り込む方法は出てくるでしょう。
この様な方法で良い期待値が得られても絞り込みが成功したとは言えないですね。
結論としてはデーターの良いとこ取りをしてはいけないです。
今迄知らず知らずにデーターの良いとこ取りをしていたと言う人も居るのでは、身に覚えのある人もいるのではと推察します。
必勝法の分析では上手く行ったのに実際に使ったら散々だったと言う事です。
絞り込みではなくて、データーを選択して期待値(回収率)を上げる方法は有ります。
これは応用統計学の重要なところです。
(4)一貫性があれば必勝法
過去の成績から、良いところだけを取ることは簡単なことですが、この条件に一貫性があれば必勝法と言って差しつかえないと思います。
絞り込みを行う過程では、再現性のないものとか偶発的なことはできるだけ排除するように皆さん考えていると思います。
良いところだけを取るのも必勝法であると思います。良いところなんて、後で分かることだと考える方もいるでしょうが、そんなことはありません。
予想ソフトは、一定のアルゴリズムで結果を出します。だから、好不調の波がある程度読めるはずです。
過去のデーターを分析し絞り込むと上手く行ったので、実際の沢山のレースに用いたら同じ様に良い回収率(期待値)が得られたとすると、それはもちろん必勝法でしょう。
良いとこ取り(絞り込み)をした物が全て駄目と言う事はなく、中には上手く行く事も有るでしょう。
しかし上手く行ったのはたまたま・偶然の産物と考えています。
が、良いとこ取りを行い偶然を期待する事も一つの方法とは思います。
好不調の波が読める(予測)としたならば、それは無意識のうちにその要因(変数)を認識しているのではないでしょうか。
その要因(変数)を明確に出来るならば、ソフトの条件の一つに取り込む事により、更に良い期待値(回収率)になるでしょう。
@”良いとこ取り”とは、”回収率の良いとこ取り”
単純に回収率だけで判断して、良い値を選ぶということですね。
それが危険というのは最もだと思います。
実際に自分でも、それだけで選んだ条件で買うことはしません。
でも、誰もが回収率だけを判断して良いとこ取りするわけではないと思います。
つまり、仮に”絶対的な指数”が存在すれば、その良いとこ取りすることが、唯一の
必勝法といえるはずです。
もちろん、その指数とは、回収率だけでなく、分散やら資金配分までをすべて包括し
た高次元の指数としますが…。
回収率しかデータがなければ、判断のしようがありません。
選んだ回収率が140%あっても、的中率が1%だったら絶対買いません。
的中率が50%でも、レース数が10Rならば信用できません。
で、的中率もたかだか平均です。的中率50%なら、逆数を取れば”平均して2回に
一度は当たる”ということになります。しかし、10連敗するかもしれません。
ところが、10連敗しても、マクロ的に的中率50%へ向かうのなら、買いつづけれ
ば4回に3回当たることも起こるはずなんです。
これが、時間と共に的中率が落ちてくるという現象があるのなら、レースの選び方云々の問題でなく、予想をするソフトのロジックの中に問題があるのでは? と思ってしまいます。というわけで、”良いとこ取り”というのはわかりましたが、もう一方の”絞り込み”というのはどういう定義なんでしょうか?
これは確率・統計の用語とは違うと思いますが(^^;。定義の説明なしで、内容の解釈はできませんので。
選んだレースの、高配当/低配当、的中R/はずれRが、均等に分布していて、期待値が100%を越えていれば、それで良いのかなとも思いますが…。
【5】検証方法
シュミレーションの結果が確率予測となっている(的中率x%と予想した馬券をたくさん集めるとそのうちx%が的中馬券となっている)のであれば、シュミレーションは、有効だと思います。(これで回収率100%以上が約束されるわけではないのですが・・・)
しかし確率予測になっていないのであれば、(私の場合はこちらになってしまいます)この手法はプログラム内の評価変数の変換でしかありません。
この場合シュミレーションには以下のデメリットがあります。
・CPUをたくさん消費する
・シュミレート回数により結果が異なる
・評価値の変換により「情報落ち」を起こす
最初の2点は、予想プログラムの検証をする場合に大きな負荷となります。
最後の1点は、評価値の精度を落とします。
(1)検証
何も過去5年分を用意しなくても、1年分でもある程度はテストできると思います。
それにしても、どうして検証となると全データを対象としてしまうのでしょう。
競馬の場合は、データ数が有限なせいか、分析とか検証をしようとすると、利用できる全データを対象としてしまうことが普通のように感じます。
これを将来の予測に役立てようと思ったら、この段階から乱数を使ったサンプリングにした方が間違いなく役立つはずだと思いますが、これを実行している人は意外と少ないように感じます。
むしろ、あえて全体を検証しないという方法ですね。
つまり、最初から全データを対象としてしまうと、そのデータに偏った特徴が如実に現れてしまいますが、これを乱数で20〜50%程度の件数で検証して、その結果を、さらにまた乱数で得られたデータの結果と突き合わせてみて、何度かこれをやってみれば、その検証から得られるデータの特徴の普遍性の信頼度は上がるはずですし、何も過去5年分用意する必要は無いと思います。
あまり細かい絞り込みをしなければ、1年分だけでも十分足りるはずです。
もちろんサンプル数は多い方が良いのは間違いないですが、少ないサンプルでも、サンプリングの仕方で、それは対処できると思います。
競馬は、データ数が有限個数であることと、それからそのひとつひとつのデータにいろいろな属性があるために、あまりこの方法が取られていないような気がします。
全体を見渡して、将来に役立てたいのでしたら、この方法は有効だと思います。
投資リスクがない!?競馬で安定回収したいなら是非お試しを!!
メールで前日に確信の軸馬を無料配信!
騎手と調教師の成績をデータで確認! TARGETで使用出来るデータ 厩舎の思惑をデータで解析へ進む |
お奨め競馬情報
■■馬券で利益がおもしろいほど上がる理由
7割から9割は必ず連対すると思われる確信の軸馬を完全無料公開
■■無料で見れる闇情報!競馬の真実がココに!
実績ある勝ち組からのウラ情報!コレを見ないで馬券を買うのは愚かな行為です!