破損したエンブレム(東京オリンピック)

先日(2019年6月20日)、東京2020大会オリンピック観戦チケットの第1次抽選結果が発表された。統計学を使って当選確率を95%の確からしさで推定し、また私が当選したか否かは置いといて、私の広い心で落選した人達のためにテレビ観戦の魅力についても述べる。

当選確率

当選確率はどの程度なのかは全く分からなかったが、17セッション※1(50万円弱)を申し込んでいたので、期待を込め全て落選することはないだろうと思っていた。
抽選結果発表の日、結果確認のため公式チケット販売サイトにアクセスしたが、予想どおりアクセス殺到中のため繋がらない状態であった。当選しているだろうと思っていたからか待つのが苦にならなく、余裕をこきながら待っていた。昼になっても繋がらなく食事に出かけ、事務所に戻ると繋がっていたので、ログインしてみると次のとおりであった。

東京五輪チケットの1回目抽選結果(全て落選)

容赦なく打ち砕かれていた。
今となっては恥ずかしい話であるが、有り得ないと思いつつも、運良く全てのセッションが当選したらどうしようなどとも思っていた。そうなると、観戦の無い日に地元石川県に戻るのも面倒なので、7月下旬から8月上旬まで東京に滞在し続けるしかないかとか、ホテルはいつから予約が取れるのだろかと思い巡らしていた。

私は、日本人がメダル有力視できる競技に対し、準決勝以上の17セッションを申込んだ。平均的な倍率より高くなるが、今回1セッションも当選しなかったのは、確率的に妥当な結果だったのか、あるいは運が無さ過ぎたのかを知りたく、当選確率がネット上に載っていないかググってみた。タイトルに「当選確率」と記載してあるページを幾つも見つけ、目を通してみたが、説得力がない当選確率を述べたものばかりだった。
そんな中、実際の抽選結果を元にしたページがあり、それが日刊スポーツのページであった。その内容は、社員が申込んだメダル有力競技のメダルセッションチケットに対する当選結果を集計したものである。この情報はまさしく、私が申込みに選んだメダル有力競技のメダルの掛かった試合と重なるものであり、集計結果は次のとおりである。
  • 申込み数: 1,288セッション
  • 当選: 38セッション
  • 当選確率: 2.95%

以下に統計学の視点から、この日刊スポーツの当選確率(標本の当選確率)が、真の当選確率(母集団の当選確率)からどの程度の誤差(標本誤差)で信頼区間はどれだけかを分析してみる。
なお、ここでの母集団の大きさは今回申し込まれた全競技の全試合のセッション総数でなく、あくまで日本人がメダル有力視できる競技のメダルの掛かった試合のセッション総数である。また、統計学の専門家から、「標本データが特定の企業の社員から得たものなので無作為抽出になっていない」と指摘を受けそうであるが、そもそも私が無作為抽出のデータを入手することは不可能であり、また素人の私の判断は無作為抽出のデータに相当近いものが得られていると見ている。

それぞれの競技の試合時間の長短や特性を考慮した観戦の基本単位があり、これを「セッション」と言っている。当選すればセッションの該当試合を観戦できる。例えば、7月26日競泳のあるセッションでは、午前10時30分~午後0時30分に行われる準決勝及び決勝の6試合を観戦することができる。また、1セッションに申し込めるチケット枚数に上限を設けていて、例えば上記のようなメダルの掛かったセッションでは競技の種類に関係なく4枚までとなる。

母集団の大きさを考慮する必要があるか?

まず、標本誤差を求めるに当たり、抽出率が十分小さいことを確認しておく。今回の件に沿って言い換えると、日刊スポーツの申込みセッション数(1,288件、以下「標本の大きさ」と言う。)が、メダル有力競技のメダルの掛かった試合に申し込まれたセッション総数(以下、「母集団の大きさ」と言う。)に比べ十分小さいことを確認すると言うことである。その理由は、十分小さいと判断できれば、理論上は母集団の大きさが分からなくても良いことになるからである。そこで、母集団の大きさを大雑把に推測してみる(感覚的な推測なので、ズレた判断にならないように厳しくみることにした)。
また、その他ネットから得られた情報として、朝日新聞の記事に抽選申し込みに必要なID登録者数は約750万人と記載してあった。

  1. 一人当たりの申し込み平均セッション数
    私の場合は17セッションであり、平均はもっと少ないと考えるが、5セッション以上であると推測する。ここでは厳しめ目で見るので5セッションと仮定する。
       下矢印
  2. 今回の抽選に申し込まれた全競技のセッション総数
    ID登録者数の8割が今回の抽選に申し込んだと仮定すると、申し込んだ人数は600万人(750万人×8割)となる。
    そうすると、申し込まれた全競技のセッション総数は、
    一人当たりの平均セッション数 × 申し込んだ人数 = 5セッション × 600万人 = 3,000万セッション
    となる。
       下矢印
  3. メダル有力競技に申し込まれたセッション総数
    標本調査をした日刊スポーツの記事では、メダル有力競技の例として「陸上、体操、卓球、テニス、バドミントン、野球、ソフトボールなど」と記載され、「など」の競技を知ることができないものの、その他メダル有力競技として、柔道、空手、レスリング、スポーツクライミングなど色々挙げられる。よって、日刊スポーツが調査対象にした競技は少なくも12が競技あったと推測するが、厳し目で見12競技と仮定する。
    東京オリンピックの競技数は33なので、単純に競技数で按分すると、
    3,000万セッション × (12競技 / 33競技) = 1,090万セッション
    となる(万単位未満切捨て)。
       下矢印

  4. メダルの掛かった試合に申し込まれたセッション総数
    日刊スポーツの標本調査はメダル有力競技の中のメダルの掛かった試合なので、メダルの掛かった試合のセッション数がメダル有力競技の全セッション数の何%に当たるか推測し、その%値で按分することにする。メダル有力競技全てに対して調査すれば正確な%値が出せないこともないが、ここでは正確さを要求していないので、卓球とバトミントンの2つの競技について調べ、2競技合計の%を全体の%とみることにする。
    卓球
    • 準決勝以上のセッション: 14
    • 全セッション数: 35
    バドミントン
    • 準決勝以上のセッション: 9
    • 全セッション数: 20
    2競技合計
    • 準決勝以上のセッション: 23
    • 全セッション数: 55
    従って、両競技の全体セッションに対する準決勝以上のセッションの割合は、42%(23÷55セッション)となり、メダルの掛かった試合に申し込んだセッション総数は、
    メダル有力競技に申し込まれたセッション総数 × 準決勝以上のセッションの割合 = 1,090万セッション × 42% = 457万セッション
    となる(万単位未満切捨て)。
以上により、標本の大きさ1,288セッションは母集団の大きさ457万セッションに比べて十分小さいことから、標本誤差を求める上で母集団の大きさを考慮しなくて良いと判断できる。(詳細な説明を省略するが)後述で使用する計算式に沿って言い換えれば、\(\sqrt{\frac{N-n}{N-1}}\) が1に近似(0.999859)していることから「1」と見なすことができる。
※ 「n」は標本の大きさ
※ 「N」は母集団の大きさ

標本誤差と真の当選確率

日刊スポーツの調査は全数調査でなく標本調査なので、そこから算出する当選確率には誤差(これを「標本誤差」と言う。)が含まれてしまう。そのため、母比率(真の当選確率)を推定するために、標本誤差を求める必要がある。
信頼係数は一般的な95%※2とすると、標本誤差の計算式は次のとおりである。
$${1.96}\times{\sqrt{{\frac{N-n}{N-1}}\times{\frac{p(1-p)}{n}}}}$$

ただ、上記の分析で示したとおり \(\sqrt{\frac{N-n}{N-1}}=1\) と見なせるので、母集団の大きさを含まない次の式を使って計算すると、

\(標本誤差={1.96}\times{\sqrt{\frac{p(1-p)}{n}}}\) \(={1.96}\times{\sqrt{\frac{0.0295(1-0.0295)}{1288}}}\) \(≈0.0092\) \(=0.92%\)

※ p:標本比率(日刊スポーツが求めた当選確率2.95%)
※ n:標本の大きさ(日刊スポーツが調査した数1,288セッション)

となる。

よって、母比率の95%信頼区間は、
2.95%-0.92% ~ 2.95%+0.92%、
つまり
2.03% ~ 3.87%
となる。

言い方を変えると、
日刊スポーツが算出した当選確率2.95%には誤差が含まれ、真の当選確率は95%の確からしさで2.03%~3.87%に収まる。
なお、ここで求めた当選確率は人気のある競技の人気のあるセッションに限った当選確率と言って良いので、全競技の全セッションに対する当選確率はもう少し高いと考える。

一般的に信頼係数は95%(±1.96σ:「σ」は標準偏差)が良く使われており、私の分析に於いても、それに倣い95%を採用したに過ぎない。信頼係数は分析当時者が判断するものなので95%は絶対的な基準でない。専門的な人は私のような安直に95%を採用するのでなく、目的等に応じて信頼係数を決定している筈である。
ちなみに、新現象を発見する物理実験に於いては、新現象と同じような結果が偶発的に観測されただけなのかを見極める必要がある。そのため、ノーベル賞級の場合、新現象と認められるために、実験の確からしさが±5σを達している必要があるようである。大型ハドロン衝突型加速器(LHC)に於けるヒッグス粒子の発見は±5σ、スーパーカミオカンデ(梶田隆章氏)に於けるニュートリノが質量を持つことを示すニュートリノ振動の発見は±6.2σであった(信頼係数は、±5σで約99.999 94%、±6σで約99.999 999 8%、±6.5σで約99.999 999 992%)。

抽選申込みの反省会

私が申込んだセッションの選定基準は日刊スポーツとほぼ同じなので、上記で求めた当選確率を元に、抽選結果の妥当性抽選の敗因を考察し、また抽選の疑問点を所見として述べる。

1セッション当たりの当選確率は上限でも3.87%しかないので、17セッション全て落選することも十分有りうる状況だったことが分かるが、その一方で1セッション以上当選する確率は全て落選する確率より高かったのではと感覚的に思ってしまう。この感覚は、
3.87% × 17セッション = 65.79%
と50%を相当超える値になることから来る。

そこで、17セッション全て落選する確率を正確に求めてみる。
上限の3.87%の場合
当選確率が3.87%と言うことは、1セッション申し込んで落選する確率は、96.13%(「1-0.0387」)になる。よって、17セッション全て落選する確率は、
(1 ー 0.0387)17 = 51%
下限の2.03%の場合
17セッション全て落選する確率は、
(1 ー 0.0203)17 = 71%

以上から、全セッション落選する確率は51% ~ 71%であり、1セッション以上当選する確率は29% ~ 49%に過ぎなかったことが分かる。つまり、今回の結果は運が無さ過ぎたのでなく、悔しさをどこにもぶつけることができない自業自得の結果であった。

当時のチケット申込み手続きはパソコンに向かって行っていた。手続きの最初はパソコン画面に表示されるチケット総額を気にせず申込んでいたが、いつのまにか40万円を超えていることに気付き、急に金額を気にしだした。当選確率は見当もつかなかったが相当な倍率になることは分っていたにも関わらず、もし運良く全て当選してしまったらどうしようと考えるようになり急にビビり出した。結局これ以上申込んだら50万円超える手前で終了し、17セッションの申し込みとなった。

今回の件を期待値で表すと
  • 上限:482,372円 × 3.87% = 18,668円
  • 下限:482,372円 × 2.03% =  9,792円

となる。

期待値なので当然ばらつきが発生するが、一生に一度しかないオリンピック観戦だったのに、この程度の期待値金額にビビッていたかと思うと情けなくなってくる。
今回の敗因は私のビビりである。1セッションでも当選したいのであればパソコンに表示される支払最大金額を無視し、申込み上限のセッション数を申込むべきであった。

なお、まだチャンスがあり、今年の秋に先着順販売が始まり、来年春に東京都内に販売所も設置され直接購入できるとのこと。しかし、今回の抽選では一定の申込み期間にも関わらす酷い回線の混み状況であったことを考えれば先着順に申込む気にもならなく、また石川県在住の私が東京販売所まで出向く気にもなれない。私の生のオリンピック観戦は開催1年以上前にして消え去った。

参考までに...

私は17セッション全て当選した場合の高額代金にビビってしまった訳だが、ついでに全て当選する確率も求めてみた。

上限の3.87%の場合
全て当選する確率は単位「%」を外した値で表すと、
0.038717 = 9.7968E-25※3
下限の2.03%の場合
全て当選する確率は単位「%」を外した値で表すと、
0.020317 = 1.6882E-29

この当選確率の数値は余りにも小さ過ぎてピンとこない。そこで、比較するものがあれば多少は分かり易くなるので、宝くじの当選確率と上限の確率「0.038717」と比較する。
最も人気のある年末ジャンポ宝くじに於いて、2018年の1等7億円の当選確率は2,000万分の1(「5E-7」)だったとのこと。ここで、五輪に於ける上限の全セッション当選確率は1等7億円の当選確率の何分の1に当たるかを見てみる。なお、上限の全セッション当選確率は計算簡略化のために端数を切上げて「1E-24」とする。

五輪全セッション当選確率 ÷ 宝くじ当選確率
= 「1E-24」 ÷ 「5E-7」
= (1 ×10-24) ÷ (5 × 10-7
= (1 ÷1024) ÷ (5 ÷ 107
= (1 × 107) ÷ (5 × 1024
= 1 ÷ (5 × 1017
= 50京分の1

これでも数の位「京(けい)」が大き過ぎてピンとこないが、「京」と言えば「スーパーコンピューター京」を思い浮かべる。名称「京」の由来は、10ペタフロップス※4、つまり1秒間に1京回の演算を行える処理能力から来る。このスパコン京の後継機 「富岳(ふがく)」(2021年運用予定)は、400ペタフロップス、つまり1秒間に40京回前後の演算が可能になる見込みである。

以上から、全セッション当選する確率「0.038717」に対し別の言い方をすれば、年末ジャンポ宝くじ1等7億円の当選確率から更にスパコン富岳並みのフロップス数で割った確率である。もしかしたら私が一生を終える前に、小惑星の衝突・核戦争・気候変動又は未知のウィルス等による人類滅亡の確率より低かったのかもしれない。つまり、私は決して起こり得ないと断言して良い事象の確率にビビッていたことになる。
今回の抽選申し込みの件は分析すればするほど、自分のアホさ加減が身に染みてくる。

パラダイスアイランドリゾート

気持ちを切り替えて、次は今年の年末ジャンポ宝くじ7億円狙いだぜ~。だって、今回ビビッていた全セッション当選の確率に比べ天文学的に高い当選確率(50京倍)なんだから、買わない選択肢はないぜ~。正月はパラダイスアイランドリゾートで、ドンチャン騒ぎ確定だぜ~。一般庶民の皆様におかれましては、近場の初詣を質素に満喫してくれたまえ。

追記

年末ジャンボ宝くじの抽選結果を報告する。

有ろう事か、宝くじを買ったのを忘れていたから、正月はドンチャン騒ぎできなかったぜ。

連番で10枚(3,000円)買い、見事2枚も当選し、当選率は驚くなかれ2割だぜ。
1枚は外れることのない7等の300円、もう1枚は6等の3,000円。儲けは300円だぜ。

これでどうやってモルディブまで行けるんだよ。最寄りの小松駅からだと隣の無人駅が限界だぜ。
正月に無人駅のホームでドンチャン騒ぎしていたら、今頃恥ずかしくて地元では大手を振って歩けなくなっていたぜ。

update on Jan.19,2020 by 正月を質素に満喫した男

数字を「仮数」、「基数」及び「指数」で表記する方法。本記述形式では、「E」の前方数値が「仮数」で、「E」の後方数値が「指数」で、「基数」が「10」となる。例えば「9.8E-25」は、「9.8 × 10-25」を意味する。なお、「E」とは、「Exponent(指数)」の略称。

「フロップス(FLOPS:Floating-point Operations Per Second)」とは、コンピュータの性能指標の一つで、1秒間に行える浮動小数点演算の回数を示す単位である。また数の位「ペタ(Peta)」は、近年のPCハードディスクの記憶容量で耳にする「テラ(Tera)」の千倍であり、1,000兆を意味する。例えば「10ペタフロップス」は、1秒間に1京回の浮動小数点演算を行う能力があることを意味する。

全敗の負け惜しみではなく、単純に抽選の仕組みについて疑問に思ったことがある。
ネットを見ていると1人で6チケット当選した人がいた。抽選なので文句を言えないが、なぜ、なるべく多くの人が当選できるような仕組みにしなかったのか疑問が残る。申込みが殺到することが容易に予想できた筈だから、1人1セッションしか申し込めなくても、割り当てた席に空きがでるとは考え難い。たとえ人気のない競技に空きがでたとしても、次の先着順申込みで必ず空席は埋まる筈だ。1人最大60チケット分を申し込め、最大30チケット当選できる仕組みであれば、多くが落選する中、複数セッションを当選した人も相当な数がいると推測する。一体どのような理由でこのような変な仕組みにしたのだろうか?

テレビ観戦の魅力(負け犬の遠吠え)

今回の全滅は本当に落ち込むことなのだろうか?
真夏に開催される東京オリンピックは会場への移動だけでも大変である。しかも、屋外競技の観戦は熱中症を心配しなければならないくらい過酷である。また、大きな会場で観戦していても、席の位置によっては相当見ずらいことも考えられる。更に、競技によっては応援したい日本人選手がどの人かすら分からなくなることも十分ある。

一方、テレビ観戦はズームされ試合を観戦し易く、プロの解説者が付いているので試合状況も理解し易く、また勝敗を決める決定的瞬間も瞬時に再生されるなど、生の観戦に比べ幾つものメリットがある。そう考えるとテレビ観戦の方が良いのでは。
個人的には、東京オリンピックでは進化した重畳※5などのハイテク技術で、まだ誰も見たことがない日本独自のかっこ良い映像を見せてくれることを期待している。

また、東京オリンピックは競技成績だけでなく、落ちぶれつつある日本の技術力であるが世界に技術力をアピールできることを願っている。

実際の映像に、別途情報を重ね合わせて表示させる技術。例えば水泳だったら、コース上に国旗のCGを重ねて表示された映像を見たことがあると思うが、これが重畳技術である。

リオオリンピック水泳の重畳

前回のリオデジャネイロオリンピックでは選手がゴールした直後に、そのコース上に国旗、国名及び順位が表示されていた。

東京オリンピック水泳の重畳

しかし、東京オリンピックでは泳いでいる最中でも選手を追尾しながら国旗や速度などが表示されるようで、競技中に日本選手を見失うことがなくなる。

最後に当選者へ一言

炎天下の状況で硬い椅子に長時間拘束されることを大枚を叩いてまで望んだ、お前らは ドM か?
落選した私は、快適な温度に保たれた室内で、ブランデーグラス片手に雲の上に乗っているかの様なフカフカの椅子にゆったり腰掛けながら、優雅にテレビ観戦してやるぜ。
しかも定番の白のバスローブに、紫外線を浴びることがないのに黒のサングラスだぜ。

石原裕次郎スタイル
※「酒の瓶はブランデーでなくワインじゃないの?」とつまんね疑問を持つなよ。裕次郎と言えばブランデーに決まってんだろう。
今更、当選したチケットを私に譲渡したいと懇願してきても、受け取ってやんね-ぜ!
どうだ参ったか!!!
ウァ
ハッ
ハッ

by 器が小ちゃい男