五輪チケット当選確率とテレビ観戦の魅力

先日（2019年6月20日）、東京２０２０大会オリンピック観戦チケットの第１次抽選結果が発表された。統計学を使って当選確率を９５％の確からしさで推定し、また私が当選したか否かは置いといて、私の広い心で落選した人達のためにテレビ観戦の魅力についても述べる。

当選確率

当選確率はどの程度なのかは全く分からなかったが、１７セッション^※１（５０万円弱）を申し込んでいたので、期待を込め全て落選することはないだろうと思っていた。
抽選結果発表の日、結果確認のため公式チケット販売サイトにアクセスしたが、予想どおりアクセス殺到中のため繋がらない状態であった。当選しているだろうと思っていたからか待つのが苦にならなく、余裕をこきながら待っていた。昼になっても繋がらなく食事に出かけ、事務所に戻ると繋がっていたので、ログインしてみると次のとおりであった。

容赦なく打ち砕かれていた。
今となっては恥ずかしい話であるが、有り得ないと思いつつも、運良く全てのセッションが当選したらどうしようなどとも思っていた。そうなると、観戦の無い日に地元石川県に戻るのも面倒なので、７月下旬から８月上旬まで東京に滞在し続けるしかないかとか、ホテルはいつから予約が取れるのだろかと思い巡らしていた。

私は、日本人がメダル有力視できる競技に対し、準決勝以上の１７セッションを申込んだ。平均的な倍率より高くなるが、今回１セッションも当選しなかったのは、確率的に妥当な結果だったのか、あるいは運が無さ過ぎたのかを知りたく、当選確率がネット上に載っていないかググってみた。タイトルに「当選確率」と記載してあるページを幾つも見つけ、目を通してみたが、説得力がない当選確率を述べたものばかりだった。
そんな中、実際の抽選結果を元にしたページがあり、それが日刊スポーツのページであった。その内容は、社員が申込んだメダル有力競技のメダルセッションチケットに対する当選結果を集計したものである。この情報はまさしく、私が申込みに選んだメダル有力競技のメダルの掛かった試合と重なるものであり、集計結果は次のとおりである。

申込み数：　１，２８８セッション
当選：　３８セッション
当選確率：　２．９５％

以下に統計学の視点から、この日刊スポーツの当選確率（標本の当選確率）が、真の当選確率（母集団の当選確率）からどの程度の誤差（標本誤差）で信頼区間はどれだけかを分析してみる。
なお、ここでの母集団の大きさは今回申し込まれた全競技の全試合のセッション総数でなく、あくまで日本人がメダル有力視できる競技のメダルの掛かった試合のセッション総数である。また、統計学の専門家から、「標本データが特定の企業の社員から得たものなので無作為抽出になっていない」と指摘を受けそうであるが、そもそも私が無作為抽出のデータを入手することは不可能であり、また素人の私の判断は無作為抽出のデータに相当近いものが得られていると見ている。

※１　セッション

それぞれの競技の試合時間の長短や特性を考慮した観戦の基本単位があり、これを「セッション」と言っている。当選すればセッションの該当試合を観戦できる。例えば、７月２６日競泳のあるセッションでは、午前１０時３０分～午後０時３０分に行われる準決勝及び決勝の６試合を観戦することができる。また、１セッションに申し込めるチケット枚数に上限を設けていて、例えば上記のようなメダルの掛かったセッションでは競技の種類に関係なく４枚までとなる。

母集団の大きさを考慮する必要があるか？

まず、標本誤差を求めるに当たり、抽出率が十分小さいことを確認しておく。今回の件に沿って言い換えると、日刊スポーツの申込みセッション数（１，２８８件、以下「標本の大きさ」と言う。）が、メダル有力競技のメダルの掛かった試合に申し込まれたセッション総数（以下、「母集団の大きさ」と言う。）に比べ十分小さいことを確認すると言うことである。その理由は、十分小さいと判断できれば、理論上は母集団の大きさが分からなくても良いことになるからである。そこで、母集団の大きさを大雑把に推測してみる（感覚的な推測なので、ズレた判断にならないように厳しくみることにした）。
また、その他ネットから得られた情報として、朝日新聞の記事に抽選申し込みに必要なＩＤ登録者数は約７５０万人と記載してあった。

一人当たりの申し込み平均セッション数

私の場合は１７セッションであり、平均はもっと少ないと考えるが、５セッション以上であると推測する。ここでは厳しめ目で見るので５セッションと仮定する。
　　　
今回の抽選に申し込まれた全競技のセッション総数

ＩＤ登録者数の８割が今回の抽選に申し込んだと仮定すると、申し込んだ人数は６００万人（750万人×8割）となる。
そうすると、申し込まれた全競技のセッション総数は、
一人当たりの平均セッション数 × 申し込んだ人数＝ 5セッション × 600万人＝ 3,000万セッション
となる。
　　　
メダル有力競技に申し込まれたセッション総数

標本調査をした日刊スポーツの記事では、メダル有力競技の例として「陸上、体操、卓球、テニス、バドミントン、野球、ソフトボールなど」と記載され、「など」の競技を知ることができないものの、その他メダル有力競技として、柔道、空手、レスリング、スポーツクライミングなど色々挙げられる。よって、日刊スポーツが調査対象にした競技は少なくも１２が競技あったと推測するが、厳し目で見１２競技と仮定する。
東京オリンピックの競技数は３３なので、単純に競技数で按分すると、
3,000万セッション × （12競技／ 33競技）＝ 1,090万セッション
となる（万単位未満切捨て）。
　　　
メダルの掛かった試合に申し込まれたセッション総数
日刊スポーツの標本調査はメダル有力競技の中のメダルの掛かった試合なので、メダルの掛かった試合のセッション数がメダル有力競技の全セッション数の何％に当たるか推測し、その％値で按分することにする。メダル有力競技全てに対して調査すれば正確な％値が出せないこともないが、ここでは正確さを要求していないので、卓球とバトミントンの２つの競技について調べ、２競技合計の％を全体の％とみることにする。
卓球
準決勝以上のセッション：　１４

全セッション数：　３５
バドミントン
準決勝以上のセッション：　９

全セッション数：　２０
２競技合計
準決勝以上のセッション：　２３

全セッション数：　５５
従って、両競技の全体セッションに対する準決勝以上のセッションの割合は、４２％（23÷55セッション）となり、メダルの掛かった試合に申し込んだセッション総数は、
メダル有力競技に申し込まれたセッション総数 × 準決勝以上のセッションの割合＝ 1,090万セッション × 42％＝ 457万セッション
となる（万単位未満切捨て）。

以上により、標本の大きさ１，２８８セッションは母集団の大きさ４５７万セッションに比べて十分小さいことから、標本誤差を求める上で母集団の大きさを考慮しなくて良いと判断できる。（詳細な説明を省略するが）後述で使用する計算式に沿って言い換えれば、$\sqrt{\frac{N-n}{N-1}}$ が１に近似（0.999859）していることから「１」と見なすことができる。

※　「ｎ」は標本の大きさ
※　「Ｎ」は母集団の大きさ

標本誤差と真の当選確率

日刊スポーツの調査は全数調査でなく標本調査なので、そこから算出する当選確率には誤差（これを「標本誤差」と言う。）が含まれてしまう。そのため、母比率（真の当選確率）を推定するために、標本誤差を求める必要がある。
信頼係数は一般的な９５％^※２とすると、標本誤差の計算式は次のとおりである。

$${1.96}\times{\sqrt{{\frac{N-n}{N-1}}\times{\frac{p(1-p)}{n}}}}$$

ただ、上記の分析で示したとおり $\sqrt{\frac{N-n}{N-1}}=1$ と見なせるので、母集団の大きさを含まない次の式を使って計算すると、

$標本誤差={1.96}\times{\sqrt{\frac{p(1-p)}{n}}}$ $={1.96}\times{\sqrt{\frac{0.0295(1-0.0295)}{1288}}}$ $≈0.0092$ $=０．９２％$

※　ｐ：標本比率（日刊スポーツが求めた当選確率２．９５％）
※　ｎ：標本の大きさ（日刊スポーツが調査した数１，２８８セッション）

となる。

よって、母比率の９５％信頼区間は、
２．９５％－０．９２％　～　２．９５％＋０．９２％、
つまり
２．０３％　～　３．８７％
となる。

言い方を変えると、
日刊スポーツが算出した当選確率２．９５％には誤差が含まれ、真の当選確率は９５％の確からしさで２．０３％～３．８７％に収まる。
なお、ここで求めた当選確率は人気のある競技の人気のあるセッションに限った当選確率と言って良いので、全競技の全セッションに対する当選確率はもう少し高いと考える。

※２　信頼係数９５％について

一般的に信頼係数は９５％（±1.96σ：「σ」は標準偏差）が良く使われており、私の分析に於いても、それに倣い９５％を採用したに過ぎない。信頼係数は分析当時者が判断するものなので９５％は絶対的な基準でない。専門的な人は私のような安直に９５％を採用するのでなく、目的等に応じて信頼係数を決定している筈である。
ちなみに、新現象を発見する物理実験に於いては、新現象と同じような結果が偶発的に観測されただけなのかを見極める必要がある。そのため、ノーベル賞級の場合、新現象と認められるために、実験の確からしさが±５σを達している必要があるようである。大型ハドロン衝突型加速器（LHC）に於けるヒッグス粒子の発見は±５σ、スーパーカミオカンデ（梶田隆章氏）に於けるニュートリノが質量を持つことを示すニュートリノ振動の発見は±６．２σであった（信頼係数は、±5σで約99.999 94％、±6σで約99.999 999 8％、±6.5σで約99.999 999 992％）。

抽選申込みの反省会

私が申込んだセッションの選定基準は日刊スポーツとほぼ同じなので、上記で求めた当選確率を元に、抽選結果の妥当性と抽選の敗因を考察し、また抽選の疑問点を所見として述べる。

抽選結果の妥当性

１セッション当たりの当選確率は上限でも３．８７％しかないので、１７セッション全て落選することも十分有りうる状況だったことが分かるが、その一方で１セッション以上当選する確率は全て落選する確率より高かったのではと感覚的に思ってしまう。この感覚は、
３．８７％　×　１７セッション　＝　６５．７９％
と５０％を相当超える値になることから来る。

そこで、１７セッション全て落選する確率を正確に求めてみる。

上限の３．８７％の場合: 当選確率が３．８７％と言うことは、１セッション申し込んで落選する確率は、９６．１３％（「1-0.0387」）になる。よって、１７セッション全て落選する確率は、
（１ー０．０３８７）¹⁷ ＝５１％
下限の２．０３％の場合: １７セッション全て落選する確率は、
（１ー０．０２０３）¹⁷ ＝７１％

以上から、全セッション落選する確率は５１％～７１％であり、１セッション以上当選する確率は２９％～４９％に過ぎなかったことが分かる。つまり、今回の結果は運が無さ過ぎたのでなく、悔しさをどこにもぶつけることができない自業自得の結果であった。

抽選の敗因

当時のチケット申込み手続きはパソコンに向かって行っていた。手続きの最初はパソコン画面に表示されるチケット総額を気にせず申込んでいたが、いつのまにか４０万円を超えていることに気付き、急に金額を気にしだした。当選確率は見当もつかなかったが相当な倍率になることは分っていたにも関わらず、もし運良く全て当選してしまったらどうしようと考えるようになり急にビビり出した。結局これ以上申込んだら５０万円超える手前で終了し、１７セッションの申し込みとなった。

今回の件を期待値で表すと

上限：４８２，３７２円 × ３．８７％＝１８，６６８円
下限：４８２，３７２円 × ２．０３％＝　９，７９２円

となる。

期待値なので当然ばらつきが発生するが、一生に一度しかないオリンピック観戦だったのに、この程度の期待値金額にビビッていたかと思うと情けなくなってくる。
今回の敗因は私のビビりである。１セッションでも当選したいのであればパソコンに表示される支払最大金額を無視し、申込み上限のセッション数を申込むべきであった。

なお、まだチャンスがあり、今年の秋に先着順販売が始まり、来年春に東京都内に販売所も設置され直接購入できるとのこと。しかし、今回の抽選では一定の申込み期間にも関わらす酷い回線の混み状況であったことを考えれば先着順に申込む気にもならなく、また石川県在住の私が東京販売所まで出向く気にもなれない。私の生のオリンピック観戦は開催１年以上前にして消え去った。

参考までに．．．

私は１７セッション全て当選した場合の高額代金にビビってしまった訳だが、ついでに全て当選する確率も求めてみた。

上限の３．８７％の場合: 全て当選する確率は単位「％」を外した値で表すと、
０．０３８７¹⁷ ＝９．７９６８Ｅ－２５^※３
下限の２．０３％の場合: 全て当選する確率は単位「％」を外した値で表すと、
０．０２０３¹⁷ ＝１．６８８２Ｅ－２９

この当選確率の数値は余りにも小さ過ぎてピンとこない。そこで、比較するものがあれば多少は分かり易くなるので、宝くじの当選確率と上限の確率「０．０３８７¹⁷」と比較する。
最も人気のある年末ジャンポ宝くじに於いて、２０１８年の１等７億円の当選確率は２，０００万分の１（「5E-7」）だったとのこと。ここで、五輪に於ける上限の全セッション当選確率は１等７億円の当選確率の何分の１に当たるかを見てみる。なお、上限の全セッション当選確率は計算簡略化のために端数を切上げて「１Ｅ－２４」とする。

五輪全セッション当選確率 ÷ 宝くじ当選確率
＝「１Ｅ－２４」 ÷ 「５Ｅ－７」
＝（１ ×１０^-24） ÷ （５ × １０^-7）
＝（１ ÷１０²⁴） ÷ （５ ÷ １０⁷）
＝（１ × １０⁷） ÷ （５ × １０²⁴）
＝１ ÷ （５ × １０¹⁷）
＝５０京分の１

これでも数の位「京（けい）」が大き過ぎてピンとこないが、「京」と言えば「スーパーコンピューター京」を思い浮かべる。名称「京」の由来は、１０ペタフロップス^※４、つまり１秒間に１京回の演算を行える処理能力から来る。このスパコン京の後継機「富岳（ふがく）」（2021年運用予定）は、４００ペタフロップス、つまり１秒間に４０京回前後の演算が可能になる見込みである。

以上から、全セッション当選する確率「０．０３８７¹⁷」に対し別の言い方をすれば、年末ジャンポ宝くじ１等７億円の当選確率から更にスパコン富岳並みのフロップス数で割った確率である。もしかしたら私が一生を終える前に、小惑星の衝突・核戦争・気候変動又は未知のウィルス等による人類滅亡の確率より低かったのかもしれない。つまり、私は決して起こり得ないと断言して良い事象の確率にビビッていたことになる。
今回の抽選申し込みの件は分析すればするほど、自分のアホさ加減が身に染みてくる。

気持ちを切り替えて、次は今年の年末ジャンポ宝くじ７億円狙いだぜ～。だって、今回ビビッていた全セッション当選の確率に比べ天文学的に高い当選確率（50京倍）なんだから、買わない選択肢はないぜ～。正月はパラダイスアイランドリゾートで、ドンチャン騒ぎ確定だぜ～。一般庶民の皆様におかれましては、近場の初詣を質素に満喫してくれたまえ。

追記

年末ジャンボ宝くじの抽選結果を報告する。

有ろう事か、宝くじを買ったのを忘れていたから、正月はドンチャン騒ぎできなかったぜ。

連番で１０枚（3,000円）買い、見事２枚も当選し、当選率は驚くなかれ２割だぜ。
１枚は外れることのない７等の３００円、もう１枚は６等の３，０００円。儲けは３００円だぜ。

これでどうやってモルディブまで行けるんだよ。最寄りの小松駅からだと隣の無人駅が限界だぜ。
正月に無人駅のホームでドンチャン騒ぎしていたら、今頃恥ずかしくて地元では大手を振って歩けなくなっていたぜ。

update on Jan.19,2020 by 正月を質素に満喫した男

※３　浮動小数点表記

数字を「仮数」、「基数」及び「指数」で表記する方法。本記述形式では、「Ｅ」の前方数値が「仮数」で、「Ｅ」の後方数値が「指数」で、「基数」が「１０」となる。例えば「９．８Ｅ－２５」は、「９．８ × １０^-25」を意味する。なお、「Ｅ」とは、「Exponent（指数）」の略称。

※４　ペタフロップス

「フロップス（FLOPS：Floating-point Operations Per Second）」とは、コンピュータの性能指標の一つで、1秒間に行える浮動小数点演算の回数を示す単位である。また数の位「ペタ（Peta）」は、近年のＰＣハードディスクの記憶容量で耳にする「テラ（Tera）」の千倍であり、１，０００兆を意味する。例えば「１０ペタフロップス」は、１秒間に１京回の浮動小数点演算を行う能力があることを意味する。

抽選の疑問点

全敗の負け惜しみではなく、単純に抽選の仕組みについて疑問に思ったことがある。
ネットを見ていると１人で６チケット当選した人がいた。抽選なので文句を言えないが、なぜ、なるべく多くの人が当選できるような仕組みにしなかったのか疑問が残る。申込みが殺到することが容易に予想できた筈だから、１人１セッションしか申し込めなくても、割り当てた席に空きがでるとは考え難い。たとえ人気のない競技に空きがでたとしても、次の先着順申込みで必ず空席は埋まる筈だ。１人最大６０チケット分を申し込め、最大３０チケット当選できる仕組みであれば、多くが落選する中、複数セッションを当選した人も相当な数がいると推測する。一体どのような理由でこのような変な仕組みにしたのだろうか？

テレビ観戦の魅力（負け犬の遠吠え）

今回の全滅は本当に落ち込むことなのだろうか？
真夏に開催される東京オリンピックは会場への移動だけでも大変である。しかも、屋外競技の観戦は熱中症を心配しなければならないくらい過酷である。また、大きな会場で観戦していても、席の位置によっては相当見ずらいことも考えられる。更に、競技によっては応援したい日本人選手がどの人かすら分からなくなることも十分ある。

一方、テレビ観戦はズームされ試合を観戦し易く、プロの解説者が付いているので試合状況も理解し易く、また勝敗を決める決定的瞬間も瞬時に再生されるなど、生の観戦に比べ幾つものメリットがある。そう考えるとテレビ観戦の方が良いのでは。
個人的には、東京オリンピックでは進化した重畳^※５などのハイテク技術で、まだ誰も見たことがない日本独自のかっこ良い映像を見せてくれることを期待している。

また、東京オリンピックは競技成績だけでなく、落ちぶれつつある日本の技術力であるが世界に技術力をアピールできることを願っている。

※５　重畳（ちょうじょう）

実際の映像に、別途情報を重ね合わせて表示させる技術。例えば水泳だったら、コース上に国旗のＣＧを重ねて表示された映像を見たことがあると思うが、これが重畳技術である。

前回のリオデジャネイロオリンピックでは選手がゴールした直後に、そのコース上に国旗、国名及び順位が表示されていた。

しかし、東京オリンピックでは泳いでいる最中でも選手を追尾しながら国旗や速度などが表示されるようで、競技中に日本選手を見失うことがなくなる。

最後に当選者へ一言

炎天下の状況で硬い椅子に長時間拘束されることを大枚を叩いてまで望んだ、お前らはドＭか？
落選した私は、快適な温度に保たれた室内で、ブランデーグラス片手に雲の上に乗っているかの様なフカフカの椅子にゆったり腰掛けながら、優雅にテレビ観戦してやるぜ。
しかも定番の白のバスローブに、紫外線を浴びることがないのに黒のサングラスだぜ。

※「酒の瓶はブランデーでなくワインじゃないの？」とつまんね疑問を持つなよ。裕次郎と言えばブランデーに決まってんだろう。

今更、当選したチケットを私に譲渡したいと懇願してきても、受け取ってやんね－ぜ！
どうだ参ったか！！！

ウァ

ハッ

ハ

・

by 器が小ちゃい男

追記

本記事投稿後、落選した人を限定にした追加抽選販売が急遽実施された。ただ、今回の申込みは前回と異なり一人１セッションのみとなった。
この追加が決定する前に本記事を投稿し、当選者をケチョンケチョンに罵った私が、まさか再度抽選申込みにチャレンジするなんて有り得ないと思うかもしれないが、先着順でなく一定の申込み期間が設けられていたので恥も外聞もなくチャレンジした。

結果は

であった。

今回の結果をいさぎよく受け入れ、当選者と張り合うのは止めてあげよう。この私の決断に対し器の大きさを感じ取ってもらいたい。
そもそも私は、下戸なのでブランデーを飲んだこともないし、持っているサングラスはジョギングで使っている偏光のやつなのでテレビ観戦には向かないだろうし、バスローブなんて着用したこともないし、フカフカの椅子も持っていないし、エアコンを好まなく夏は扇風機で乗り切るので快適な室温にほど遠い。
東京五輪テレビ観戦の真の姿はこんな感じかな。