ホーム > mixiニュース > コラム > 【統計学で考える】都市伝説「しゃっくりを100回すると死ぬ」は何秒後に死ぬのか

【統計学で考える】都市伝説「しゃっくりを100回すると死ぬ」は何秒後に死ぬのか

3

2019年09月11日 12:03  ねとらぼ

  • チェックする
  • つぶやく
  • 日記を書く

ねとらぼ

写真本記事を三行で言うとこんな感じ
本記事を三行で言うとこんな感じ

 しゃっくりを100回すると死ぬ―― こんな都市伝説をご存じでしょうか。真偽のほどは分かりません、恐ろしい言葉です。「ひっく」と1回ごとに減っていく命のカウント。いつしゃっくりが起こるかも、人生の残り時間も分からないなか、やれ水を飲めば止まるとか、やれ息を止めれば止まるとか、まことしやかにささやかれているあの手この手を尽くすほかない……。



【97%の確率で命を落とすのは何秒後?】各時間の“100回目のしゃっくりが起こる確率”



 信じるか信じないかはあなた次第ですが、この恐怖を軽減するためにはせめて死への猶予時間だけでも把握したいものです。例えば、5回くらいしゃっくりの間隔を測定して、平均が10秒だったとしましょう。とすると、1回目から100回目までの時間は99倍の990秒(16分30秒)ということに……なるでしょうか?



 これは平均です。おおよそ990秒程度にはなりますが、それ以外の時間になることの方が多いです。できれば、何秒後に死ぬのか、もっと正確に把握したい。漫画の頭脳派キャラみたいにメガネをクイッとしながら「○○%の確率で△分後に死亡する」と言ってみたい。



 そんな願いを叶えてくれるのが……そう、統計学なのです。



●ライター:キグロ



5分間で数学を語るイベント「日曜数学会」や数学好きが集まる部室みたいなもの「数学デー」の主催者。数学の記事を書いたり、カクヨムで小説を書いたりしている。



●「しゃっくりを100回すると死ぬ」は何秒後に死ぬのか、統計学的に考えてみた



 しゃっくりの間隔は、ランダムといえどおおよそ同じような長さです。平均10秒なら、5秒や15秒になることはあっても、1秒や30秒になることはほとんどありません。また、100回目に近づくほど間隔が短くなったり長くなったりすることもありません。そして、前回の間隔が長いと次の間隔が短くなる、といったこともなさそうです。



 このような現象は、「指数分布に従う」と推測されます。



 指数分布とは何でしょうか。これは、まさに上記のような「(以前の発生とは関係なく)平均して△秒の間隔で起こる現象が、次は何秒後に起こるかを表す確率分布」で、以下のような関数で表すことができます。



●f(x)=(1/λ)e^(-x/λ)



※正確には「指数分布の確率密度関数」と呼ばれるものです



・f(x):確率分布を表すのによく使う記号で、「xになる確率はこれこれ」と述べるために使います



・e:自然対数の底と呼ばれる数で、約2.7182です。円周率のようなものだと思ってください



・λ(ラムダ):「次に起こるまでの平均時間」を表します。今回の場合は10秒ですね。



・x:次にしゃっくりが起こるまでの時間



 なにやら妙な記号が使われていますが、この関数は「平均λ秒の間隔で起こるしゃっくりが、x秒後に起こる確率」を表したもの。xに好きな数を代入すると、その時間でしゃっくりが起こる確率(正確には確率密度)が分かります。



 勘の鋭い読者はここで「あれ?」と思うかもしれません。



 「今知りたいのは100回目のしゃっくりがいつ起こるかで、次にしゃっくりが起こる時間ではないのでは?」



 その通りです。指数分布で分かるのは“次のしゃっくり”が起こる時間であり、“100回目のしゃっくり”が起こる時間ではありません。



 しかし、指数分布を拡張した分布「ガンマ分布」を使えば、100回目のしゃっくりが起こる時間を計算できます。



●f(x)={e^(-x/λ)/(λ^nΓ(n))}x^(n-1)



※正確には「ガンマ分布の確率密度関数」と呼ばれるものです



・n:ここではしゃっくりの回数を表し、n=100。ガンマ分布は、平均λ秒の間隔で起こる現象がn回起こるまでの時間がxである確率を表す確率分布



・Γ(n)(ガンマ・エヌ):詳細は端折りますが、「ガンマ関数」と呼ばれるものを表す記号。今回の場合はn=99なので、「Γ(n)=Γ(99)=98×97×96×…×3×2×1」とものすごく大きな数になります



 なお、確率を計算するには、単に値を代入するのではなく、積分をしてやる必要があります。



 というのは、単に値を代入するだけだと、「ジャスト△秒後にしゃっくりが起こる確率」(正確には確率密度)になってしまうからです。現実世界ではそんなジャストにピタッといくことは考えにくいので、△秒後に起こる確率から□秒後に起こる確率までを全部積み重ねる=積分することで求めます。



●97%の確率で死亡するのは……何分後?



 いよいよ計算しましょう。ただし手で計算するのは大変なので、コンピュータにやってもらいます。



 前述の通り、今回の想定では「平均すると100回目のしゃっくりが990秒程度で出る(死ぬ)」ことになっています。手始めに、100回目のしゃっくりが990秒から991秒までの間に起こる確率を計算しましょう。



 なんと、たったの0.4%です。平均とはなんだったのか。もうちょっと範囲を広げて、前後10秒(984〜994秒)の間に死亡する確率を計算しましょう。



 すると4.0%。さっきよりは少し広がりましたね。



 結果はドン、51.3%。「しゃっくりが始まったとき、51%の確率で990秒以内に死ぬ」ということになります。



 では、ほぼ確実に死ぬと言えそうな確率になるのはいつでしょうか? xの値を少しずつ変えて計算してみると、次の式が得られます。



 積分の記号(∫)の上についている数字に注目してください。1190とありますね。これはしゃっくりが始まってから1190秒(19分50秒)以内に死ぬ確率が97%になるという意味です。つまり、もし誰かがしゃっくりを始めたら、あなたはこう言うことができます。



 「お前は97%の確率で、19分50秒以内に死亡する(メガネクイッ)」と。



 今回は、しゃっくりが100回起こるまでの時間を計算してみました。そんなものを計算してどうするんだ……という気がしますが、実はこれ、結構役立っています。



 例えば、テレビなんかで「首都圏の直下型地震は○○年以内に起こる」なんて聞いたことありませんか? 実はこれは、指数分布で計算しています(なので、正確には「○○年以内に起こる確率が△%」などと言わなければなりません)。



 他にも火山の噴火や異常気象など、だいたい同じくらいの間隔で起こる現象が次にいつ起こるか、何回も起こるのは何年後かといった計算は、指数分布やガンマ分布が使えることが多いです。



 もっと身近な例では、バスが来るタイミングや、会社のWebページにアクセスがある間隔、電話がかかってくる時間なんかも、指数分布やガンマ分布に従うと言われています。



●詳細版:もっと詳しく知りたい人向け「統計学的に考えるしゃっくりの都市伝説」



 しゃっくりの間隔は、ランダムといえどおおよそ同じような長さです。平均10秒なら、5秒や15秒になることはあっても、1秒や30秒になることはほとんどありません。また、100回目に近づくほど間隔が短くなったり長くなったりすることもありません。そして、前回の間隔が長いと次の間隔が短くなる、といったこともなさそうです。



 このような現象は、「指数分布に従う」と推測されます。



 指数分布とは何でしょうか。これは、まさに上記のような「(以前の発生とは関係なく)平均して△秒の間隔で起こる現象が、次は何秒後に起こるかを表す確率分布」です。



 確率分布とは何でしょうか。これはちょっと説明が長くなります。



 「確率」と聞くと、「サイコロを振って1の目が出る確率」などを思い浮かぶ人が多いでしょう。1の目が出る確率は1/6です。2の目も、3の目も、同じく1/6で出ます。このことは次のように表で書くことができます。



 このように、出目(これを確率変数と呼びます)に対する確率を全て表現したものを確率分布と呼びます。



 特徴的な確率分布には、名前がついているものもあります。サイコロのように、全ての確率変数が等しい確率で出る分布は、「一様分布」と呼ばれます。指数分布も、このような確率分布の1つです。



 ところで、しゃっくりの発生間隔は「時間」です。これを1秒ごとに一覧にしたら巨大な表になってしまいます。かといって1分ごとでは正確な死亡時間が出せません。



 そこで、関数を使います。指数分布は、以下のような関数で表すことができます。



・f(x)=(1/λ)e^(-x/λ)



※正確には「指数分布の確率密度関数」と呼ばれるものです



 なにやら妙な記号が使われていますが、この関数は「平均λ秒の間隔で起こるしゃっくりが、x秒後に起こる確率」を表したもの。



●f(x)=(1/λ)e^(-x/λ)



※正確には「指数分布の確率密度関数」と呼ばれるものです



・f(x):確率分布を表すのによく使う記号で、「xになる確率はこれこれ」と述べるために使います



・e:自然対数の底と呼ばれる数で、約2.7182です。円周率のようなものだと思ってください



・λ(ラムダ):「次に起こるまでの平均時間」を表します。今回の場合は10秒ですね。



・x:次にしゃっくりが起こるまでの時間



 でも、どうしてこんな関数で表されるのでしょうか。その詳しい説明は長くなるので省略しますが、なんとなくそれっぽい説明をしましょう。



 この関数をグラフにすると、次のようになります。



 横軸がxで、縦軸がf(x)です。xが小さい場合(間隔が短い場合)ほど確率が高く、大きい場合(間隔が長い場合)ほど低くなっていきます。



 なぜこうなるのでしょうか。例えば、30秒後に「次の」しゃっくりが起こるためには、0〜29秒までの間にしゃっくりが起こってはいけません。しかし、29秒もあったら、その間に1回くらいしゃっくりが起こってしまいそうです。



 一方、10秒後に「次の」しゃっくりが起こるためには、我慢すべき時間は0〜9秒までの9秒間です。このくらいなら、しゃっくりは起こらないこともあるでしょう。つまり、「△秒後に次のしゃっくりが起こる確率」は、「△秒後までしゃっくりが起こらない確率」に強く関係し、時間が長くなればなるほどこの確率は下がっていくのです。



 それをグラフで表現すると上のようになり、このグラフを数式で表すと「f(x)=(1/λ)e^(-x/λ)」となるのです。



 この説明は正確でも厳密でもありませんが、これを正確かつ厳密にして数式で書くと、この関数に辿り着きます。数学が得意な人は挑戦してみてください。



2019年9月26日14時35分 追記:計算式の一部に誤りがあったため、修正いたしました


このニュースに関するつぶやき

  • その昔「焼きじゃがいもに味噌をつけて食べた人は死ぬ」ってのが話題になったことがあってなぁ・・・
    • イイネ!1
    • コメント 0件
  • その昔「焼きじゃがいもに味噌をつけて食べた人は死ぬ」ってのが話題になったことがあってなぁ・・・
    • イイネ!1
    • コメント 0件

つぶやき一覧へ(2件)

前日のランキングへ

ニュース設定