様々な分野において、必須になる学問が数多く存在します。統計学もその中のひとつです。大学の講義や高校の数学でなど、統計学に触れる機会がある方も多いのではないでしょうか?
仕事や学問を学ぶ上で統計学が必要になる場面が出てきます。どの分野に進むにしろ、統計学とは一体どのような学問なのか知っておきたいところ。大手企業も統計学に注目しており、統計学を使う未来がそう遠くはないかもしれません。
統計学について触れる機会がまだ少ない・これから統計学を仕事などに活かしたいと考えている方のために統計学の種類や特徴について解説します。
そもそも統計学とは一体どのような学問なのか
統計学は、統計によって得られたデータを処理・分析する学問。数値上の性質に加え、規則性・不規則性と導き出します。ただ単にデータを集め、見るだけでは仕事や学問に活かすことができません。
膨大なデータの性質を調べるだけでなく、膨大なデータの一部を抜き出し、性質を調べることで元のデータの性質を導き出すことも大切です。
また、統計学で得られたデータを新商品やサービスの開発・マーケティング戦略の立案などに活かす企業も存在します。研究だけでなく、大きなビジネスを実現する上で欠かせません。
統計学と機械学習の違いとは?
統計学と近い学問に機械学習が挙げられます。
近年のAIブームは機械学習が使われているのですが、その計算アルゴリズムでは統計と似たものや同じものがあります。そのためか、よく「統計学と機械学習は何が違うのですか?」と聞かれることが多くあるため、ここでは違いについて整理しておきましょう。
統計学
人がデータをもとに、何かを判断したい場合に使用されます。人の判断を助けるためにデータを分析します。
機械学習
データを与えることで、機械が学習を行い、新しいデータに対して予測を行います。予測結果は正確なものが出たとしても、なぜその結果になったかといった要因分析はできず、ブラックボックスと言われています。要因分析をしたい方は、統計学のアプローチを試すといいでしょう。
気になる統計学の種類と特徴について
統計学には、いくつかの種類が存在します。データの処理・分析を行っていく上でどのような種類があるかは最低限知っておきたいところ。ここでは、統計学の種類と特徴について解説するので、気になる方は一度チェックして頂きたいです。
記述統計学
記述統計学は、集めたデータから傾向と平均を導き出し、データの特徴を把握する学問。表やグラフを用いることで集めたデータを可視化し、分かりやすくします。また、度数分布や時系列、相関関係などを用いてデータの特徴を掴みます。
推測統計学
推測統計学は、母集団の中からデータの一部を抜き出し、抜き出したデータから母集団の特徴を把握する学問。母集団全体について把握できない場合に用いられます。記述統計学と組み合わせることでより確度の高い情報を得ることができます。
膨大な母集団の場合、記述統計学だけでは母集団の平均や特徴などを把握するのが難しいです。いろいろなデータを分析できるようにするためにも、推測統計学についても勉強しましょう。
推測統計学は、以下のものに分けることができます。
- 推定
- 検定
人によっては、どちらも初めて知った単語ではないでしょうか?推計統計学を学ぶ上で推測と検定について知っておくことが大切です。
推定
推定は、抜き出したデータの中から平均を推測すること。1つの値を抜き出して推定する点推定と一定の区間の値を抜き出して推定する区間推定が存在します。
検定
検定は、母集団の仮説が統計学的に成り立つかどうかを抜き出したデータから判断すること。
仮説が成り立つかどうかは、以下の方法で行われます。
仮説を設定
↓
有意水準を決定
↓
仮説を検証
↓
背理法により結論を導き出す
有意水準は、仮説が間違っているかどうか判断する確率のこと。有意水準をどこに設定するかが重要になってきます。背理法は、ある命題が偽であることを仮定し、そこから矛盾を導くことである命題が真か偽を結論付けることです。
ベイズ統計学
ベイズ統計学は、主観確率を用いた統計学。主観確率は、本来起こりうる出来事が発生する確率のことです。データが不十分な状態でも、ある出来事が発生する確率を設定した後、新たな情報が得られるたびにある出来事が発生する確率を更新して主観確率を導きます。推測統計学のように、母集団からデータを必ず抜き出す必要がありません。
得られたデータを基に確率を更新することをヘイズ更新と呼びます。ヘイズ統計学が注目されている理由は、コンピュータの性能向上による機械学習・深層学習の進展です。
ヘイズ統計学を支持する学者と記述統計学・推測統計学を支持する学者は対立しており、人によっては対立している場面を目にするかもしれません。
統計学に用いられる手法
統計学にはさまざまな手法が存在します。集めたデータをより深く理解するためには、どのような手法があるか知っておく必要があります。
統計学に用いられる手法は大きく分けて以下の2つ。
- 実験計画
- 尺度水準
ここでは、実験計画と尺度水準は一体どのような手法なのかについて解説します。
実験計画
実験計画は、データの集め方や規模、対象、割付方法を設定し、参考になるデータを集めること。統計を行う際、無差別にデータを集めれば良いというわけではありません。どのようなデータが必要になるのか、どのくらいの数のデータを集めれば良いかを考える必要があります。
尺度水準
尺度水準は、集めたデータを情報の性質に基づいて数学・統計学的に分類する基準。質的データと量的データの2つを扱うことになります。
尺度水準には、4つの尺度が挙げられます。
- 順序尺度
- 名義尺度
- 比率尺度
- 間隔尺度
それぞれの尺度について解説するので、気になる方は一度チェックして頂きたいです。
順序尺度
順序尺度は、クラスの順位など、順序が意味を持つ番号。平均値を定義することはできない反面、順位の真ん中の数字である中央値を定義することができます。
名義尺度
名義尺度は、単なる番号。順番には意味がありません。出席番号や電話番号などが名義尺度の一例です。
比率尺度
比率尺度は、0を基準とする絶対尺度。比例尺度とも呼ばれています。数値の差だけでなく、比率にも意味があります。体重や身長、絶対温度などが比率尺度の一例です。
間隔尺度
間隔尺度は、数値の間隔が等間隔なのに加え、数値の順序に意味を持つ尺度。比率尺度と違い、比率には意味がありません。摂氏や知能指数などが間隔尺度の一例です。
統計学により得られるデータ
統計学を活かすことで一体何が得られるか気になっている方も多いのではないでしょうか?実は、皆さんが思っている以上に統計学を通して得られるものが数多く存在します。最後に、統計学により一体どのようなデータが分かるかについて触れていきます。
ユーザーの数
統計学でデータを集め、分析していくことで自分の携わっているコンテンツのユーザーを把握することが可能です。現在、どのくらいのユーザーがいるかだけでなく、これからユーザーになるかもしれない方がどのくらいいるかを把握するためにも統計学を用いてデータを集めましょう。
ユーザーの趣向・ニーズ
集めたデータを基にユーザーの趣向やニーズを把握し、次の商品開発やマーケティング戦略に生かせるのもポイントに挙げられます。自分がこれから売り出そうと考えている商品やサービスは、一体誰に需要があるのかを把握しているかどうかで売り出し方も変わってきます。
ユーザーの居住地
ユーザーがどこに住んでいるかを把握できるのも統計学を活かすメリットのひとつ。どこの地域に店を出店するかどうかの判断材料になります。これから新たに店を出そうと考えている方は、どの地域にユーザー獲得を見込めるかどうかをチェックすることをおすすめします。
仕事や学問に統計学を活かすことが大事
統計学は、幅広い分野に活かすことができる学問です。これから何か事業を起こすだけでなく、普段の仕事や論文を執筆などに統計学を活かしてはいかがでしょうか?調べていくと、思いもよらないデータが得られるかもしれません。