2021年8月23日月曜日

統計学が初めての(苦手な)人のための役立つ話

これまでのゼミを振り返って、ゼミ生に繰り返し話している事柄はおそらく役立つことでしょう。ここでは3つの話題に絞ってネット上のお薦め解説記事を紹介します。1つめは「仮説検定」です。統計学初学者がつまずく定番と言えます。2つめは、呪われた言葉「サンプル数」です。統計学やデータ分析の専門家を目指すのであれば、「サンプル数」という言葉の使い方には注意しなければなりません。3つめは「合計特殊出生率」です。合計特殊出生率には2つの種類があるというお話しです。

 

1.仮説検定

仮説検定、有意水準、統計的に有意、などの言葉は多くの統計学初学者の鬼門となっています。 その重要性からネット上には多くの解説がありますが、以下は初学者にも分かりやすいと思われるお薦めのページです(易しい順)。

仮説検定とは?初心者にもわかりやすく解説!」AVILEN Trend

検定の基本的な考え:仮説検定

有意性検定の考え方」我楽多頓陳館

統計的有意差検定」新潟大学医学部保健学科 放射線技術科学専攻


2.サンプル数

我がゼミでは早い段階で「サンプル数」を使わないように指導します。同じ理由で「標本数」も×です。通常、サンプル数と表現されているものは、「サンプルサイズ」、「標本サイズ」、「標本の大きさ」、などと表現されるべきです。または、Number of observationsの直訳を用いると、「観測数」となるでしょうか。以下の解説記事は、「サンプル数」を使ってはいけない理由を分かりやすく説明したものです。

サンプル数とは何か?」独立行政法人労働政策研究・研修機構(JILPT研究員 堀春彦)

サンプル数とサンプルサイズ n は意味が違う」生物科学研究所 井口研究室

サンプル数とサンプルサイズの違いをわかりやすく解説」AVILEN Trend


3.合計特殊出生率

合計特殊出生率は「女性が生涯に生む平均的な子供の数」と定義され、↓のような記事でよく使われます。

晩婚化が進展、合計特殊出生率は低下…厚労省の出生統計」リセマム

ただし、次の記事を読むと、「期間合計特殊出生率」と「コーホート合計特殊出生率」と呼ばれる2種類の存在が示唆されます。

イギリスでも進む晩産化、30歳未満で産んだ人数は1人へ半減」日経BizGate(日本総合研究所創発戦略センター シニアマネジャー 村上芽)

2つの合計特殊出生率の解説は以下のページで読むことができます。

合計特殊出生率について」厚生労働省 平成23年 人口動態統計

女性が生涯に生む子供の数(合計特殊出生率)」総務省統計局

合計特殊出生率」京都市統計ポータル

コーホート合計特殊出生率の考え方は「コーホート分析」(コウホート分析)につながる重要なものです。コーホート分析の参考文献として統計数理研究所・中村隆先生の入門論文を紹介しておきましょう。

中村 隆(1987)「年齢・時代・世代の違いを探る--コウホート分析の方法--」『統計数理』 35(1), 103-107.





0 件のコメント:

コメントを投稿

データ分析を始める人のための役立つ話

今回は、データ分析を始めようという人に役立つ話です。8/23にアップした「 統計学が初めての(苦手な)人のための役立つ話 」 の続編です。   1.自由度 回帰分析を行うとき、統計的検定を行うとき、多くの統計学的分析において「自由度」という概念が登場します。データ分析を始めたばか...