2021年8月20日金曜日

データ分析が初めての(苦手な)人のためのリンク集

今回は学部ゼミ生にデータ分析を教える過程でよく利用するネット上の情報源をまとめます。

1.Excelから

まずは以下の書籍を読むことをお薦めします。書籍情報はこちら。サポートページはこちら
畑農鋭矢・水落正明『データ分析をマスターするための12のレッスン』有斐閣.

次にサポートページにもありますが、Excelの散布図にラベル表示できるようになりましょう。例えば以下のページが参考になります。

初心者のためのOffice講座「散布図のラベル表示」
統計WEB「ラベル付き散布図の作り方」

Excelではピボットテーブルも使えると便利です。色々な解説サイトがありますが、例えば以下のページを参考にしてください。

いまさら聞けないExcelの使い方講座「【Excel】ピボットテーブルって何に使うの?エクセルで大量のデータを効率よく集計・分析するテク」

 

2.ExcelからRへ

Excelで本格的なデータ分析を行うのは難儀です。回帰分析1つとっても説明変数が16個までという制約があったりします。Excelの機能を拡張してくれるエクセル統計なる商品もありますが学生には高価です。
そこで、我がゼミでは無料の統計ソフト「R」を推奨しています。初めに提示した拙著の中でも使用しています。共著者の水落先生のサイトに解説があります。もっと細かな情報はこちらのWikiで。

RjpWiki

Rを簡単に使うためには、RコマンダーやRStudioが便利です。水落先生のサイトに解説があります。RStudioのダウンロードはこちら。Rのよいところは無料以外に、テキストやネット上の解説が豊富なことです。
しかし、残念ながら、色々な解説を読んでもなお、インストールや設定、データの読み込みに失敗してデータ分析を諦めてしまうゼミ生は後を絶ちません。そんな人にはRの簡易版ともいうべき「EZR」をお薦めします。

フリー統計ソフトEZR(自治医科大学附属さいたま医療センター)

EZRはRコマンダーをベースに、最初から多くの統計分析を使うことができるようにアレンジされています。医学統計分析のためにチューニングされているため、そのままで経済分析に適しているわけではありませんが、自分で細かい設定を行わずに済みます。利用する場合はマニュアルに記載のあるように論文内に引用を行うとよいでしょう。

 

3.やっぱりExcelで!「HAD」

それでも、Rは敷居が高いというゼミ生は一定数残ります。そんなゼミ生にはExcel上で動く「HAD」 をお薦めしています。

統計分析ソフト HAD

関西学院大学・清水裕士先生が開発したもので無料で提供されています(サポートは歓迎とのことです)。また、HADにも教科書があります。
小宮あすか・布井 雅人『Excelで今すぐはじめる心理統計 簡単ツールHADで基本を身につける』講談社.

HADは心理学の分析のために作成されていますので、経済分析に必要な手法がすべて揃っているわけではないことに注意が必要です。 


4.その他

これ以外にも、StataEViewsSPSSなどの統計ソフトがよく利用されますが、(学生割引があるにしても)普通の学部生にとっては高価な代物です。所属大学のメディア教室などに行けば、備え付けのPCにインストールされているかもしれませんが、自分のノートPCや自宅のPCでは分析することができません。

そういうわけで、ゼミ生には第一に「R」を推奨、挫折するようなら「EZR」を紹介し、それでもダメなら「HAD」を提案するという段階を踏んでいます。



0 件のコメント:

コメントを投稿

データ分析を始める人のための役立つ話

今回は、データ分析を始めようという人に役立つ話です。8/23にアップした「 統計学が初めての(苦手な)人のための役立つ話 」 の続編です。   1.自由度 回帰分析を行うとき、統計的検定を行うとき、多くの統計学的分析において「自由度」という概念が登場します。データ分析を始めたばか...