統計解析実習におけるJMPの有用性は高いと感じています。
伊藤 陽一氏
北海道大学大学院医学研究科
医学統計分野 准教授
チャレンジ | サンプルデータが豊富で、探索的データ解析の手法が充実しているなど、統計解析実習において有用性の高いツールが求められた |
---|---|
解決策 | JMPのデータライブラリに格納されている豊富なサンプルデータを使って実践的な教育を展開。統計解析の手法を網羅して学べるカリキュラムを構成できる |
結果 | 十数回の講義でJMPを操作できるようになった学生には、統計学をきちんと理解しようという意識が自然に芽生える |
国立大学法人北海道大学(以下、北海道大学)大学院 医学研究科において、JMPを全面的に活用した統計学の講座を設けている。統計解析の基礎から応用までは、座学とJMPの実習によって身につけさせ、さらに統計的な考え方を身につけることの意義も感じてもらう。JMPの豊富なサンプルデータを活用した十数回の講義を通じて、学生はJMPを自然に操作できるようになる。
北海道大学は、札幌農学校を前身とし、文系4学部/理系8学部、20の大学院研究科を擁する総合大学だ。「フロンティア精神」「国際性の涵養(かんよう)」「全人教育」及び「実学の重視」を基本理念に人材を育成しており、日本国内はもちろん、世界各国・地域で活躍する人材を数多く輩出している。札幌駅にほど近い場所にありながら広大な敷地を有する構内には歴史的建造物も多く、観光名所としても人気だ。
その北海道大学にあって、大学院の医学研究科は、医学・生命科学に関する高度な知識と研究能力を備え、社会の要請に応える高い見識を備えた人材を育成することを、教育目標に掲げる。医学研究科 医学統計分野 准教授 伊藤 陽一氏は、大学院生であれば、だれでも受講できる「統計科目群研究方法論」を受け持っている。この講義は、統計解析の「基礎」と「応用」の2つのパートから構成されるが、伊藤氏の方針は一貫している。統計解析ツールとしてJMPを利用することだ。
伊藤氏は、「JMPは、サンプルデータが充実しており、データを視覚的につかめること、探索的データ解析の手法が充実していること、計算式によって新しい変数を作成できること、JMPスクリプトにより解析結果を保存・再利用できることなどがメリットです。統計解析実習におけるJMPの有用性は高いと感じています」と語る。
基礎パートでは、探索的データ解析と検証的データ解析について解説し、JMPの使い方をレクチャーする。その後、理論分布の利用、連続データの群間比較、分割表の解析などの理論学習とJMPを用いた実習を行う。意識しているのは、統計がどんな分野でどのように使われているかを例示し、学生に統計の知識を身につけることの意義を知ってもらうことだ。
伊藤氏は、「データ解析には、データをさまざまな切り口から見ることで仮説を導き出す探索的アプローチと、その仮説が本当に正しいかどうかをデータで裏付ける検証的アプローチがあります。データ解析の2つの側面を紹介する中で、仮説の設定とデータの収集・解析をセットで行うことの重要性を伝えています」と語る。
応用パートでは、回帰分析と変数選択、一般線形モデルと対比、医学研究で用いるロジスティック回帰、生存時間解析、ノンパラメトリック法、臨床研究に必要なサンプルサイズ設計、多変量解析について学習する。いずれも座学でしっかりと学んだ後に、実際に手を動かす30分のJMP実習を行う内容になっている。
探索的データ解析の講義では、ヒストグラムや箱ヒゲ図、幹葉表示、積率、中央値/最頻値など、データを眺めて仮説を導き出すための有用なデータ記述方法について学ぶ。JMPを統計教育に用いるメリットは、JMPのデータライブラリに格納されている豊富なサンプルデータを使って講義を進められることだ。
伊藤氏は、「JMP付属のマニュアルで解析例のあるサンプルデータを活用し、統計解析の手法をケーススタディ形式で学習します。データ解析の準備では、外れ値や分布形状、欠測値を確認するときのポイントを押さえますが、学生は適切なサンプルデータを用いたJMP実習を通じて講義内容をより深く理解できます」と話す。
データの分布を確認した後、変数間の関連を見ていくことになる。医学統計分野では、関連性があっても因果関係があるとは限らない。関連性がないように見えて因果関係を持つケースもある。このため、統計的なアプローチだけでなく、関連の強さや一貫性、時間的関係、生物学的用量反応勾配などのさまざまな要素を鑑みて因果関係の有無を判断する必要があるという。
伊藤氏は、「JMPの特長は、変数間の関連を見る際、それぞれの変数について尺度を決めると適切な統計手法を選んでくれることです。分布の要約、2群間の比較、多群間比較、予後因子の調整/層別調整など、解析の目的に対し、結果変数が2値、連続値、生存時間のどれかによって解析手法がだいたい決まっています。これらの手法を網羅して学べるようにカリキュラムを構成しています」と話す。
相関係数が±1に近い値でも直線性がなければ、変数間に相関があるとは言えない。このため、たとえば、JMPで二変量解析を行う場合、2項目のデータを散布図にプロットして直線性があることを確認し、相関係数で要約して良いデータなのかを判断するよう教えている。
講義が進むにつれて、JMPを使うことに戸惑う学生の姿は見られなくなってくる。学生は、JMPに慣れてくると、単にデータを解析するのではなく、JMPを使いながら統計学をきちんと理解しようと意識するようになる。そして、十数回の講義と宿題を経た学生は、JMPを自然に操作できるようになるという。
伊藤氏は、「個人的な目標は、JMPのユーザー会を、いままで以上に熱気のあるものにすることです」と話す。「 今はまだメジャーではありませんが、JMPスクリプトの可能性は高いと思っています。JMPのグラフィカルなユーザー・インターフェイスや、コンポーネントの作りやすさを生かしたJMPスクリプトの面白い発表は、かなりの数が出てきそうです。私も一緒に盛り上げていきます」。
※ 本事例に記載の内容は2015年11月時点のものです
統計解析実習におけるJMPの有用性は高いと感じています。
北海道大学大学院医学研究科
医学統計分野 准教授