事業評価、JICAにおけるその重要性
独立行政法人 国際協力機構(以下、「JICA」)は、日本の政府開発援助(ODA)の実施機関として、開発途上国に対してさまざまなアプローチによる国際協力を行っている。JICAでは、「技術協力」、「有償資金協力」、「無償資金協力」と呼ばれる主要な3スキームを基軸に、毎年それぞれの国やセクター別の事業成果を評価し、JICAのビジョンである「信頼で世界をつなぐ」を念頭に事業の改善を進めている。
長年、国内外の製薬企業でデータサイエンス(データマネジメントと統計解析)に携わり、現在はJICAの評価部に所属する正木朋也氏は、今の職場に移ったきっかけについて、「国際協力の現場では社会的弱者を支援するためにさまざまな施策が提案され実施されています。同じ人を助ける仕事ですが、事業の継続と発展を優先せざるを得ない多くの企業とは異なり、一旦、営利活動から離れた視点から全体像を俯瞰しつつ、直接、裨益者となる現場にアプローチすることへの意義をより強く感じたこと」と語る。
希少疾患に対する新薬開発などの一部業務を除いて、基本、成果(=利益)が出ないものにリソースを割くことを避けがちな企業とは異なり、JICAは国際協力事業の場を介してより大局的な視点から二国間の良好な関係性を高め、ひいては国内外の国際協力のあり方とその整合性も踏まえた総合的な成果を求める。そこではさらに「持続可能な開発目標」(SDGs)も見ながら、「Human Well-being/Happiness」や「誰1人取り残さない(LNOB: leave no one behind)」といった指標化が難しい課題にも同時に取り組んでいる。
そのようなJICAにとって、事業評価は重要な活動の1つだ。主に海外の拠点で実施する内部評価と業務委託により実施する外部評価の結果を世界に向けて示すことでその説明責任を果たすとともに、それらからの学びを得て、教訓として次の事業に活かすことが可能となる。
視覚的なグラフが、より自由で柔軟な思考を導く
この事業評価の結果は、事業評価年次報告書として毎年発行されているが、正木氏が担当しているのはその統計分析部分だ。他の統計ソフトウェアを業務に使用する同僚が多くいるところ、年次報告書に載せるデータの解析に正木氏がJMPを選ぶのには理由がある。
「JMPはデータがダイナミックに図表と連動するため、グラフとデータテーブルを見ながら、その場でインタラクティブな解析ができます。しかも、サイズやオプション制御が煩雑となりがちな描画のプログラミングを行なう必要がなく、また、再現性の担保が必要な場合にはJMPスクリプトを解析用データセットとともに1つのファイルとして保存できることがメリットです」と同氏。たとえば、JMPのデータフィルタでサブセットを作成し、変数の値の順序や属性を変更すれば、その結果はインタラクティブに分析のレポートに連動する。そのため、ページごとの内容の割り振りに応じた図表の作成と共有を効率的に行える。
また、以前は分析結果をMicrosoft WordやMicrosoft PowerPointに貼り付け共有していたが、最近はJMPレポートをインタラクティブHTML形式で書き出して適所に置いて共有することが増えている。これにより、相談者がJMPのライセンスを持っていない場合でも、動的に連動するグラフを含むレポートを操作しながら、相談者自らの気づきに応じて、データを探索的に把握・認識できるようになる。
さらに正木氏は、「JMPで複数の回帰モデルを作成するような場合に、予測プロファイルを見ながらモデル構成や寄与の程度の確認・比較ができることはJMPの大変優れた特徴」であり、また「JMPに関する技術的な疑問にすぐに解決できる支援体制が整っていることも重要です。先日は、JMPテクニカルサポートにJMP独自と思われた図の仕様を確認し、生成AIを用いてPythonとRによる結果の再現を行いました。自ら品質保証したうえで自信をもってJMPで作成した図を年次報告書に掲載することができました」と補足する。
「JICAの事業評価年次報告書の統計分析部分の多くは、まずJMPで作成しています。他のツールよりも圧倒的に速く、イメージしているデータを可視化できるので、限られたリソースのもとで早期の判断を求められるようなビジネスにも向いていると思います。」(正木氏)
データの可視化がもたらすメリットはこれだけではない。「相談に来る同僚と話していると、彼らが自分の扱っているデータがどのようなものなのか把握できないままに、データ分析を進めているケースが多々あることも気になっていました」と正木氏。
同氏は続けて、「彼らに元データの分布やその特性理解の大切さを伝えなければならないのですが、その時にもJMPは非常に役立っています。たとえば、同僚の前で『一変量の分布』プラットフォームを使い、元データの分布型を視覚化したうえで要約統計量などを見せれば、異常値などの存在とともにどのようなデータを扱っているのかを実感してもらえます」と振り返る。
データを可視化することで、自分の想定と手元のデータが少し違うことに気付く。そこから元データに基づく本質的な課題への思考が深まり、他の同僚との議論が活発化する。分析前にデータの分布をしっかりと目で見て理解することの大切さを正木氏は強調する。
データ解析における重要なポイントと今後の展望
データ解析のポイントについて同氏は、「データ解析とアート(創作と表現)は似ているところがあります。データをよく見るというのは、作陶にたとえれば、材料の粘土をこね始める前に、その素材の特徴を知りそれを活かすためのイメージをつかむことに近い」と述べる。
裏を返せば、元のデータをよく見ず、先行研究や過去の経験を妄信して、得られた統計量や仮説検定など、ある意味縮約した結果をもとに全体を誤認するリスクがある。元の材料のもつ特性を知らないままに単純作業を行えば、データ解釈時に課題の本質を見落とす危険性もある。では、それをどう回避すべきか。
「本来は、データをしっかり眺め、適切な分析手法が何であるかを判断しながら、探索的に検討すべきです。その際、単純に分布を可視化してデータをよく眺めることで、直感的にどのように解析すべきかに気づけます。その最も基本的かつ重要な部分についてあまり手間をかけることなく直感的に操作できるJMPは、他の各種ツールに置き換えることは難しいです。元データの全体像を的確に把握しなければ、意義ある解析とその解釈への示唆を得ることは大変難しいでしょう」と正木氏。
可視化によりデータの本質を理解することの大切さを説く正木氏。発売当初からのユーザーでもある同氏は、最後に今後のJMPの活用法について、「現在使っているJMP Pro独自の機能である機械学習や構造方程式モデル(SEM:Structural Equation Models)により、複数のJICA事業が、相互にどのような連鎖のつながりのもとに最終的なゴールへ結びついているのか[1]を視覚的に共有したうえで評価を実施したいと考えています」と次の目標やそれに向けての意欲を語ってくれた。
*1: 変化の理論(Theory of Change)に基づいて、個別事業の総体として期待する因果連鎖とその程度を視覚化して関係者で共有し改善につなげること。