(第1回)統計的にモノを見るとは?—数字にだまされないために

現実を「統計的に理解する」ための初歩の初歩(麻生一枝)| 2019.11.18
私達が生きる現実社会の多くの問題の理解には,種々の数値の測定や観察とそれを「統計的に処理する」作業が欠かせません.毎日のニュースでもありとあらゆる機会に「数値」が出てきますが,その意味をきちんと考えたり信憑性を疑うことは、必ずしもなされていないようです.この連載では,誰でも知っておいてほしい統計についての基本的な考え方や, 統計にまつわる誤解や陥りやすい罠を紹介していきたいと思います.(全12回の予定)

(毎月中旬更新予定)

統計的にモノを見るとはどういうことだろう。統計というと、聞いただけでしり込みしてしまう人は多い。平均はまあいいにしても、標準偏差あたりから、$\Sigma$ だの 2 乗だの $\sqrt{\phantom{A}}$ だのが定義式に出てきて、一気に気が削がれる。

しかし、統計的にモノを見ることと、公式の意味を数学的に理解することはイコールではない。数学的にも理解できるに越したことはないが、統計の基本的な考え方そのものは、数学がわからないと理解できない、といったたぐいのものではない。逆に、数学がわかったらすべて理解できる、というものでもない。

「統計的にモノを見る」とは、示されたデータ鵜呑みにせず、それが出てきた背景について、きちんと考えることだ。そして、そのデータが信頼のおけるものかどうかを判断することだ。

誰が、何について、何を知りたくて、どのような方法で調査したのかをきちんと考える。知りたいこと・調べたい疑問や仮説は、明確に定義されているか。調査方法は、知りたいことを知るのに適したものか。最終的にとれたデータは、知りたかった疑問に答えられるものか(計画通りにデータのとれないことはいくらでもある。人はアンケートに答えてくれないし、マウスは実験途中で死んだりする)。データは、適切な統計検定法で解析されているか。データから導かれた結論は、妥当で納得のいくものか。

これらすべてについて、良い意味で批判的に、つまり、批判精神をもって、客観的かつ建設的に考察すること、それが「統計的にモノを見る」ということだ。

手始めに、世界の国々が、今や国の威信をかけて競い合うまでになっている「世界大学ランキング」を見ていこう。「えっ、これも統計?」と疑問に思うかもしれない。しかし、ランキングの多くは、本来複雑で数値では表しにくい特性を、何らかの形で数値化した指数とよばれる値にもとづいている。数値化しにくいものを、無理やり数値化しているので、「出てきた数値は、測りたいものを測っているか」という、調査・研究の根本に関わる問題を常に抱えている。

身長を比べたければ、身長を測ればいい。体重を比べたければ、体重を測ればいい。しかし、人々の幸福度を比べたかったら、何を測ればいいのだろう。知性を比べたかったら、IQ や出身大学の偏差値を比べればいいのだろうか(そうでないことを、私たちは日々の生活の中で知っている)。そして、世界大学ランキングは、いったい何を測ろうとしていて、その測ろうとするものを測れているのだろうか。

下の表1に示したのが、世界初の世界大学ランキングである上海世界大学学術ランキングの内訳、表2に示したのがよく使われているランキングのひとつであるタイムズ・ハイアー・エデュケーション世界大学ランキングの内訳である。さて、どうだろう。あなたの思い描く良い大学、世間一般が考えるであろう良い大学を、適切に評価できるものになっているだろうか。

1.2019 年 4 月 7 日時点でのランキングのHPおよび、藤井[2018]のデータにもとづき作成。

2.2019 年 4 月 7 日時点での各ランキングのHPの記述にもとづき作成。

* Science Citation Indexは、米国クラリベイト・アナリティクス社の提供する引用文献データベースである。この会社は、さまざまな分野における高被引用論文著者リスト、つまり論文の被引用回数の高い研究者のリストも発表している。

** Scopus (スコーパス)は、オランダを本拠地とするエルゼビア社が提供する引用文献データベースである。

おそらく、答えは否だろう。網掛けをした部分が研究面での成果に関係したものなのだが、それが上海世界大学学術ランキングでは 80% 以上、タイムズ・ハイアー・デュケーション世界大学ランキングでも 60% を占めている。デジタル化の進んだ現在、論文の数や論文が引用される回数を数えたり、論文が良く引用される研究者をリストアップするのは簡単だ。それに比べて、入学してきた学生が、どれだけ人として、また、専門家予備軍として成長したかを数値化するのはむずかしい。当然の帰結として、評価のために使われる指標は、数えやすい論文関係、つまり、研究に偏ることになる。大多数の学部大学生にとって、特にまだ自分の将来について思い悩んでいる学生にとっては、多様性に富んだ学びの機会が与えられ、様々なことを経験することが欠かせない。しかし、この大多数の学部生にとって大切な教育の側面は、これらの評価には含まれない。つまり、これらの大学ランキングは、そこで学ぶ学生にとっての良い大学の特性を適切に測れているとは言い難いものなのである。

現在のグローバル社会では、世界のどこのどの大学が良い大学かを知ることは、これから進学をしようという学生にとっても、優秀な人材を得ようとする企業や国家にとっても重要である。自学が世界の中で、どのくらいの位置にいるのかを知ることは、将来有望な学生を集めたい大学にとっても重要だ。したがって、世界大学ランキングの評価基準にどんなに欠陥があったとしても、ランキングは使われ続け、影響を与え続けるだろう。このような状況の中で私たちがすべきことは、ランキングがどのような評価基準にもとづいて作られているかを知り、ランキングの多少の上下に振り回されないことだ。教育や研究の成果は、そう簡単には測れない。そもそも測り知れないものを、測ろうとしているという限界を常に心に留め、ランキング結果は「だいたい、そんなもの」くらいに受け止めておくのがいいだろう。

データが数値で表されると、それが客観的なもの、真実を伝えるもの、と私たちは思いがちだ。ましてや、それに、どこそこの有名な調査会社や大学の発表であるといった権威のお墨付きまでついていると、ついつい信じてしまう。しかし、データは、真実も伝えるし、ウソもつく。今年2月、『データはかた』というタイトルの翻訳本が出版されたが、まさにその通りで、データはかたることも、かたることもできるのである。そして、データの嘘にだまされないために、分野を問わず私たちに今必要なのが、「統計的にモノを見る」能力である。

参考文献

    • 藤井翔太[2018]、『世界大学ランキングと知の序列化—大学評価と国際競争を問う』基礎解説1—世界ランキングの概要、石川真由美(編)、京都大学学術出版会

◇この記事に関するご意見・ご感想をぜひ、web-nippyo-contact■nippyo.co.jp(■を@に変更してください)までお寄せください。


この連載をすべて見る


麻生一枝 長浜バイオ大学准教授.お茶の水女子大学理学部数学科卒業,オレゴン州立大学動物学科卒業,プエルトリコ大学海洋学科修士,ハワイ大学動物学Ph.D. 専門は動物行動生態学.「統計や実験デザインの理解は健全な科学研究に必須である」という信念のもと,これらの教育の普及に熱意を持って取り組む.著訳書に『科学でわかる男と女になるしくみ』 (SBクリエイティブ),『実データで学ぶ,使うための統計入門 ---データの取りかたと見かた』(共訳,日本評論社), 『生命科学の実験デザイン』(共訳,名古屋大学出版会)など.