(第24回・最終回)AI の時代だからこそ求められるもの:データの質とデータサイエンティストの倫理

現実を「統計的に理解する」ための初歩の初歩(麻生一枝)| 2021.10.19
私達が生きる現実社会の多くの問題の理解には,種々の数値の測定や観察とそれを「統計的に処理する」作業が欠かせません.毎日のニュースでもありとあらゆる機会に「数値」が出てきますが,その意味をきちんと考えたり信憑性を疑うことは、必ずしもなされていないようです.この連載では,誰でも知っておいてほしい統計についての基本的な考え方や, 統計にまつわる誤解や陥りやすい罠を紹介していきたいと思います.

(毎月中旬更新予定)

前回お話ししたような、ビッグデータで学んだ AI が、人種偏見や性差別、少数派への嫌悪をもつようになった、という話はあとを絶たない。今年(2021年)の 1 月にも、韓国で発売された人工知能チャットボット「イルダ」が性的マイノリティへの嫌悪を示す発言をして、大きな社会問題となった[1][2][3]。利用者がイルダにセクハラ発言をしたところ、翌日にはイルダが同性愛者について「嫌いだ」「憎々しい」と言ったというのだ。

このような話を聞くと、チェスでも将棋でも囲碁でも AI が世界の第一人者に勝つ時代、どんどん賢くなっているといわれる AI なのに、何をどうするとそんなことが起こるのだろう、と疑問に思う人も多いのではないだろうか。

というわけで、最終回の今回はここら辺の疑問に、前回よりもう少し詳しく答えていきたいと思う。「統計の基礎の基礎」のはずが、なんで AI の話になるの、とお思いかもしれない。しかし、実のところ、ここ 10 年余り騒がれているビッグデータと AI のコンビは、統計と縁が深い。なぜなら今流行りの機械学習、その最先端といわれる深層学習は、データから学ぶ学習法だからだ[4]。そして、統計学とは何か。データを集め、解析する学問である。

このコンテンツを閲覧するにはログインが必要です。→ . 会員登録(無料)はお済みですか? 会員について

麻生一枝 成蹊大学非常勤講師.お茶の水女子大学理学部数学科卒業,オレゴン州立大学動物学科卒業,プエルトリコ大学海洋学科修士,ハワイ大学動物学Ph.D. 専門は動物行動生態学.「統計や実験デザインの理解は健全な科学研究に必須である」という信念のもと,これらの教育の普及に熱意を持って取り組む.著訳書に『科学でわかる男と女になるしくみ』 (SBクリエイティブ),『実データで学ぶ,使うための統計入門 ---データの取りかたと見かた』(共訳,日本評論社), 『生命科学の実験デザイン』(共訳,名古屋大学出版会),『科学者をまどわす魔法の数字,インパクト・ファクターの正体---誤用の悪影響と賢い使い方を考える』(日本評論社)など.