(第24回・最終回)AI の時代だからこそ求められるもの:データの質とデータサイエンティストの倫理
現実を「統計的に理解する」ための初歩の初歩(麻生一枝)| 2021.10.19

(毎月中旬更新予定)
前回お話ししたような、ビッグデータで学んだ AI が、人種偏見や性差別、少数派への嫌悪をもつようになった、という話はあとを絶たない。今年(2021年)の 1 月にも、韓国で発売された人工知能チャットボット「イルダ」が性的マイノリティへの嫌悪を示す発言をして、大きな社会問題となった[1][2][3]。利用者がイルダにセクハラ発言をしたところ、翌日にはイルダが同性愛者について「嫌いだ」「憎々しい」と言ったというのだ。
このような話を聞くと、チェスでも将棋でも囲碁でも AI が世界の第一人者に勝つ時代、どんどん賢くなっているといわれる AI なのに、何をどうするとそんなことが起こるのだろう、と疑問に思う人も多いのではないだろうか。
というわけで、最終回の今回はここら辺の疑問に、前回よりもう少し詳しく答えていきたいと思う。「統計の基礎の基礎」のはずが、なんで AI の話になるの、とお思いかもしれない。しかし、実のところ、ここ 10 年余り騒がれているビッグデータと AI のコンビは、統計と縁が深い。なぜなら今流行りの機械学習、その最先端といわれる深層学習は、データから学ぶ学習法だからだ[4]。そして、統計学とは何か。データを集め、解析する学問である。
