コラムデータ分析

大学のデータサイエンス教育事情について

大学のデータサイエンス教育事情について

 世界的なデータの利活用のブームを背景に、データサイエンスというキーワードを様々なメディアで見かけるようになりました。小職がまだ大学院生だったおおよそ二十数年前は、データサイエンスのコンセプトはおろか、言葉自体の受け入れを拒否していた国内の統計学の研究者が大勢を占めていましたが、いまでは自身の専門のひとつとして率先してデータサイエンスを含めることも多く、隔世の感を禁じ得ません。
このような社会的な流れを受けて、全国各地の大学でデータサイエンスに関する学部、学科が急速に設置されています。ほかにも、学部としては設置していないが、教育プログラムとしてデータサイエンスに関する学びを学生に提供している大学、短大、高専も数多く現れています。実際、内閣府、文部科学省及び経済産業省が創設した「数理・データサイエンス・AI教育プログラム認定制度」で認定された教育プログラムを提供している大学、短大、高専は令和3年度だけでも合計で78件(令和3年12月末時点)あります。

 これらの学部やプログラムが提供している教育内容に目を向けると、データサイエンス教育といっても、データを扱う際に必要となるであろうスキルセットをおのおのの学校で定義し、従来から設置されている数学(含む統計学)、情報科学の科目群の中から各スキルセットに対応する科目を選び出し、それらをまとめて1つのパッケージにしているのが実態のようにみえます。もちろん、データ利活用に関する倫理や法律などが新たに設置された科目として加わっていることもありますが、一から新たに作られた科目の数は限られているように見受けられます。もちろん、現在の大学、短大の限られた経営資源を考えれば、既存科目の再編による教育プログラムのパッケージ化は致し方ない面もあると思います。私自身、数学、情報学の知識がある程度なければ高度なデータサイエンスの仕事はできないと考えており、大学がそれらの教育を提供する意義や重要性は非常に高いと思っています。しかしながら、これらの教育の提供だけで社会が求めているデータサイエンティストを育てているということになるのかというと、そうとは言い切れない面もあると考えています。

 たとえば「平均の計算」を従来の座学のスタイルで教えるというケースを考えてみましょう。まずは算術平均、調和平均、幾何平均などの定義を数学として説明し、その後、適当なデータを1つ持ち出してエクセルやpython での計算の仕方を教えてそれを実習とし、平均に関する教育を終わりにすることは、現場ではそれほど珍しくありません。結果としてそのような教育を受けた社会人は、割合(%)を記録しているデータにすら算術平均を適用するようになってしまうことがあります。私の所属は社会人大学院なので社会人と話をする機会が多いですが、実際に会社の中でも割合データの算術平均を行い、誤った平均値によって会社の意思決定を行っていることが少なくないそうです。また、私が過去に見てきたデータ分析事例でも、門徒物知らずといわんばかりに特定の機械学習手法一辺倒で分析を行い、もっとシンプルで有益な分析手法が試されていないケースは枚挙にいとまがありません。データの利活用を促進するということが現代の社会的な命題であるならば、この例でいうところの「どのようなデータにはどの平均を使うのが適当なのか」という「道具の選び方」についての教育はこそ考えるべき課題なのではないでしょうか。

 一方で、このような高等教育機関と実社会の間を埋めるような実践的な教育は、研究機関である大学が行うよりも、ADSRAのような産学連携の団体や専門職大学院が担うのが適当ではないかと考えています。私の所属している一橋大ビジネススクール金融戦略・経営財務プログラムのデータサイエンスの講師陣は、スキルセットの教育に加えて実社会で使われているデータを取り上げながら道具の選び方を意識した教育を行ってきました。ADSRAでも、協力会社の賛同を得ながらこれらのデータサイエンス教材をさらに実践的な形式に改訂、再編し、オンデマンド動画コンテンツとして提供する準備を始めています。また、ADSRAが提供しているサンドボックス上のデータは、実務でも実際に使われている生のデータであり、より実践的なデータサイエンス教育の材料という意味でも大いに魅力的なコンテンツといえるでしょう。加えて、我々ADSRAの会員が実際にサンドボックスのデータを加工、解析して、その方法や実際に起きた問題点などを会員で共有し続けることができるのならば、それ自体が社会人向けのデータサイエンス教育として、さらには日本企業のデータサイエンス力の向上に対して、一定以上の意味を持つことになるのではないでしょうか。このような他に例のないデータ環境構築に尽力していただいた運営会員、データ提供会員の皆様に対して感謝を示しつつ、会員諸兄姉によるADSRAサンドボックスデータの活発な利用を願ってやみません。

著者:横内大介 准教授(一橋大学大学院 )
編集:ADSリサーチアソシエーション事務局

※当サイト内コンテンツの無断転載・無断使用は禁止です