セミナーレポートレポート

21/9/29 オープン説明会レポ No.01

オープン説明会レポ ADSRA提供データの活用事例紹介

スピーカー:横内大介 准教授(一橋大学大学院 )

横内:このお時間ではADSRAの中で提供されるデータもしくは提供データの元になっているもので、我々がどういうことを研究してきたのかを簡単にご紹介できればと思っています。

オルタナティブデータを使った研究のご紹介

横内:ここでは「中古車市況を利用した新車販売予測」のご紹介をしたいと思います。これは予測というよりナウキャストといった方が正しいかもしれませんが、ユーストカードットコムさん、フィンンデクスさんとの共同研究です。このユーストカードットコムさんからは、今回、市況に関するデータがADSRAでも提供される予定になっています。

中古車市場ではオートオークションと呼ばれているマーケットがあって、そこで買い取りをした車が日本全国から集まって競りが行われ、海外に輸出されたり中古車販売店に並んだりするのが通常です。そこでついているプライスが一種の基準価格になって、中古車販売や海外輸出の動向が決まってくる側面があります。中古車市場が活況な時には、一つの要因として市場にタマがない、つまり車が出品されていないというような状況があります。中古車が出品されてないということは簡単に言うと乗り換えが起きていないということになるので、新車販売にあまり芳しくないことが何か起こっている可能性を示唆します。我々が今研究しているのは、中古車市況自体をいくつかのパターンに分けながら、それを指標化するということです。中古車市況が盛り上がっているのか、それとも盛り下がっているのかということが分かるようなデータを作成し、ADSRAの中にもそれを提供して行こうと考えています。他に中古車のオートオークションそのもののデータもありますが、それは残念ながら通常は外に出せないデータになっています。したがって、今回 ADSRAの中で提供されるのは、そういう市況を表すようなある種のインデックスになります。オートオークションのデータを使って中古車の現在価値を推定するというような研究も具体的には行われていて、実際にAI 開発をして、試験的ではありますがいろいろな企業で使われています。

車以外では、フィンデクスさんと一緒に企業の特許戦略の推定というようなこともやっています。ここでの特許戦略とは、簡単に言うと、特許を長く保持するか、それとも早い段階で切り離すのかということです。どんな特許でもどんどん登録するのか、それとも吟味した特許を登録するのかという点で、どのような戦略をとっているのかを登録された特許から推定して、企業の戦略を見て行こうという研究も行ってきました。また、今回は不動産のデータはまだ提供は決まっていませんが、SREホールディングス(旧ソニー不動産)さんとは不動産価格の推定エンジンを共同研究で一緒に開発しています。こういう内容について、具体的に活用した事例、研究としてわかったことや新たな知見が出た場合には、ADSRAを通じて皆さんにレポートとしてお届けしたり論文として書いて公表したりという活動を広く行っていこうと考えています。

ADSRAで提供するサービス

横内:ADSRAで提供するサービスとしては、データサイエンス教育に関するもの、システム開発に関するものがあります。後者については、元々は野村アセットマネジメントと金融データサイエンスプラットフォームの開発という共同研究を始めたアイデアがベースになっています。それを発展させて作ってきたのが実は今回のADSRAの環境になります。その際に、メインのプラットホームとしては、AWSさんにご協力いただいてシステム開発が進んできました。また、ノーコードで利用可能な次世代統計ソフトウェアをアナザーウェアさんと開発しました。これは、基本的にマウス一つでかなり高度なデータ分析まででき、しかも探索的にデータ分析ができるというツールです。これもADSRAの中で皆さんに使っていただくよう準備をしています。その下に「データサイエンス教育の資料および動画システム」と書いていますが、これは大学との共同研究で社会人向けデータサイエンス教育の研究を行った成果です。これについても、動画システムを利用した教育サービスとしてADSRAで皆さんにご提供することを考えています。

特許戦略に関する研究のご紹介

横内:せっかくの機会ですので、研究成果の中で皆さんにお話ししても差し支えない部分について少しご紹介しようと思います。これは統計学会でもすでに話をしているもので、先ほどの特許戦略に関するものです。
特許戦略というのは特許の保有戦略で、我々がやったのは、どのような形で企業が特許を出願するのか、 そして保持するのかということを調べる研究です。具体的には、特許の標準化データを使って、良い特許を絞り込んで出願している会社ほど値が高くなるような指標と、良い特許を絞り込んでずっと保有し続ける会社ほど値が低くなるような指標の二つ用意し、そういうものが企業価値にどのような影響を与えているかを調べた研究になります。今回は、我々が作ったこの二つの指標のデータがフィンデクスさんを通じてADSRAの環境上でも使えるように準備をしています。このデータには、出願時に特許を絞り込んで特許を登録した後もさらに良いものを絞り込んでいくというグループや、それと全く逆のことをするグループといったいろいろなグループがあるわけですが、それぞれのグループがどのようにリターンに影響するかということを調査した結果があります。

横内:これは、実際に各グループのパフォーマンスの違いです。今回は TOPIX 100の中から銘柄を絞り込んで等ウェイトポートフォリオを作っています。それぞれの特許戦略ですが、特許を出願の段階で絞り込む人たちがⅱ(C-ⅱ+D-ⅱ)、登録の段階で絞り込んで保有する人たちがC(C-ⅰ+C-ⅱ)で表されていて、これらの両方を満たすのがC-iiです。絞り込んで出願し、それをさらに絞り込んで保有するのがこのC-ⅱというグループだと言えます。D-ⅰ以外のグループは何らかの絞り込みを行うわけですが、出願時に絞り込みを行う場合と登録時に絞り込みを行う場合で違いが出ています。結果を見ていただくと、登録時に絞り込みの戦略をとったポートフォリオの方が配当込みTOPIXに比べてリターンが上がっていることがわかりました。つまり、特許をどのように守ってどのように維持していくかということに対して戦略的な行動をとる企業ほど企業価値のリターンが高いという関係があるということが分かったのが今回の結果でした。これはもちろん研究の一側面でしかないので、どのような形で実務の世界に応用できるかわかりませんが、このようなデータを作って研究を行った成果をADSRAの中でもいろいろと公表できればと思っています。

今回の結果は、我々のところでデータサイエンスの非常勤講師をやっていただいている青木さんと学生の下平さんと私の共同研究です。実際にこういう共同研究はいろいろややられていますが、ネットで探しても詳細が入手できないことがほとんどです。我々としては、そういう入手できなかった情報、学会発表のような形で論文としてあまり公表されていないようなデータや内容についても、積極的にADSRAの環境のところで公開していこうと考えています。

金融データサイエンス教育の資料

横内:もう一つの例として紹介するのは、「金融データサイエンス教育の資料」という、2018年~2021年の共同研究の成果の一つです。簡単に言うと、一橋ビジネススクールのデータサイエンス教員が中心となって開発しているデータサイエンス人材育成のための教材開発の研究です。我々としては、実務で要請される能力として、解析をして出てきた結果への説明責任が非常に重要になると考えています。単純に正答率が高いAIを作りましたということではなく、なぜそういうものが出来上がったのかということが分かるような教育を目指し、説明責任が果たせるデータサイエンス人材を育てることができるような教材を作ってきました。言い換えると、数学を教えた後にその数学の手法を勉強するためにデータを提供するのではなく、逆に、あるデータがあった時にそのデータを料理するためにはどのような手法を選んだらよいかという道具の選び方を教えたいわけです。適材適所というわけではありませんが、データ分析をするときにどのような道具を使えば目的のことが達成できるのかがわかる、そういう力を育成するということを念頭においてこういう教材を作ってきました。このような教材についても、一部は実際にシステムを作っている会社のご厚意でこの ADSRAの中で公開していただけることになっています。もちろん全部ということではありませんが、そういう動画を通じて勉強していただけるような環境を支援しようと考えています。

ADSRAの魅力

横内:このような形でいろいろな活動をADSRAの中でやっていこうと思っているわけですが、データ利用団体としてこういう組織を作ったメリットとして研究者目線で感じているのは、多様なデータを非常に低いコストで試せる環境ができるということです。研究成果や教材につながりそうな題材を探すというだけでも非常にコストがかかりますので、これはやはり魅力的だと考えています。本来ならデータをたくさん買ってきて試さなければなりませんが、そういうことをしなくて済みます。また、通常はデータを使う前にいろいろなクレンジングをしなければならず、非常に大変でコストもかかるわけですが、そういうことがある程度終わっている状態で使えるということも非常に魅力的です。

また、教育研究機関というのはその中に閉じこもって研究をしがちな部分がありますが、実社会との新たなつながりが得られるということも、こういう団体に属して活動することのメリットだと思っています。特に、表面的ではなく、企業の持つデータを利活用するというかなり具体的な課題を通じて産学連携ができるというのは、非常におもしろい取り組みになるのではないかと期待しています。

産学連携によってこういう形でデータの蓄積、知の蓄積を行っていくと、データ分析や活用の事例をベースにして、皆さんのデータサイエンスの力が底上げされて、実践力の高い人材を継続的に育成できるのだろうと思います。さらに、そういう人たちが研鑚を積み続けることによって、日本の金融やデータサイエンスの力が全体的に底上げされて、高いレベルでいろいろな競争が始まるのではないかと思っています。このような今までにない新たな効果が出てくるということを期待して、ADSRAの活動は原則手弁当で、非営利な形で進めています。お金は多少かかりますが、ご興味のある方はぜひ参加をしていただき、こういう新しい知の蓄積を皆さんと一緒にやっていければ嬉しいと思っています。

 

会員募集のお知らせ

横内:私は一応事務局というか代表理事を務めていますので、最後に会員の募集に関して少しお話をさせていただきます。現在、会員募集という形で、データを提供していただける団体とデータを利用していただける団体を募集しています。ここに赤字で書いてある一般会員 A、一般会員Bと呼ばれている会員様を特に募集しています。後ほど皆様にはメールで ADSRAの概要をについてもう少し詳細に書いた資料を用意いたしますので、そういうものを見ていただいて、ご興味があればぜひご参加いただければと思っています。

どうもありがとうございました。

編集:ADSリサーチアソシエーション事務局

※当サイト内コンテンツの無断転載・無断使用は禁止です