「機械学習モデルの予測精度を高めろ!生のデータを分析するハッカソンを取材してきた」のサムネイル画像

機械学習モデルの予測精度を高めろ!生のデータを分析するハッカソンを取材してきた

2023.12.21

(※この記事はライフカード(株)主催のハッカソンのPRです。)

あんた、そこに、愛はあるんか??

愛が〜いち〜ばん〜〜 アイフル〜

というCMでお馴染みのアイフルさん。その子会社である、ライフカードさん主催のハッカソン、その名も「アイハック」をご存知ですか?


(※ハッカソンとは?…エンジニアやプログラマーなどが、一定期間集中的にアプリやシステムを開発するイベント。システムの解析・改良を意味する「ハック(Hack)」と、「マラソン」を組み合わせた造語。簡単に言うなら、”プログラミング強化合宿”ですかね)

東大生を中心に、7チーム27名の学生が参加した今回のハッカソン。

一体どんなイベントなのか?

そこに愛はあるんか?


…ということでUmeeTが取材してきました!
機械学習はさっぱりな私でも非常にワクワクするイベントだったので、工学系に進んでいない方もぜひ読んでいってください!


ハッカソンの内容

まず今回のハッカソンの内容ですが、課題は

「カードの支払いができなくなる人を予測するモデルを構築する」こと。

今回扱うデータは、クレジットカードを申し込むときに入力する、生年月日・住所・勤務状況・年収など。ライフカード社が持っている匿名化された大量の生の顧客データを用いて分析することで、「どんな人がカードの返済ができなくなる傾向があるのか?」ということを突き止めていきます。

例えば、簡単な予測を立ててみるなら…

「年収が高い人は、カードの支払いはしっかりできるはずでは?」
「雇用形態によっては、カードの支払いも難しくなりがち?」

などなど。私たちでも単純な予測は立てられると思います。

まるで探偵です


そうして立てた予測を元に、学生たちが自らの知識を使って機械学習モデルを構築し、精度の良い予測をすることを目指すのが今回のミッションなのです!

プログラミングに疎い私は、取材前まで「話を聞いても内容はさっぱりわからないだろう」と思っていたので、扱う課題がものすごく現実的だったことに驚きました…!

今回のハッカソンは、2日間かけてモデルを構築・改良していき、最終的に提出したモデルの予測精度が高い順に順位がつけられるコンテスト方式で行われました。

[広告]

まるで研究者!2日間の熱戦

2日間にわたる長い戦い、UmeeTは2日目の様子を取材してきました。

1日目の様子は写真でお届けします。

〜〜〜〜【1日目】〜〜〜〜

開会式。和やかな雰囲気です。

 

 

 

チームのメンバーでアイデアを出し合います。

 

 

中間発表の様子。

 

〜〜〜〜【2日目】〜〜〜

開始時間になり、ぞろぞろと会場に入ってくる学生たち。

眠そうな顔をしている人も多くいましたが、目は輝いていました。作業開始が告げられると、おのおの自分のグループの机に戻り、すぐさま作業を開始。

 

 

「ここのパラメータがいい感じだな」
「なんでこれで上手くいくんだろう?」
「この結果は感覚と合致してるなぁ」
「指数関数でいけない?」

専門用語も飛び交い、目の前の課題に集中している姿はとても楽しそうでした。

 

私も科学の甲子園などへの挑戦経験があるのでわかりますが、こうやって課題に没頭してひたすら考える時間って、ものすごく楽しいんですよね…!!試行錯誤してちょっとずつ前に進んでいく時間がたまらないです。

プログラミングが好きな人にとっては最高のイベントですね、、、!

「楽しんで欲しい」主催者の思い

学生たちがしのぎを削っている中、今回のハッカソンを主催したライフカード社の桜井さんに話を聞いてきました。

ーー(筆者)普段の仕事は何をされているんですか?

普段はマーケティング部で、まさに今ハッカソンでやっているような、与信を構築することと、顧客データの分析をしていくことをミッションとして活動しています。

ーーハッカソンとほとんど同じ業務内容なんですね!

そうですね!より良い分析ができるように、日々改良を続けています。

ーー今回のハッカソンの目的はなんですか?学生のアイデアを取り入れる、とかでしょうか…。

もちろん、学生から出た考え方を与信基準に活かせたらいいなという目的もゼロではないです。ただ、今回のハッカソンの目的は、学生との接点を持つことを重視していて、学生の方にライフカードの存在を知ってもらう、何の活動をしているのかを知ってもらうことが一番です。楽しんでくれれば良いなと思います(笑)

ーー学生を育てたい、ということですか。

そうですね!

例えば、前回のハッカソン優勝者の方が、立ち上げた会社とライフカードで少し取引をしてたりと、企業同士という形で繋がったりするケースはありますね。

京都で開催した時に参加してくれた京大の子の中には、社員になってくれた子もいて、ハッカソンがきっかけで少しずつ繋がりが広がっていて嬉しいです。

ーー桜井さんから見て、学生たちのレベルはどうですか?

私自身は以前別の事業部にいたので、正確なレベル感はわからないのですが、今回の学生たちは途中経過をみていても非常によくできています。「用意したデータがおかしかったのかな?」なんて思ったくらいです(笑)

専門でもない学生がこれだけのものを作るのか…と感心しています。今度うちの社員と学生で競ってみるのも面白いかもしれないですね(笑)

ーーすごいですね…。チームで協力する形式のようですが、1人での参加も可能なんですか?

もちろんです!友達チームで応募しても、1人で応募してその場でチームを組んでも大丈夫です。

ーー学生に対して、内容に関してのアドバイスはするんですか?

こちらからは1,2ヶ月前くらいから実際にハッカソンでやることの説明と、あとは推薦図書を紹介したり、技術的な質問に答えたりすることはします。ただ、基本的には学生主体で勉強を進めてもらいます。

ーーあくまで主体的に勉強してもらうんですね…!とっても楽しそうです。

ーーハッカソンの主催者として、こんな人に参加してほしい、という思いはありますか?

やっぱり、楽しんでくれる人ですね!このハッカソンがきっかけで、良い繋がりが生まれたら良いなと思います。

前回はみんな集中してひたすら作業していましたが、今回は和気あいあいとしてますね。まあ、今日は二日目なのでみんな疲れてますが。

現在は東京と京都で年に1回開催しているのですが、いずれ全国にも広げて行けたら良いなと思っています!

ーー桜井さん、ありがとうございました!

[広告]

結果発表!優勝グループにインタビュー

「あと5分です!提出をお忘れ無く!」

「…時間になりました!みなさんお疲れ様でした〜!!!」

2日間の勝負が終わり、各グループの成果発表に移りました。

 

 

どのチームの発表も、聞き応えがありました。

発表が終わり、最終成績の発表に!

 

長い戦いの末、見事最優秀賞を取ったグループの学生たちにインタビューをしてきました!

東京大学工学部の計数工学科に在籍中だそうです。

ーー(筆者)最優秀賞、おめでとうございます!今回のハッカソンに参加したきっかけはなんですか?

チームメンバーに誘われて参加しました。全員初心者で、データ分析どころか自分はプログラミングも怪しいくらいでしたが、せっかくのハッカソンなので挑戦してみることにしました。

ーー事前勉強はどれくらいされたんですか?

参加が決まってから1ヶ月間ほど、図書館で本を借りて読むなどして勉強していました。もともと計数工学科での授業のトピックとして取り上げられてはいて、興味はある分野だったので、勉強できて良かったです。

ーーちなみに、勝因はなんだと思いますか?

勝因ですか…

「特徴量かな?」「でも特徴量自体は他のとあんま差がないよな、」
「正直特徴量自体はそんなにじゃない?」
「モデルの構築が良かったのかな」
「キャットブーストが単純に強かったよね、あとはスタッキングが…」
「そうそう最後のスタッキングで安定したよね」「やっぱそれがでかいと思う、最初はあんまりだったから」「いやでもそれは実際そんなことはなかったはず」「一番安定な方法でやったのが良かったんじゃない?…」

ーー(止まらない議論のスイッチを押してしまい内心焦る)

つ、つまり、王道の方法を忠実にやったのが良かったんじゃないか、ということですかね…?

…そ、そうです…かね…?

僕たちも結局のところなんで良かったかはよくわからないので(笑)

ーーそうですよね(笑)

まあでも、とにかく楽しかったということですね!(強引にまとめる)

そうですね(笑) 楽しかったです(笑)

ーー今回のハッカソンで一番苦労した思い出はなんですか?

モデルの精度が伸び悩んだ時に、その原因を解明していく作業が難しかったですね、なにぶんモデル構築ははじめてなもので…かなり苦労しました。

あとは一番最後に点数が伸びたことはとても嬉しくて、印象に残っていますね。2人が別々のモデルをそれぞれ進化させていて、それ単体だとそんなに効果がなかったんですけど、最後に2つのモデルを合体させてみたときに一番いい点数がでて、みんなで「おお!!」となってテンション上がりましたね。終了時間ギリギリだったので、すごく盛り上がりました!(笑)

あとは単純に、最優秀賞と聞いた時は嬉しかったです!まさか自分たちが取れるとは思っていなかったので…!!

ーー改めて、二日間お疲れ様でした&おめでとうございます!インタビューありがとうございました!

まとめ

今回のハッカソンの一番の特徴が、やはり「匿名化された大量の生の顧客データを使う」ということ。

生のデータだと、欠損値や入力ミスがあったり、データの偏りがあったりします。いわゆる「綺麗なデータ」ではないからこそ生じる難しさにどう対処していくか…。ここを考えるのが、このハッカソンの最大の特徴であり、一番楽しいところなんだと思います。

あとは参加した学生たちが終始楽しそうにしていたのが印象的でした!
運営の皆さんの「愛」を感じる、素敵なハッカソンでした

ライフカードさんは定期的にハッカソンを行っているそうなので、気になった人はぜひ調べてみてください!

↓ライフカードのX(旧Twitter)

 

皆さんお疲れさまでした!


 

(おまけ)

お昼にいただいたステーキ弁当がめちゃ美味しかったです!
ありがとうございました…✨愛を感じました!

この記事を書いた人
筆者のアバター画像
すりーむーん
一生けんめいのんびりしてます
記事一覧へ

こんな記事も読まれてます