「1週間程度のコンペ期間で1000万円級のモデルが生まれた」レジカート分析コンペの裏側をマイクロソフト、atmaが語る

【PR】本記事は日本マイクロソフト株式会社のスポンサードコンテンツです。また、本記事はLedge.aiからの転載記事です。

一般社団法人リテールAI研究会は2021年1月末から、「スマートショッピングカートデータを用いた分析コンペ」を開催した。この分析コンペでは、小売店における新たな併売パターンの発見や、個人ごとの購買予測モデル構築、また最終的に構築したレコメンドモデルをカート実機に展開することを目指した内容だった。

今回、この分析コンペティションに協力した日本マイクロソフト株式会社の樋口氏、atma株式会社の山口氏に、本コンペティションの裏側について運営者目線で話してもらった。

データサイエンティストならではの視座を垣間見られた話はもちろん、1週間程度の短い期間ながらもAIスタートアップ企業などに依頼したら1000万円程度は必要なモデルもできあがったと話す。


日本マイクロソフト株式会社 樋口氏


atma株式会社 山口氏

購買データをもとに『次に何を買うか』を分析

スマートショッピングカートデータを用いた分析コンペでは、『ある商品を購入した人は、その後にどんな商品を買うのか』を予測した。

トライアル社のスマートショッピングカートは、「トライアル」の店舗で利用できる、タブレットとバーコードリーダーを搭載したセルフレジ機能付きの買い物カートである。トライアル専用のプリペイドカードをスキャンすることでカートを使用できるようになり、利用客は商品のバーコードをスキャンしながら買い物が可能だ。

買い物中に売場で商品スキャンを終えているため、決済ゲートを通過するだけで会計が完了し、レジ待ちが無くなることがスマートショッピングカート最大の特徴である。そして、スキャンした商品を認識をもとに、オススメの商品を紹介してくれる機能を備えている。

スマートショッピングカートについては、トライアルグループの技術開発を主導する株式会社Retail AI 代表取締役社長・永田洋幸氏に対して取材を実施し、スマートショッピングカートが小売り業界に何をもたらしてくれるのか聞いている。

>> カートを変えたら買い物客の来店頻度を13.8%向上させたスーパーマーケット、その理由は(Ledge.ai)

自由度が高いぶん難易度も高かったコンペ

今回のコンペティションを振り返り、まずはどのような経緯でコンペ開催に至ったのかマイクロソフト・樋口氏に聞いた。

―― 樋口氏
「トライアルさんのスマートショッピングカートは、利用客がカートでスキャンした商品に対して、リアルタイムで商品をレコメンドする画期的なレジカートです。

もともと、このスマートショッピングカートの基盤になっている、Microsoft Azureを用いてレコメンドモデル作ろうと話を進めていました。そのとき、『Kaggle』や『SIGNATE』のようなコンペティション形式でデータサイエンティストを一気に集めて精度の高いモデルを作ってもらったほうがいいのでは、となったのが今回のコンペ開催の発端です。

今回のコンペの目的は当然ですが、トライアルさんで実際に使われるようなレコメンドモデルの作成です」

トライアル社から提供されたという「ユニークなデータ」については、atma・山口氏が次のように解説してくれた。

―― 山口氏
「今回のコンペティションのおもしろい特徴は 通常取り去ってしまう部分も残して、『ほぼリアルなログに近いデータ』を使ってコンペを実施したことです。たとえば、『クーポンを見た』『商品を入れた』『商品をキャンセルした』など、利用客の個人情報は含まれない状態のデータを使ってコンペを開催しました。

実際にコンペで使用する際は、私がある程度データを整形・整合し、クリーニングを行ないましたが、 コンペ参加者が創意工夫をするための“余地”を残すためにも、できる限りデータがもつ情報をそのままにしてお渡ししました」

コンペティションに参加した方からも非常に良い反響があったと山口氏はいう。

―― 山口氏
「今回のレジカート分析コンペティションは、結果的には100名以上はKaggleで言うところの“エキスパート”のような方に参加いただけました。

現場で働いているデータサイエンティストの方からはとくに好評で、『(このようなリアルなデータは)どうやって用意したんですか』と言われるほどでした(笑)」

atmaCupは、コンペティションとしての間口を広げたいと考えて企画されているのも特徴のひとつ。今回のコンペティションでも初心者の方も多く参加していたとのことだが、YouTubeなどで山口氏が分析の手法などを共有し、データ分析の進め方をサポートしていたそうだ。

だが、今回のコンペティションは「かなり難しかった」と山口氏は続ける。

―― 山口氏
「ほかのコンペティションと比べると、今回のコンペティションは相当難しかった印象がありますね。その理由は、データ量が多いとか、予測が難しいとかいう話ではなくて、参加者それぞれで問題設定をする必要があるからなんです。

裏を返せば、問題設定の方法はいくらでもあるのが今回のコンペティションの特徴でもあります。自由度が高く、工夫のし甲斐があったものの、そこで非常に難しさがあったのかと思います」

「AIベンダーに依頼したら1000万円くらいの成果物が挙がってきた」

非常に難易度の高いコンペティションとなったスマートショッピングカートデータを用いた分析コンペ。このコンペティションを振り返って、日本マイクロソフトとatmaのそれぞれに、運営者目線としての感想を聞いた。

―― 樋口氏
「やはり、atmaさんはレベルの高いデータサイエンティストを集めることに非常に長けていると感じました。今回もKaggleマスターの方も数多くいらっしゃいましたし、何よりもAIスタートアップ企業などに同様の案件を依頼したら1000万円くらいは必要になるようなモデルも成果物として提出いただけました。

コンペティションに参加してくれるデータサイエンティストの方って、データサイエンスが好きだから取り組んでくれるんですよね。要するに、楽しんで取り組んでくれているんです。それでいて、非常にレベルの高い成果物がたくさん出てくれるのはとても良い取り組みになったなと感じています。

また、日本マイクロソフトとしては今回の参加者の方、85名ほどにAzure Machine Learningという開発環境をお渡しし、使っていただきました。初めてAzure環境を使った方も多くいらっしゃったのですが、『ノートブックの立ち上げの手軽さや操作性について評価をいただき、今後も使っていきます』など、良い感想を多く聞けたのも嬉しかったです。

そして、今回のコンペティションでは、せっかく良いモデルを出していただけたので、実ビジネスにどのように活用していくのかが重要かなとも思っています。本番環境で実際に動かし、活用するところまでもっていくことが大事ですね」

―― 山口氏
「atmaとしては、率直に多くの方にコンペティションに参加いただけたことが嬉しかったです。先ほども言ったとおり、非常に難しい課題設定で、1週間程度の期間だったにもかかわらず、ものすごく大量のサブミッションをしていただき、相当ハイレベルな戦いでした。

あと、今回のコンペティションでは『ぐるぐる』を使っています。ぐるぐるにはディスカッション機能があり、ユーザーが分析した内容を自由に投稿し、それに対してコメント・イイねをできます。

今回は特にディスカッションがとても有益と言いますか、興味深い内容ばかりだったのも収穫のひとつです。たとえば、『ポテトチップスは購入する方の年齢によってどういうふうに購入されるのか』 や、『大好きな飲み物に思いを馳せる』というタイトルでビールに焦点を当てた非常に高度な分析など、データサイエンティストごとに特定の商品に対してユニークな分析をして、自分なりに解釈を加えて答えを導き出していく過程を見られたんです。

このようなデータサイエンティストならではのインサイトやアイデアが広く公開されて議論されていたのも良かったです」

思いついたことを全部やるデータサイエンティストらしさ

最後に、再び日本マイクロソフトとatmaの両社から、今回のコンペティションの総括を聞いた。

―― 樋口氏
「山口さんがおっしゃったディスカッション機能は本当に素晴らしかったですね。

『データサイエンティストってそういうところに着目して分析しているんだ』とか『そこで自然言語処理を使って、文字を抽出して分析するのか』などと、自分自身としても気づきが多いコンペティションでした。

実際、ディスカッション機能にはスポンサーいただいたカルビー様をはじめとする企業の方からも好評で、優秀なデータサイエンティストが集まると、これだけすごいアイデアが生まれてくるのだと、運営している側としても熱くなりました(笑)」

―― 山口氏
「樋口さんをはじめ、ディスカッション機能を褒めていただけたのは本当に実装してよかったと思います。実はディスカッション機能など、サイト自体を作ったのはほとんど私なので(笑)。

テクニック的な話でいえば、最近注目の『トランスフォーマー(Transformer)』を使ってチャレンジされている方がいたことには驚かされました。トランスフォーマーが使えることは知っていましたし、何人かは使う方がいるかもしれないなと思っていたのですが、本当にしっかりとした成果物に使ってくるとは思っていませんでした。こういう新しく注目されている技術や手法に挑戦する、というのはKaggleでよく言われる『do everything』に倣って、思いついたことを全部やるというのを間近で見られたのは良い経験でした。

いやはや、振り返った今でも感じますが、まさに脱帽です。データサイエンティストって本当にすごいな、と改めて思わされました」

レジカート分析コンペの裏側に迫る全3回の短期集中連載

一般社団法人リテールAI研究会は2021年1月末から開催した「スマートショッピングカートデータを用いた分析コンペ」の裏側に迫るため、Ledge.aiでは全3回の記事で本コンペのキーパーソンにインタビュー取材を実施しているので合わせて読んでほしい。

第1回:
カートを変えたら買い物客の来店頻度を13.8%向上させたスーパーマーケット、その理由は?
https://ledge.ai/regi-cart-competition-vol1/
「スマートショッピングカートは、小売り業界に何をもたらしてくれるのか」を中心に、トライアル社のスマートショッピングカートについて、トライアルグループの技術開発を主導する株式会社Retail AI 代表取締役社長・永田氏に話を聞いた。

第2回:
「1週間程度のコンペ期間で1000万円級のモデルが生まれた」レジカート分析コンペの裏側をマイクロソフト、atmaが語る
https://ledge.ai/regi-cart-competition-vol2/
スマートショッピングカートデータを用いた分析コンペを運営したマイクロソフト・樋口氏、atma・山口氏にコンペ全体を振り返ってもらいつつ、本コンペならではの「おもしろさ」や「魅力的だったこと」を話してもらった。

第3回:
小売り業界でのデータ活用は多くの人の「人生」に影響を与える
https://ledge.ai/regi-cart-competition-vol3/
なぜ小売り業界はDXが進まないのか――。この課題に対して、株式会社Retail AI 代表取締役社長・永田氏とリテールAI研究会・今村氏は「何をすればいいのかすらわかっていない状態」だという。