はじめに

「マイナビ × SIGNATE Student Cup 2019: 賃貸物件の家賃予測」コンペ（マイナビコンペ）が11月上旬に終了しました。賃貸物件の家賃予測を題材とした学生限定のコンペです。私は学生ではないため参加できなかったのですが、SIGNATEのコンペには珍しく取り組みの共有が認められていたので、ざっと眺めてみました。

signate.jp

一覧

Rank	Link
1~3, 11*	https://signate.jp/competitions/182/summary
1	https://www.slideshare.net/ssuserf0844f/zozei https://github.com/analokmaus/signate-studentcup2019
7	https://github.com/Anguschang582/Signate---Student-Cup-2019---7th-solution
10	https://github.com/OctopCat/SIGNATE_mynavi2019/blob/master/ApproachSummary.md
11*	https://speakerdeck.com/shogonagano/expert-x-contibutor-mainabikonpe2019-aideashang-shou-shang-suraido https://chizuchizu.com/2019/11/19/chizu_data/
12	https://mosamosa.hatenadiary.jp/entry/2019/11/12/191142 https://mosamosa.hatenadiary.jp/entry/2019/11/13/112939
20	https://kyouyap.hatenablog.com/entry/2019/11/13/145836
24	https://twitter.com/ykskks/status/1192680578367098880
29	https://www.acceluniverse.com/blog/developers/2019/11/3-814953-signate-23.html
34	https://tellmoogle.hatenablog.com/entry/signate_mynavicomp_losers_solution
88	https://masanori.hateblo.jp/entry/2019/11/08/175710
90	https://kutohonn.hatenablog.com/entry/2019/11/08/101512 https://github.com/kuto5046/signate

* アイデア賞

コンペ概要

所在地・間取り・築年数などが与えられ、東京23区における賃貸物件の賃料を予測するコンペでした。

評価関数

評価関数は、RMSE（Root Mean Squared Error）でした。比較的外れ値の影響を受けやすい指標です*1。

データ

データに関して特徴的な点は、次の2つだったようです*2。

trainとtestに同一の建物内の物件が存在する
外れ値となる高額物件が存在する

前者について、同一の建物内の物件は賃料も似ている、もしくは階に比例して変動するなど、比較的予想が容易になると考えられます。これらの物件をどのように扱うかが勝負の鍵となったようです。

後者は、評価関数がRMSEであるため、本コンペでは重要な問題となりました。

目的変数の賃料の分布は次の通りです（画像は共に*3から引用）。trainの中に家賃50万円以上の物件は123件しかなかったそうです*4。

f:id:upura:20191121191152p:plain f:id:upura:20191121191206p:plain

また外部データの利用も許可されており、緯度・経度などを多くのチームが活用していた模様です。

コンペ設計

コンペの参加者は724人で、チーム参加も可。一度でも投稿したのは302チームでした。

SIGNATEのコンペには珍しく参加者が公式に議論できる「フォーラム」*5も存在していました。ただし、さほど活発な議論は行われていないようでした。*6でも言及がありますが、KaggleやPropSpace*7など他のデータ分析プラットフォームとは異なり、SIGNATEには議論に対するポイントなどの動機づけがないことが理由の一つだと考えられます。