LIFULL Creators Blog

LIFULL Creators Blogとは、株式会社LIFULLの社員が記事を共有するブログです。自分の役立つ経験や知識を広めることで世界をもっとFULLにしていきます。

「HOME'Sデータセット」に高精細度の間取り図画像データを追加しました

こんにちは、リッテルラボラトリーの清田です。

2015年11月に提供開始した「HOME'Sデータセット」には、おかげさまで多くの研究者の方々からお申し込みをいただいており、すでに20以上の大学の研究室・研究機関にご提供しております。

このたび、「HOME'Sデータセット」に高精細度版の間取り図画像データ(約515万点)を追加しました。間取り図は、物件スペックデータ(面積、部屋数など)だけではわからない住まいの使い勝手の判断材料の一つとして、多くの住まい探しユーザーに利用されています。住まい探しに新たなイノベーションをもたらすような研究に活用されることを期待しています!

f:id:nextdeveloper:20160201143839p:plainf:id:nextdeveloper:20160201143847p:plainf:id:nextdeveloper:20160201143831p:plain

「HOME'Sデータセット」への期待・要望

「HOME'Sデータセット」には多くの方々からお申し込みやお問い合わせをいただいておりますが、なかでも約8300万点の物件画像データには、deep learningなど最先端の画像処理アルゴリズムの研究資源として関心をお寄せいただいています。

一方で、以下のようなデータもあると嬉しいというご意見も多々頂戴しております。

  • 物件データの時系列変化(経済動向の把握など)
  • ユーザーの行動ログデータ(物件検索、問い合わせなど)
  • 物件の正確な位置情報(緯度・経度)
  • より高解像度の画像データ

これらのデータに関しては、プライバシー保護の問題やデータセット作成のコストの課題はあるものの、課題のクリアに向けて取り組んでいきたいと考えております。

物件画像データに関しては、物体認識タスクを主な用途として想定していたことから、まずは画像数を優先して120×120ピクセルのサイズとしていましたが、とくに物件に関する情報をたくさん含んでいる間取り図画像の解析については解像度が足りないというご意見をいただいておりました。

CiNIIGoogle Scholarを検索すると、間取り図にフォーカスした研究はこれまでも多数行われていることがわかります。間取り図に関する研究が盛んになることは、中長期的に住まい探しユーザーの利便性向上につながると考えられることから、まずは高精細度の間取り図画像データをご提供することとなりました。

高精細度版間取り図画像について

今回「HOME'Sデータセット」に追加された「高精細度版間取り図画像データ」は、すでに提供済みの約533万件の賃貸物件データ(2015年9月時点でのスナップショット)のうち、約515万件の物件に紐付けられた間取り図です。

  • 約515万点の間取り図画像ファイル
    • うち、約48万点にはフリーテキストがメタデータとして付与
  • JPEG形式、最大1280×1280ピクセル(不動産会社による提供画像サイズに依存)

間取り図画像からは、以下のような情報を読み取ることができます。

  • 部屋、設備のレイアウト
    • どの部屋どうしがつながっているか?
    • 玄関とリビングの位置関係は?(来訪者から部屋の中が丸見えになってしまうかどうか?)
  • 収納スペースの位置、広さ

たとえば、子ども部屋の位置は玄関からの動線(いったんリビングを通ってから子ども部屋に行けるようにする)が大事だと言われていますが、現在の住まい探しサイトでは、このようなニーズには十分応えられていません。住まいに関する多様なニーズに応えられるようなイノベーションが、データセットの共有を通じて生まれてくることを強く期待しております。

データの入手方法

「HOME'Sデータセット」本体と同様、国立情報学研究所(NII)の情報学研究データリポジトリ(IDR)を通じてご提供します。手続き方法については「HOME'Sデータセット」のページをご覧ください。

※公的機関に所属する研究者の方以外からのお問い合わせは、弊社問い合わせ窓口(corp-info アットマーク next-group.jp)までお願いいたします。