スマートフォンの位置情報を用いた人流データの信頼性を評価 横浜市立大学が、国際航業株式会社と共同研究
研究のポイント
- 人流データの元となるセンシングにおけるサンプル抽出方法をモデル化
- センシング領域における人口密度に着目したメッシュ統計の生成方法を開発
- 用途に適した信頼度を付与するための信頼性評価の判断となる指標を作成
研究背景
コロナ禍で人の動きの変化に関心が高まる中、自社の開発した人流データをより安心して社会に役立てたいと考える国際航業からの申し入れによって開始した共同研究であり、本研究結果は今後の人流データの活用を考える際に一つの指針となることが期待されるものです。
研究内容
本研究で扱うスマートフォンの位置情報付きログデータは、スマートフォンがWi-Fiのアクセスポイントへ接続したときに収集されます。このデータは位置情報も含むことからプライバシーへの配慮と対策が必要であること、そして、大量のデータが生成されることなどから、その利用の際にはさまざまな課題が指摘されていました。今回の研究では、Wi-Fiアクセスポイント位置情報を含むログデータからメッシュ統計プロダクトの生成過程を取り上げ、その性質を調べました。また、これを利用することで、意思決定を支援するために必要な機能とユースケースについてその特性も分かりやすく整理しました。
さらに、このプロダクト(人流データ)をより効果的に利用するために、生成過程の特徴から信頼性評価も行っています。一様にどこからでもサンプル抽出可能な通常の標本調査と異なり、今回のセンシングにおける標本調査は、母集団のうち観測窓から見える部分だけがサンプル抽出されるといった課題があります。そこで今回のサンプル抽出方法を「のぞき窓モデル」(図1)と名付け、このモデルを前提とした人流データの活用方法を検討しました。研究チームではまずセンサーとなるWi-Fiアクセスポイントの電波領域を推計し、観測窓の大きさや数量、重なりを確認しました。さらに観測領域内での人口密度(1mメッシュ)を算出し、集計しました。このとき調査対象エリアのうち観測窓がカバーするエリアがどの程度あるのかを信頼性評価基準の一つと捉え、メッシュ統計データを作成しました。
図1 サンプル抽出方法のモデル化(のぞき窓モデル)
今後の展開
スマートフォンから得られる位置情報データを用いた人流データには、さまざまな特徴があります。国際航業の「Wi-Fi人口統計データ」には、属性情報(性別、年代)や推定居住地などの情報が含まれていますが、これらの情報は、例えば、ある施設に来訪された方の属性比率、あるいはどこから来た方が多いのかなどの分析に活用することが出来るため、官民問わずニーズが高い情報という事が分かります。しかしながら、このデータもサンプル分析であるため、どの程度のサンプル数があれば母集団の属性や移動傾向を正しく推計できるのかという信頼性評価が必要になります。現状では手法が固まっておらず、過去の経験や別の計測手法による計測結果との照合による評価を行うことが一般的となっています。この点についても統計学の観点から客観的な指標を提示できることにより、より信頼できる人流データの活用方法を見いだせるのではないかと期待されています。
なお、本研究についての論文発表は2021年度内に予定しています。
研究費
本研究は、国際航業株式会社による共同研究費を受けて実施されました。