横浜市立大学大学院データサイエンス研究科 佐藤彰洋教授らの研究グループは、メッシュ統計*1の利活用を可能とする技術的要素を開発し、メッシュ統計基盤上で株式会社ドコモ・インサイトマーケティングが提供するモバイル空間統計(R)*2処理することで、東京オリンピック競技大会期間中のリアルタイムの活動状況観測の実証を行いました(図1、2)。本研究成果により、現在は未利用になっている大量の位置情報関連データの社会的利活用の大幅な推進に結び付くと期待されます。
本研究成果は、「自律分散的世界メッシュ統計基盤を用いたSDGsへの取り組み」として論文誌「応用統計学会誌」に掲載されました。(日本時間2022年7月31日)
研究成果のポイント
- メッシュ統計の統計的品質評価方法を95%信頼区間*3により定式化
- メッシュ統計データの有用な分野が社会の広範囲に存在することを事例的に提示
- 自律分散的メッシュ統計基盤による費用分担モデルによる事業リスクの定式化
(図1)MESHSTATS *4の構造と実証の仕組み(AWS経由で提供されるモバイル空間統計国内人口分布統計(リアルタイム版)から1時間ごとに提供される全国の500mメッシュ統計をMESHSTATSに取り込みWebAPIを経由して各種アプリケーション上で可視化・分析が可能であることを実証。)
(図2)モバイル空間統計(R)を活用し、東京オリンピック競技大会期間中の活動状況観測実証(オリンピックスタジアムにおいて、開会式と閉会式に合わせ、関連流動人口が確認される)
研究背景
メッシュ統計は我が国固有の技術が複数ありながら、対象とするデータの量が非常に多く、また種類や形式などの多様性が極めて高いことから、求められる計算量の大きさがネックとなり、利用が進んできませんでした。横浜市立大学、株式会社丹青社、株式会社リクルート、統計数理研究所、独立行政法人統計センターから成る研究グループでは、メッシュ統計の普及と未利用データの活用を目指して、分野を超えた産官学連携での研究開発を行っています。その中で世界メッシュ統計基盤の自律分散的なアーキテクチャ設計とその実証に必要となるデータ品質、計算機システム構造、人間的組織構造、データフロー間の関係性、並びに経済社会的に持続可能性を有するエコシステムなどに関して研究開発を進めてきました。
本研究開発プロジェクトでは、「虫の目型」と「鳥の目型」の2種類のアプリケーション群を設定しています。虫の目型アプリケーションは場面性を各種メッシュ統計から計量して、実環境での意思決定に反映させる機能を、また鳥の目型アプリケーションは俯瞰性を各種メッシュから計量し、全体性から最適な空間配位を探索する機能を有します(図3)。
(図3)メッシュ統計基盤を用いたアプリケーション分類(虫の目型、鳥の目型)と想定される利用シナリオにおける利用者
研究内容
1)メッシュ統計の統計的品質評価方法を95%信頼区間により定式化
「メッシュ」というデータフォーマットでデータをより流通させるためには、信頼性が重要です。横浜市立大学と統計数理研究所は共同し、メッシュ統計の誤差評価方法について、標本比率による母比率の推計における95%信頼区間の正規分布を用いた近似計算方法を核とし、分類誤りの標本評価誤差を考慮した補正法を組み入れた95%信頼区間の算出原理を示しました。
2)メッシュ統計データの有用な分野が社会の広範囲に存在することを事例的に提示
自律分散的メッシュ統計基盤のアーキテクチャの構築にあたり、アジャイル開発方式でそのプロトタイプシステムMESHSTATSを開発し、データ、アプリケーションプログラム、実用的な利活用方法の試作と試験をしつつ、それらの要求項目を判明させる作業を行っています。そして、地域メッシュコードが我が国の国家規格ではあるが、世界標準となっていない状況を打破すべく、メッシュ統計の国際標準化活動に取り組んでいます。2022年6月30日付けで日本規格協会内ISO/TC69国内対策委員会において日本提案として「メッシュ統計とその応用」と題する国際標準規格を提案することが確認されました。今後、正式な国際標準規格としての発行を目指します。
さらに、複数のビジネス課題と、独立行政法人統計センターの公的統計における課題から、各種のアプリケーションの検討を進めています。
本研究グループは、自律分散的世界メッシュ統計基盤の利用方法として、アプリケーション提供者が保有するデータをメッシュ統計データ化し、統計データの交換だけで元データを秘匿した状況で評価し、有効なアプリケーションペアを発見する方式を提案しました。この方式により、スマートシティ分野における都市OS
*5がかかえるセキュリティ面でのデータ連携上の問題を克服できる可能性を提示しました。
また、データ駆動型デジタルデザインワークショップを半自動で開催するWaaS (Workshop as a Service)を、自律分散的メッシュ統計基盤の機能の一部として利用するユースケースシナリオを株式会社丹青社との事例をもとに示しました。さらに、モバイル空間統計国内人口分布統計(リアルタイム版)のAPIを使った東京オリンピックサイト活動モニタリングシステムの実証、各種メッシュ統計を移動経路上に取り出すことで、移動経路上での流動人口密度、地物密度
*6の計量、新型コロナウイルス感染症シミュレーション基盤との連動など、複数の有用なアプリケーションとその機構、利用方法について事例を示しました。
今回紹介した自律分散的なメッシュ統計基盤の技術を用いることにより、基盤上に複数の有用なアプリケーションを構築し、サービスを提供することが可能となると期待されます。
3)自律分散的メッシュ統計基盤による費用分担モデルによる事業リスクの定式化
メッシュ統計のデータ流通モデルはデータが大量であるが故にデータ準備に必要とされる時間や費用が利用者に集中するため、その流通・利活用がこれまで進みませんでした。さらに、多額の先行投資を利用者に求めることも、普及の阻害要因でした。自律分散的世界メッシュ統計基盤を開発することにより、データ準備時間をこれまでより大幅に短縮できる目途が立つとともに、データ費用分担モデルごとのデータ利活用費用の算定を行い現実的なコストでアプリケーションの利用が可能であることを示しました。
表1は、3種類のビジネスモデルに対する費用回収期間の見積もりを示しています。従来型のサービスIは、必要なメッシュ統計データを事前に全て買取りサービスする場合であり、初期構築費用Rに加えてデータ購入費用Piを必要とし、これを利用者からの利用料cにより償却する期間を示しています。サービスIIは、提案システムを虫の目型アプリケーションとして利用し、必要なメッシュ統計データを局所的にオンデマンド購入する場合であり、初期構築費用Rを利用者ごとの利用料cにより償却する期間を示しています。サービスIIIは、複数地域に対する鳥の目型アプリケーションによる探索問題をJ回のサービスIIの利用で実現する場合の償却期間を示しています。サービスIIとサービスIIIでは、事前にデータを購入するサービスIと比較して、アプリケーションの開発費用回収期間が大幅に短縮できることをモデル計算から導くことができました。
(表1)ビジネスモデルごとの費用回収期間の見積もり
(T* :各ビジネスモデルの費用回収期間、κ:運用期間での平均的利用人数、M:運用期間での平均的運用費用、S:メッシュ統計iの数、Q:部分的なデータ購入費用)
今後の展開
本研究成果により、自律分散的世界メッシュ統計基盤のアーキテクチャに必要とされる機能、構造、技術、利用者の役割に関する要件とそのモデルを提示することができました。自律分散的世界メッシュ統計基盤のあるべき姿と求められる機能要求が判明し、有用なメッシュ統計基盤上に構築可能なアプリケーションとその有用な利用方法についてのシナリオ事例が複数存在していることも判明しました。
今後、本研究成果により判明した各種要求に基づくアーキテクチャの開発とその実証を行うことにより、メッシュ統計データの流通とユースケースに基づく利活用の促進、メッシュ統計データの価値尺度の自動判別などが期待されます。さらに、自律分散的世界メッシュ統計基盤の技術が普及することにより、大量データを用いたSDGsの各種指標の算出、算出した指標を時間的・空間的に意思決定者が利用できる形で個別に提供するアプリケーションなどへの応用も期待されます。
謝辞
本研究は、受託研究費、国立研究開発法人科学技術振興機構(JST)未来社会創造事業の探索加速型「超スマート社会の実現」領域「異分野共創型のAI・シミュレーション技術を駆使した健全な社会の構築」:研究課題「自律分散的世界メッシュ統計基盤アーキテクチャの設計と実証」(研究課題番号:JPMJMI20B6、研究代表者 佐藤彰洋、研究期間:2020 年度~)の支援を受けて実施されました。
https://www.yokohama-cu.ac.jp/news/2020/201216_satoakihiro.html
論文情報
タイトル: 自律分散的世界メッシュ統計基盤を用いたSDGs への取り組み
著者: 佐藤彰洋(横浜市立大学)、菅波紀宏(株式会社丹青社)、加藤茂博(株式会社リクルート)、岩崎学(統計数理研究所)、西村正貴(独立行政法人統計センター)
掲載雑誌:応用統計学
用語説明
*1 メッシュ統計:メッシュと呼ばれる緯度と経度とで囲まれる矩形区画(日本国内では矩形区画は日本産業規格JIS X0410地域メッシュコードとして定義されている)を、データの持つ位置情報をもとにして集計することで作成した極めて細かい区画に対する統計。匿名性、再集計性や選択性、計算可能性など、メッシュ統計データの高い連結結合性を有する。
*2 モバイル空間統計
(R):株式会社NTTドコモの携帯電話ネットワークの仕組みを使用して作成される統計情報を提供するサービス。そのサービスラインアップの一つとして、最短1時間前の人口分布が把握できる「国内人口分布統計(リアルタイム版)」を提供している。
*3 95%信頼区間:統計値の信頼性を評価するための区間推定の指標で、統計値が母数の95%の確率で見いだされる区間。
*4 MESHSTATS:世界規模でメッシュ統計や各種データを利用できるためのデータ・アプリケーション基盤。データの取り出し、結合、可視化、分析、集計、アプリケーションの開発と利用を可能とする機能を有したシステム。
*5 都市OS:都市で利用される多様なアプリケーション間でデータを共有し、相互に融通を可能とするための仕組み。異なるサービス提供者がデータを共有するようにできることから、プライバシーやセキュリティ上の課題が指摘されている。
*6 地物密度:地物(建物、樹木、鉄道駅など自然または人工に存在する地上に存在する物)の存在密度。
参考文献など
・佐藤彰洋、メッシュ統計、共立出版(2019)
・佐藤彰洋、SDG11.3.1 検証作業報告、総務省ビッグデータ等の利活用推進に関する産官学協議のための連携会議 第6 回観測データ利活用検証WG(2022 年2 月22 日開催)
https://www.soumu.go.jp/main_content/000794916.pdf
・新型コロナウイルス感染症シミュレーション基盤
https://www.meshstats.org/covinfo/COVID-19/
・モバイル空間統計 国内人口分布統計(リアルタイム版)
https://mobaku.jp/service/rt_distribution/
※「モバイル空間統計
(R)」は、株式会社NTTドコモの登録商標です。