[OSM-ja] ローソンデータインポート、マージ手順案(was Re: 全国ローソンデータのテストインポートについて)

ikiya insidekiwi555 @ yahoo.co.jp
2013年 9月 12日 (木) 08:07:11 UTC


ikiyaです。

3点ほど。

【その1.】:既存データとのマージはほぼインポートデータの上書きで、今後は自動更新では
 ローソンデータに触れる人は偏るのではないでしょうか?

>ローソンデータ・マージ手順書
>既存のデータとインポート用のデータのマージ作業を行う際の手順について解説します。
>  ・
>  ・
>■基本方針
>・"既存データ"の編集履歴は可能な限り残す
>・"ローソンデータ"と競合しない"既存データ"のタグは、残す
>・"ローソンデータ"と競合する"既存データ"のタグは、"ローソンデータ"を採用する
>・Nodeの位置 (緯度経度) は、"ローソン側"を採用する
>・タグづけの競合が発生する場合、”ローソン側”を採用する
>     sourceタグは併記を行う
>・以下の場合には、OSMの”ノート”機能を使い、コメントを残すようにする
> (なお、JOSMのNoteプラグインを使うと、ノートの管理が楽です)
>     Nodeの位置が大幅に変わった場合
>     既存データがAreaで、リレーション化した場合

このマージ方法だと、
既存タグの内容とノードの位置座標ともにインポートデータ優先で上書きされます。
さらにこのローソンデータは日々、インポート更新を計画されるとのこと、
ということはOSMデータ内に一般マッパーによる変更をよしとしないデータができてしまうと思います。
OSM内のローソンデータに触れる人は偏り、提供元にコントロールされるデータにならないでしょうか。


【その2.】:精度の基準を知らせてください。

田中さんも触れられている精度の問題で

>ただ、ローソンさんのデータですが、実はかなり私達の調査方法に近い手法で、
>さらに細かい精度をだせるやり方でノードを置いています。
>(詳しく話せなくてごめんなさい。もどかしいです)
>これは、緯度経度による絶対精度のお話です。
>もちろんOSM側はみなさん(特に都市部では)とても気を使って
>周辺の建物の位置などと調整されていると思います。
>OSMの建物は、常にずれている可能性があることを想起ください。
>これは、周辺の地物との調和、つまり、相対的な精度のお話です。
>どちらを優先しましょう?というお話で、
>いったん絶対精度に合わせませんか?という提案です。
>ちなみにそもそもマージ用に検索を行う場合、
>「重複している可能性あり」と判定するのは15mくらいの半径でヒットさせようと思っています。
>つまり、最大で30mくらいのNode移動になる可能性があります。
># 基盤地図25000を使っているくらいの感覚でしょうか。

と言われますが、
>さらに細かい精度をだせるやり方でノードを置いています。
のコメントだけでは、精度の論点がぼやけています。
精度については透明化してください。1/2500、1/25000なり。

最後に言われている
"# 基盤地図25000を使っているくらいの感覚でしょうか。"
が精度の例えだとしたら、
私のハンディGPSのほうが精度が良い場合は考えられます。


【その3.】:"いったん絶対精度にあわせませんか?"は唐突では?

>もちろんOSM側はみなさん(特に都市部では)とても気を使って
>周辺の建物の位置などと調整されていると思います。
>OSMの建物は、常にずれている可能性があることを想起ください。
>これは、周辺の地物との調和、つまり、相対的な精度のお話です。
>どちらを優先しましょう?というお話で、
>いったん絶対精度に合わせませんか?という提案です。

先にも触れましたが、元データの絶対精度はどの程度なのでしょうか。
また今まで、多くのユーザーがいろんなソースをもとに
相対的な精度を考慮しながらマッピング書いてきた経過があるのに
唐突に絶対精度をかざされても、地図自体も、ユーザーも調和はとれないと思います。



--- On Thu, 2013/9/12, Toshihisa Tanaka <tosihisa @ netfort.gr.jp> wrote:


としです
このインポートデータの位置精度は、GPSのDOP(HDOP)ではどれくらいでしょうか?
また、絶対精度が良い場合、HDOPがさらに良ければその方を採用するという事ですね。
つまり、インポートデータより私の自作ロガーの方が精度が良いならそれを採用するという事で良いでしょうか。


2013年9月12日木曜日 Satoshi IIDA nyampire @ gmail.com:

いいだです。


ローソンのインポートデータですが、マージの手順書を作ってみました。
特に方針部分、違和感を感じる方が多いと思いますので、ぜひぜひご意見をください。

https://docs.google.com/document/d/1hsk4oBwnbtXSoQdqbwWkCsD5m4IYNgAEGr6J7HvMwCA/edit#




■問題になるところ
■1. 既存データがNodeで、ローソンデータがNodeの場合の位置情報
位置情報はローソン側のデータを採用したいと思っています。
「おいおい、調査で置いた情報が優先だろ?」というかた、たくさんいらっしゃると思います。

ただ、ローソンさんのデータですが、実はかなり私達の調査方法に近い手法で、
さらに細かい精度をだせるやり方でノードを置いています。
(詳しく話せなくてごめんなさい。もどかしいです)



これは、緯度経度による絶対精度のお話です。

もちろんOSM側はみなさん(特に都市部では)とても気を使って
周辺の建物の位置などと調整されていると思います。
OSMの建物は、常にずれている可能性があることを想起ください。
これは、周辺の地物との調和、つまり、相対的な精度のお話です。

どちらを優先しましょう?というお話で、
いったん絶対精度に合わせませんか?という提案です。



ちなみにそもそもマージ用に検索を行う場合、

「重複している可能性あり」と判定するのは15mくらいの半径でヒットさせようと思っています。
つまり、最大で30mくらいのNode移動になる可能性があります。
# 基盤地図25000を使っているくらいの感覚でしょうか。

なお、既存のノードの編集履歴は保存するようにマージします。

■2. 既存データでAreaとして書いてあるコンビニ
コンビニの情報をローソンデータのNodeに集約した上で、


リレーションにまとめたいと思っています。


「OSM Wikiによれば、Areaとして描くことも許されているのでは?」というかた、たくさんいらっしゃると思います。
はい、そのとおりです :)

ただ、この方法で描く方法の利点は2つあります。

2-1. コンビニの廃業を考える
コンビニが撤退することなどを考えると、
コンビニの敷地をlanduse=retailとして表現し、別途コンビニのNodeを置くほうが
表現としてスッキリすると思っています。



あくまでコンビニは、かなり一時的な店舗施設であり、その土地を持ち続けるわけではありません。
(では同様の描き方を学校などにも行うの?という意見、あると思います。それは別の議論として、ここでは開店閉店のサイクルが早いコンビニに焦点を絞らせてください)

2-2. データとして扱う際の取り回しやすさ
コンビニの店舗情報をNode側に持たせるか、
それともRelation側に持たせるか、悩ましいところです。



ただし、Node側に持たせることで、データを使う側として考えた時に扱いがしやすい、というメリットが有ります。
主にデータ利用者からして、「リレーションのことを考えなくて済む」「中心点を算出しやすい」というメリットが生まれます。

また、type=siteリレーションは、広く利用されているとはいえ
情報の定義に不確定さを持っており、利用するにはちょっとはばかられます。
(role定義がまともに決まっていない)





当然、テストをする段階で、悩む場面はさらに出てくるとは思います。
ひとまずのたたき台として、どうでしょう?


-- 
Satoshi IIDA
mail: nyampire @ gmail.com

twitter: @nyampire


-------------- next part --------------
HTMLの添付ファイルを保管しました...
URL: <http://lists.openstreetmap.org/pipermail/talk-ja/attachments/20130912/65d7c160/attachment.html>


Talk-ja メーリングリストの案内