[OSM-ja] Yahoo/ALPSデータの一部タグ整理について

Satoshi IIDA nyampire @ gmail.com
2012年 9月 19日 (水) 03:07:38 BST


いいだ@OSMFJ帽子です。

現在も投入が継続されているYahoo/ALPS社の道路データについてですが、
一部タグの扱いについて、みなさんのご意見をいただきたいです。

ImportのMLで、Yahoo/ALPSデータのタグ構造で質問があり、説明の必要もあって内容をまとめました。
結果、Yahoo/ALPSのインポート用データで使用されている一部のタグは重複情報であり、不要な情報である可能性が高い、と思っています。

ついては、一部タグの消去、および整理を行うのはどうでしょうか?と考えています。
現在のタグスキーマは以下のとおりです。
http://wiki.openstreetmap.org/wiki/JA:YahooJapanALPS_Data/Highway/DataStructure


具体的に行う操作を考えてみました。

■既に投入されているデータ
1. "yh:WIDTH" タグは、"width"タグに変換する
2. widthタグへ変換を行う際、以下のルールを適用する
  2-1. wayに対して既にwidthタグが存在している場合、"yh:width"タグの内容は変換せず、切り捨てる
  2-2. yh:width タグから widthタグに変換を行った場合、
   "fixme:width = from Yahoo/ALPS import data"というタグをつける

  2-3. 道路幅を実測できたら、widthタグの値を実測値へ編集し、"fixme:width = from Yahoo/ALPS
import" タグを消去する

3. その他、yh:* で始まるタグはすべて消去

どのようにして変更を行うのかは、まだなにも決まっていません。
BOTで行えるのがベストです。

■これから投入するデータ
いくつかの方針があると思っています。

1. データは現行のままで、OSMへの投入時に "yh:*" ではじまるタグを手動で削除
2. Yahoo/APLS import用データ自体を再生成
3. データもオペレーションも変えない。yh:* タグを残したまま、いったん投入する
 定期的にBOTを回して、yh:*タグを削除・変換してまわる

他にも方策あると思いますが、どんな方法でやるのが手間かからずにゆけるかな?と悩んでいます。


そもそも、Yahoo/ALPSデータは、
インポートの開始と東日本大震災の発生が重なっていたこともあり、
一刻も早い変換とインポートが求められていました。
そのため、Yahoo/ALPS社の元ファイルに書かれていた情報を、
後々の検証でも使えるようにそのまま残しておこう、という意図があったと認識しています。

つまり、ライセンス上で"yh:*"タグを残しておくことが必要、というわけでは無い、という認識です。

Yahoo/ALPSデータのインポートが完全に終わってからのほうがよいのでは?など、
作業の開始時期についてもご意見あるかと思います。

ややこしい問題で申し訳ないのですが、よろしくお願いいたします。

-- 
Satoshi IIDA
mail: nyampire @ gmail.com
twitter: @nyampire



Talk-ja メーリングリストの案内