[OSM-ja] 全国ローソンデータのテストインポートについて

Satoshi IIDA nyampire @ gmail.com
2013年 8月 25日 (日) 11:23:39 UTC


いいだです。

このインポートですが、本日の夜以降を以って、順次いったんリバート作業を行う方針です。

再度のインポートの予定は未定ですが、
以下の事柄について解決策を話し合ってからの作業となろうかと思います。

1. 既存データとの重複の解決(マージ。いわゆる名寄せ)
いくつかの方法があると思っています。
あくまでひとつの私案ですが、Overpass APIをつかって、
既存データとの重複チェックを行うことはできるはずです。

この作業を行いながら、県単位でのインポートを行えばよいのではと考えます。

■手順
インポート後、overpass apiで以下のようなクエリをかけます。
・今回インポートしたローソンの店舗と、
その周辺(15メートル半径くらい)に存在するコンビニ・オブジェクトを検索します。
 Overpass Turboで検索かけて、そのままJOSMに取り込み可能です。

重複と疑わしいオブジェクトが浮き上がってくるので、JOSMでフィルタかけてマージします。

このサンプルだと、既存でway(area)として書かれているものを認識できないので、
もう少し調整する必要があります。
(query typeを wayやrelationにすればひっかけられるのですが、それを1クエリに収めたいなぁ、と思っています)

<osm-script>
        <query type="node">
        <has-kv k="shop" v="convenience"/>
        <has-kv k="source" v="Lawson"/>
        <bbox-query {{bbox}}/>
        </query>
        <query type="node">
        <around radius="15"/>
        <has-kv k="shop" v="convenience"/>
        <has-kv k="source" modv="not" v="Lawson"/>
        </query>
        <query type="node">
        <around radius="15"/>
        <has-kv k="shop" v="convenience"/>
        </query>

  <union>
        <item/>
        <recurse type="down"/>
    </union>
<print mode="meta"/>

</osm-script>


2. Naming Sampleとの調和性
既存のNaming Sampleとのタグ付けとの統一性がとれていない、との指摘もあります。
http://wiki.openstreetmap.org/wiki/JA:Naming_sample

具体的にゆけば、以下の2点ではないかと考えます。
 * name タグにカッコ書きで英語名を入れるかどうか
 * name タグに、支店名までを入れるかどうか
    (例えば、name = "ローソン" なのか、name = "ローソン ほげほげ店"か)

3. refタグについて
インポート用のデータには店舗の認識IDが割り振られていますが、
この一意のIDをサーベイによって調べる手立てがないのではないか、という提起があります。
(レシートなどに記載してあるのでは?とも思ったのですが、書いてない様子)

ref:lawsonなどのIDをふるのも手ではありますが、調査できない、という点はこの方法では解消できません。

4. 定期更新について
静的なデータとして、既存データとのマージが完了した後、
次のステップとして、定期更新のやり方についての討議に移ります。
具体的な方向性が見えたら、あらためて imports ML, talk-ja ML にて議論したいと思います。




2013年8月24日 22:47 Taichi Furuhashi <taichi @ osmf.jp>:

> 山下さん:
>
>
> 古橋です。
>
> 具体的な問題点のご指摘ありがとうございます。
> まさにこういう事例報告をお待ちしておりました。
>
> 関連する問題点を整理して、あらためてローソンデータのインポート方法については
> 考えていきたいと思います。
>
> 取り急ぎ御礼まで!
>
>
>
> 2013年8月24日 22:26 <yasunari @ yamasita.jp>:
>
> 古橋さま
>> 山下です。応答、ありがとうございます。
>>
>> In message <
>> CALp-gFrQPBDtxyMH_e51vQmBE7T+Gt4Q6xBrBGat+kqab6L+BQ @ mail.gmail.com>
>>         Taichi Furuhashi <taichi @ osmf.jp> writes
>>
>>  > > (1)
>>  > >
>>  > >  > 都道府県ごとにインポートしましたので、
>>  > >  > もし、大きな問題がありましたら Revert 処理いたしますので
>>  > >  > ご連絡ください。
>>  > >
>>  > > 今回のインポートの大きな問題は、
>>  > > 既にマッピングされている店舗も
>>  > > 全く考慮なくインポートされたことです。
>>  > >
>>  >
>>  > 全く考慮していないのではなく、
>>  > 既存のデータとのマージ作業はインポート後に行うということが考慮されている点で
>>  > 説明が不十分だったと思います。
>>
>> 「説明が不十分であった」とのことですが、
>> あとからやると言いながらそのマージ作業のめどがたっていないという点で
>> 考慮されていたとは、とても考えられません。
>> 完全に見切り発車です。
>>
>>
>>
>>  > > (2)
>>  > >
>>  > > その上、
>>  > >
>>  > >  > 既存データとのマージ作業は手作業で実施しておりますが、
>>  > >  > 良いアイディアや、ご意見など適宜MLもしくは Twitterハッシュタグ #OSMjp にてお待ちしております。
>>  > >
>>  > > マージに対して解決策が見いだせていないのに
>>  > > インポートを強行されたのも問題と考えます。
>>  > >
>>  >
>>  > 既存のデータが1000ポイント程度ですので、
>>  > マニュアルでの作業で十分対応できると考えています。
>>
>> で、それは、いつまでにどのように行われるのですか?
>>
>>
>>
>>  > > 少なくとも、
>>  > > 今の地図として質が落ちた(ところがある)状態で
>>  > > 放置しないでいただきたい。
>>  > >
>>  >
>>  > すみません、
>>  > もう一度具体的な「質の低下」について具体的な説明をお願いできますでしょうか?
>>
>> 先のメールでは、エリアとノードの例を上げましたが、
>> // そこを正当化されるとは予想外でした。
>> ほとんどはノードが2つある重複です。
>> 例えば、ローソンストア100向日寺戸店
>> http://www.openstreetmap.org/browse/node/1056482121
>>>> http://www.openstreetmap.org/browse/node/2429706491
>> と。
>> もちろん店舗はひとつしか無いのに2つレンダリングされています。
>> http://www.openstreetmap.org/#map=19/34.95307/135.70532
>>
>> それが上記のとおりだとすると1000ヶ所あるのですよね?
>>
>> 我々マッパーが一生懸命書いた一つしか無い地物を
>> ダブってインポートされ、2つ存在するかのようにように
>> レンダリングされている状態を「質の低下」と言っています。
>>
>> さらには上記ローソンストア100向日寺戸店では、
>> 店舗が府道に面しているにも関わらず
>> インポートされたデータでは店舗がビルの奥の方に配置されているという点で、
>> 位置的にも「質が低下」しているといえます。
>> // まぁ、これは今回のインポートとは関係なく
>> // インポート元の精度?の問題でしょう。
>> // マッピング済みの店舗は、どちらの位置が正しいのか
>> // 1店1店精査しながらインポートされれば質の低下はおこりません
>>
>>
>>
>>
>>
>>  > データの重複は、今後のマージ作業を放置することはまったく考えておりません。
>>  > 責任をもって対応いたします。
>>
>> 繰り返しお聞きします。
>> それは、いつまでにどのように対応されるのですか?
>> めどがたっていないのでしょう?
>> 対応できるようになるまで、
>> 「質が低下」したまま放置なさるのですか?
>> それで「責任をもって対応します」と言えるのですか?
>>
>>
>>
>>  > 引き続き、ML上でロールバックについてのご意見が大勢であれば、
>>  > 選択肢として十分ありえると思います。
>>  >
>>  > この点、山下さんも含め、みなさんからのご意見をお待ちいたします。
>>
>> 一旦ロールバックしていただいて、
>> いつまでにどのようにマージするかを検討、確定いただいてから
>> 再度インポートいただくか、
>> 質が低下しないようにマージしながらインポートいただくのが
>> 「責任をもって」の対応ではないでしょうか。
>>
>>
>> 以上、ご検討のほど、よろしくお願いします
>> ----------------------------------------------------------------------
>> 山下康成@京都府向日市
>>
>> _______________________________________________
>> Talk-ja mailing list
>> Talk-ja @ openstreetmap.org
>> http://lists.openstreetmap.org/listinfo/talk-ja
>>
>
>
>
> --
> ## Taichi FURUHASHI(MAPconcierge Inc. President)
> ## MAPconcierge satellite office at http://goo.gl/VgWD6 in NOMAD NEW'SBASE
> ## Vice-President of OpenStreetMap Foundation Japan with sinsai.infoproject
> ## Director of the OSGeo Foundation Japan
> ## Researcher of the center for spatial info. science, univ.of Tokyo
> ## TEL/Skype&Twitter&LI&FB: 070-6401-5963 / http://about.me/mapconcierge
> ## URL/Mail: http://www.mapconcierge.jp taichi @ mapconcierge.jp
> ## GPS/GigaPan/UAV Shop: http://gpsconcierge.jp
>
> _______________________________________________
> Talk-ja mailing list
> Talk-ja @ openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-ja
>
>


-- 
Satoshi IIDA
mail: nyampire @ gmail.com
twitter: @nyampire
-------------- next part --------------
HTMLの添付ファイルを保管しました...
URL: <http://lists.openstreetmap.org/pipermail/talk-ja/attachments/20130825/fb1e5200/attachment.html>


Talk-ja メーリングリストの案内