[OSM-ja] Fwd: [Tagging] Mechanical Edit: fix japanese train stations wikipedia/names fields

ribbon osm @ ns.ribbon.or.jp
2012年 10月 15日 (月) 11:28:15 GMT


On Mon, Oct 15, 2012 at 01:50:46PM +0900, Satoshi IIDA wrote:
> 
> > とりあえず思いつくとしては、Wikipedia:jaのページから
> > どうデータを拾うか、それを説明してもらうことでしょうか。
> そうですね。
>  ・Githubとかにソースをアップロード
>  ・あるいは、Wikiページで説明
> 
> の、どちらかをお願いしてみましょうか。
> (文章で説明してくださっているのでだいたいイメージはわかりますが、
> 細かい部分、という意味ですよね?)

Wikipediaを見てみたのですが、必ずしも項目毎にXMLで構造化されている
わけではないので、うまく拾えるか、という所が気になります。
また、ローマ字部分に付いては、きちんと正規化されていない(大文字小文字が
混じっていたり、大文字だけ)ように見えます。

本当は、Wikipediaのデータがきちんと整備(構造化)されて、そのまますっと
引っ張って来れればいいんでしょうけど。

というわけで、実際はどうなの、という所が見たいわけです。

oota



Talk-ja メーリングリストの案内