[OSM-ja] Fwd: [Tagging] Mechanical Edit: fix japanese train stations wikipedia/names fields
ribbon
osm @ ns.ribbon.or.jp
2012年 10月 15日 (月) 11:28:15 GMT
On Mon, Oct 15, 2012 at 01:50:46PM +0900, Satoshi IIDA wrote:
>
> > とりあえず思いつくとしては、Wikipedia:jaのページから
> > どうデータを拾うか、それを説明してもらうことでしょうか。
> そうですね。
> ・Githubとかにソースをアップロード
> ・あるいは、Wikiページで説明
>
> の、どちらかをお願いしてみましょうか。
> (文章で説明してくださっているのでだいたいイメージはわかりますが、
> 細かい部分、という意味ですよね?)
Wikipediaを見てみたのですが、必ずしも項目毎にXMLで構造化されている
わけではないので、うまく拾えるか、という所が気になります。
また、ローマ字部分に付いては、きちんと正規化されていない(大文字小文字が
混じっていたり、大文字だけ)ように見えます。
本当は、Wikipediaのデータがきちんと整備(構造化)されて、そのまますっと
引っ張って来れればいいんでしょうけど。
というわけで、実際はどうなの、という所が見たいわけです。
oota
Talk-ja メーリングリストの案内