<div dir="ltr">This is enormously helpful. Thank you very much! I have spoken to others who express concerns about the reliability of this mapping, and in particular the accuracy of the Japan Post zip code data. We will do our best to keep an eye on how this data behaves in a production system and report any observations here.</div><div class="gmail_extra"><br><div class="gmail_quote">On Tue, Oct 14, 2014 at 8:00 AM,  <span dir="ltr"><<a href="mailto:talk-ja-request@openstreetmap.org" target="_blank">talk-ja-request@openstreetmap.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Talk-ja<br>
メーリングリストへの投稿は以下のアドレスに送ってください.<br>
<br>
        <a href="mailto:talk-ja@openstreetmap.org">talk-ja@openstreetmap.org</a><br>
<br>
Webブラウザを使って入退会するには以下のURLにどうぞ.<br>
<br>
        <a href="https://lists.openstreetmap.org/listinfo/talk-ja" target="_blank">https://lists.openstreetmap.org/listinfo/talk-ja</a><br>
メールを使う場合,件名(Subject:)または本文に help<br>
と書いて以下の アドレスに送信してください.<br>
        <a href="mailto:talk-ja-request@openstreetmap.org">talk-ja-request@openstreetmap.org</a><br>
<br>
メーリングリストの管理者への連絡は,以下のアドレスにお願いします.<br>
<br>
        <a href="mailto:talk-ja-owner@openstreetmap.org">talk-ja-owner@openstreetmap.org</a><br>
<br>
返信する場合,件名を書き直して内容がわかるようにしてください.<br>
そのままだと,以下のようになってしまいます.<br>
"Re: Talk-ja まとめ読み, XX 巻 XX 号"<br>
<br>
<br>
本日の話題:<br>
<br>
   1. Re: reconciling MLIT Shapefile with Japan Post CSV (田渕 直)<br>
<br>
<br>
----------------------------------------------------------------------<br>
<br>
Message: 1<br>
Date: Tue, 14 Oct 2014 13:01:48 +0900<br>
From: 田渕 直 <<a href="mailto:tabuchi_naoshi@trek.co.jp">tabuchi_naoshi@trek.co.jp</a>><br>
To: OpenStreetMap Japanese talk <<a href="mailto:talk-ja@openstreetmap.org">talk-ja@openstreetmap.org</a>><br>
Subject: Re: [OSM-ja] reconciling MLIT Shapefile with Japan Post CSV<br>
Message-ID: <<a href="mailto:543CA02C.9060501@trek.co.jp">543CA02C.9060501@trek.co.jp</a>><br>
Content-Type: text/plain; charset=UTF-8; format=flowed<br>
<br>
Hi Tom,<br>
<br>
The common ID scheme is called<br>
   "全国地方公共団体コード/Zenkoku Chiho-Kokyou Dantai Codes,"<br>
literally meaning "The National Code System for Local Public Bodies."<br>
I don't think there's an official English name for it, but anyway<br>
it's defined as a Japan's industry standard (JIS X 0402).<br>
<br>
For the columns of the postal-code csv, let's take the 1st line<br>
as a reference example:<br>
   > 01101,"060 ","0600042","ホツカイドウ","サツポロシチユウオウク","オオドオリニシ(1-19チヨウ<br>
メ)","北海道","札幌市中央区","大通西(1〜19丁目)",1,0,1,0,0,0<br>
<br>
   The column 1: "01101" is the district's ID, as you mentioned,<br>
            2-3: "060 ","0600042" are the postal codes for the district,<br>
                 the former is now outdated short form,<br>
                 the latter is canonical,<br>
            7-9: "北海道","札幌市中央区","大通西(1〜19丁目)" are the<br>
                 prefecture, city and district, street, respectively,<br>
            4-6: "ホツカイドウ","サツポロシチユウオウク","オオドオリニシ(1-19チヨウメ)" are the<br>
                 pronouciation for the pref./city-and-dist./st. resp.<br>
<br>
Let me omit the remainder: they are rather involved "flags" and won't be<br>
very important for OSM use.<br>
<br>
Lastly, the distinction bw. "oogaki" and "kogaki" wouldn't be serious,<br>
but I believe "kogaki" is a bit human- and machine-friendly;<br>
"kogaki" can easily be canonicalized into "oogaki", but not vice versa.<br>
<br>
Hope it helps (and excuse me for a long post.)<br>
<br>
Regards,<br>
<br>
Noashi Tabuchi (<a href="mailto:tabuchi_naoshi@trek.co.jp">tabuchi_naoshi@trek.co.jp</a>)<br>
<br>
(2014/10/12 1:25), Tom Lee wrote:<br>
> Please excuse me for posting to this list in English. I am not a<br>
> Japanese speaker, but have recently been examining the availability of<br>
> Japanese open data for geocoding addresses. This process has been<br>
> difficult due to my unfamiliarity with the language and character set.<br>
> My hope is to share a summary of my work here and receive criticism from<br>
> experts.<br>
><br>
> My code can be found here:<br>
><br>
> <a href="https://github.com/sbma44/japan_geodata_research" target="_blank">https://github.com/sbma44/japan_geodata_research</a><br>
><br>
> My conclusions and the narrative behind them are present in the<br>
> README.md file, which should display at the bottom of the page when you<br>
> follow that link.<br>
><br>
> In short: I was surprised to find that Japan Post and MLIT seem to use a<br>
> shared ID scheme, allowing postal codes to be mapped, many-to-one, to<br>
> the boundaries of administrative districts offered in a country-wide<br>
> Shapefile by MLIT.<br>
><br>
> It might be that this is already common knowledge -- if so, I would be<br>
> glad to know that, too! If not, perhaps this will prove useful to others.<br>
><br>
> I would be particularly glad to hear suggestions from Japanese speakers<br>
> as to what each column in the postal code CSV should be properly called<br>
> in English and/or in the existing OSM tagging scheme for Japan; and<br>
> whether the difference between the "oogaki" and "kogaki" files offered<br>
> by Japan Post represent a concern.<br>
><br>
> Please do not hesitate to ask questions or point out problems with my<br>
> analysis.<br>
><br>
> Tom Lee<br>
><br>
><br>
> _______________________________________________<br>
> Talk-ja mailing list<br>
> <a href="mailto:Talk-ja@openstreetmap.org">Talk-ja@openstreetmap.org</a><br>
> <a href="https://lists.openstreetmap.org/listinfo/talk-ja" target="_blank">https://lists.openstreetmap.org/listinfo/talk-ja</a><br>
><br>
<br>
<br>
<br>
<br>
------------------------------<br>
<br>
Subject: まとめ読みフッタ<br>
<br>
_______________________________________________<br>
Talk-ja mailing list<br>
<a href="mailto:Talk-ja@openstreetmap.org">Talk-ja@openstreetmap.org</a><br>
<a href="https://lists.openstreetmap.org/listinfo/talk-ja" target="_blank">https://lists.openstreetmap.org/listinfo/talk-ja</a><br>
<br>
<br>
------------------------------<br>
<br>
以上: Talk-ja まとめ読み, 80 巻, 8 号<br>
**********************************************<br>
</blockquote></div><br></div>