<div dir="ltr"><br><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div class="gmail_extra"><br><div class="gmail_quote"><div><div>On 4 April 2015 at 19:24, Aruna S <span dir="ltr"><<a href="mailto:safincrazy@gmail.com" target="_blank">safincrazy@gmail.com</a>></span> wrote:<br></div></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div><div><div dir="ltr"><div><div><div>Hello!<br><br></div><div>Long email warning.<br></div><div><br></div>I've been thinking a little bit about
 automating the translation of maps into multiple Indic languages ever since I saw the Kannada map at geoBLR in March.<br><br>I started some 
work on it today, and I have lots of interesting things to report. Right now I am mostly transliterating as opposed to translating but if a dictionary of common words/tags can be compiled, upgrading the script to translate instead of transliterating should be doable.<br></div><br></div></div></div></div></blockquote></div></div></blockquote><div><br></div>Fascinating stuff Aruna, this is opens up some great ideas to explore.<div><br></div><div>A few days back wile<a href="https://twitter.com/geohacker/status/583605884581883904" target="_blank">¬†talking to a Uber taxi driver</a>, he said he would prefer English names on the map because he found the Kannada names for common names like block, street, road, hospital etc unfamiliar. He was happy to see the Kannada script in use though, so there is a definite use for transliterated rather than translated English names.</div><div><br></div><div>Translated/localized names seems to be of more interest from an official viewpoint, for the government and in use in education, but probably not practical for everyday use at this time. Eventually we would need a mechanism to make both indic translated maps as well as transliterated ones.</div><div><br></div><div>¬†</div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div><div><div dir="ltr"><div></div><div>Here's the algorithm I followed:<br></div><ol><li>Get the nodes within a bounding box from OSM using the python wrapper for Overpass - <a href="http://python-overpy.readthedocs.org/en/latest/example.html" target="_blank">overpy</a> - This returns a collection of nodes and associated ID, tags, lat, lon and other attributes. This can also be repeated for ways by using the corresponding overpy query.<br></li><li>Filter nodes that have tags</li><li>From the result of the filter, identify nodes with Indic language tags - eg:["name:kn"]</li><li>Transliterate the string value for tag["name:kn"] to another language - I used Tamil - and store it within tag["name:ta"] - I used the <a href="http://silpa.org.in/Transliteration" target="_blank">Indic transliterator</a> <a href="http://transliteration.readthedocs.org/en/latest/" target="_blank">APIs from SILPA</a> for this</li><li>Create a new changeset and upload the result(node with tag["name:ta"]) to OSM using <a href="http://osmapi.divshot.io/#OsmApi.OsmApi.NodeUpdate" target="_blank">osmapi</a></li></ol><p>I did it only for one node: <a href="https://www.openstreetmap.org/edit?node=1118255762#map=19/12.99451/77.55430" target="_blank">https://www.openstreetmap.org/edit?node=1118255762#map=19/12.99451/77.55430</a><br></p><div><br></div></div></div></div></blockquote></div></div></blockquote><div><br></div><div><br></div><div>Sajjad and I have been discussing how to practically approach this wrt to the OSM data model and tags. Like indigomc mentioned, since transliterations can be automated, it probably does not make sense to store transliterations in OSM itself, but as a separate dictionary which can be looked up by the rendering engine to switch to practically any language.</div><div><br></div><div>It does not seem like anyone has thought much about how such a system could work and India could be an ideal testing location since we have a practical need for it.</div><div><br></div><div>One possibility is to generate a simple csv of names and transliterated names, which can be attached to the OSM geometries in a custom rendering flow using Mapbox Studio. If you can prepare such a csv, i'd be happy to try this out.</div><div><br></div><div><br></div></div>-- <br><div>
<div>
<div>Arun Ganesh<font color="#333333"> </font></div><div><a href="http://en.wikipedia.org/wiki/User:Planemad" target="_blank"><font color="#3333ff">(planemad)</font></a></div>
<font color="#333333"></font></div>
<a href="http://j.mp/ArunGanesh" target="_blank"><font color="#999999"></font></a></div>
</div></div>