<div>You are right that XML names (= keys/tags) are valid in unicode </div>
<div>in which case the encoding of the whole XML document (exchange file) </div>
<div>must support this. </div>
<div> </div>
<div>But you know well that many tools have problems with non-ASCII XML </div>
<div>element and attribute names (for content/value UTF-8 is ok since </div>
<div>chars can escaped)!</div>
<div> </div>
<div>So, my last 20cents for valid key names before I give up is the following:</div>
<div>'aAbBcCdDeEfFgGhHiIjJkKlLmMnNoOpPqQrRsStTuUvVwWxXyYzZ_-.0123456789' </div>
<div>whereas such qualified names must begin with a letter and contain at </div>
<div>most one colon and have at most a length of 255. </div>
<div> </div>
<div>I'm happy to see from the existing OSM data that users seem to be </div>
<div>more prudent than some of you which is weird since usually it's the </div>
<div>other way round (look e.g. why we two insert a line feed after 70 chars </div>
<div>way before the end of paragraph) ;-> Just think about it.</div>
<p>Stefan</p>
<div>P.S. Local social bookmark services exist - but mainly because of the </div>
<div>success of the big (ASCII-based) ones.</div>
<div><br><span class="gmail_quote">2008/2/12, Dave Stubbs <<a href="mailto:osm.list@randomjunk.co.uk">osm.list@randomjunk.co.uk</a>>:</span></div>
<div>
<blockquote class="gmail_quote" style="PADDING-LEFT: 1ex; MARGIN: 0px 0px 0px 0.8ex; BORDER-LEFT: #ccc 1px solid">On Feb 12, 2008 1:27 PM, Stefan Keller <<a href="mailto:sfkeller@gmail.com">sfkeller@gmail.com</a>> wrote:<br>
> Thanks for the pointer o XML, Dave.<br>><br>> UTF-8 is a good choice for content, but this is about *keys* (i.e.<br>> attributes).<br>> Keys correspond to XML elements which are defind as names [1](!)<br>
> ... which nicely fits the definition I proposed.<br><br><br>Well, my point was that your proposal was a very small subset of what<br>XML allows for a Name, so no, it really doesn't nicely fit.<br>Just to clarify that, XML allows pretty much anything except<br>
whitespace and most punctuation to be part of a Name. This includes<br>just about any UTF-8 character you wish to bring up. There are lots of<br>other rules and limitations of course, but that's what the grammar on<br>
that page is there to describe, so I won't try to summarise it further<br>here.<br><br>There's nothing special about an OSM key. It's the same as an OSM<br>value contents-wise and should really be treated as such by any<br>
application processing it. This actually makes a lot of programming<br>easier, not harder.<br></blockquote></div>