<div class="gmail_quote">On Sat, Dec 12, 2009 at 12:07 PM, Frederik Ramm <span dir="ltr"><<a href="mailto:frederik@remote.org">frederik@remote.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Hi,<br>
<br>
    OdbL has this requirement where, if you publish a produced work<br>
based on a derived database, you also have to publish either<br>
<br>
(a) the derived database or<br>
(b) a "diff" allowing someone to arrive at the derived database if he<br>
has the original, publicly available database or<br>
(c) an algorithm that does the same.<br>
<br>
Is that correct so far?<br>
<br></blockquote><div><br>I don't think it's quite as simple as that.<br><br>Suppose, considering your WMS example, two separate companies provide identical services:<br><br>A) The first service uses massive processor power to analyse a raw planet dump and provides the output directly.  Perhaps a larger company such as Google might take this approach.<br>
<br>B) The second uses some algorithms and optimisations that involve creating a derived database, but results in exactly the same output as service A.  Perhaps, a smaller company such as Geofabrik might take this approach.<br>
<br>Let's assume that neither company voluntarily publishes any information about their methods.<br><br>On what basis can you demand from company B that they release their intermediate database?  You don't know (for sure) that they have an intermediate database.  The ODbL doesn't give you any rights to ask company A to warrant that they are not using an intermediate database.  <br>
<br>What kind of duck test can you use to be sure that a derived database is involved in the process?<br><br>80n<br><br> </div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">

To use a simple example, let's say I build a WMS that works with OSM<br>
data. To make this perform well at low zooms, I have to combine ways<br>
into longer bits and simplify their geometry. The result is clearly a<br>
derived database that falls under the above, and in practice I would<br>
probably choose the "a" route and simply make a weekly PostGIS dump<br>
available for download and be done with it.<br>
<br>
However, I wonder about the permitted ways of doing (c).<br>
<br>
I guess it would probably permitted to specify a number of PostGIS<br>
commands that achieve the changes. - Let us assume for a moment that<br>
applying these PostGIS commands would require a machine with 192 GB of<br>
RAM and Quad Quadcore processors and still take two weeks to complete,<br>
putting it out of reach of many users. Would it still be permitted to do<br>
that?<br>
<br>
Or, would it be allowable to say: "For simplification, a Douglas-Peucker<br>
algorithm <link to DP wikipedia entry> is used." (leaving open the exact<br>
implementation and parametrisation of DP - bear in mind that with some<br>
algorithms, how they work is easily explained but implementing them in a<br>
way that runs on standard hardware may be a hard task).<br>
<br>
Or, would it be allowed to say: "For simplification, just load the data<br>
set into <name of horribly expensive proprietary ESRI program> and hit<br>
Ctrl-S X Y, then choose Export to PostGIS"?<br>
<br>
What about: "For simplification, we did the following steps: <detailed<br>
instructions that are easy to follow>. These steps in this sequence are<br>
patented by us, so if you want to follow them, please apply to us for a<br>
license to use our patent."<br>
<br>
Bye<br>
Frederik<br>
<br>
_______________________________________________<br>
legal-talk mailing list<br>
<a href="mailto:legal-talk@openstreetmap.org">legal-talk@openstreetmap.org</a><br>
<a href="http://lists.openstreetmap.org/listinfo/legal-talk" target="_blank">http://lists.openstreetmap.org/listinfo/legal-talk</a><br>
</blockquote></div><br>