Hi,<div><br></div><div>I thought about this proposal and this is the current state:</div><div><br></div><div>The processing part (called "engine") should be seperated from the interface (website).</div><div><br></div>

<div>engine - this part processes specific changesets and put the resutl into a database</div><div>website - frontend to display stored data (dashboard), mark false positives/negatives</div><div><br></div><div>extensibility of the engine:</div>

<div>- each criteria (for example see <font face="Droid Sans, sans-serif"><a href="http://wiki.openstreetmap.org/wiki/Detect_Vandalism#Criteria">http://wiki.openstreetmap.org/wiki/Detect_Vandalism#Criteria</a> - this seems to be a good base) is represented by a plugin</font></div>

<div><font face="Droid Sans, sans-serif">- plugins return a score (integer) which stored in the database</font></div><div><font face="Droid Sans, sans-serif">- different types of plugins:</font></div><div><font face="Droid Sans, sans-serif">  ° </font><span style="font-family:'Droid Sans',sans-serif">single
                        changeset scope (i.e.: mass deletion/import, very far movement of nodes)</span></div><div><span style="font-family:'Droid Sans',sans-serif">  ° multiple changeset scope (i.e.: many changesets within short time per user)</span></div>

<div><span style="font-family:'Droid Sans',sans-serif">  ° user related score (i.e.: date of registration, number of edits, blocked user?)</span></div><div><span style="font-family:'Droid Sans',sans-serif">  ° area related score - mark specific area as a suspicious one for some time (i.e.: vandalism of a area by several users)</span></div>

<div><span style="font-family:'Droid Sans',sans-serif">- these scores are may summarized by type and then multiplied/weighted</span></div><div><span style="font-family:'Droid Sans',sans-serif">- engine has to create "fake changesets" containing changes from several changesets being in relation (user, time window) to detect splitted changes</span></div>

<div><span style="font-family:'Droid Sans',sans-serif"><br></span></div><div><span style="font-family:'Droid Sans',sans-serif">Result:</span></div><div><font face="'Droid Sans', sans-serif">- each changeset has a total rating -> use a treshold value to divide them into suspicious and not suspicious</font></div>

<div><font face="'Droid Sans', sans-serif"><br></font></div><div><font face="'Droid Sans', sans-serif">Testing:</font></div><div><font face="'Droid Sans', sans-serif">- </font><span style="font-family:'Droid Sans',sans-serif">previous incidents </span><a href="http://www.openstreetmap.org/user_blocks" style="font-family:'Droid Sans',sans-serif">http://www.openstreetmap.org/user_blocks</a><font face="'Droid Sans', sans-serif"> </font></div>

<div><font face="'Droid Sans', sans-serif"><br></font></div><div><font face="'Droid Sans', sans-serif">Some questions came up within this preparation:</font></div><div><font face="'Droid Sans', sans-serif">- Is there a prefered language? Has this to be specified within the proposal? (language skill has to be rated, so I would decide this during the project phase)</font></div>

<div><font face="'Droid Sans', sans-serif">- I also would like to discuss used libraries and framework within the project phase, or should I decide this also in my proposal?</font></div><div><font face="'Droid Sans', sans-serif">- Should the frontend integrate in the current website (ruby on rails project) or should this just be an optional feature?</font></div>

<div><font face="'Droid Sans', sans-serif">- How detailed should be the proposal? Is it enough to formulate this draft?</font></div><div><font face="'Droid Sans', sans-serif"><br></font></div><div><font face="'Droid Sans', sans-serif">Point out my mistakes and f</font><span style="font-family:'Droid Sans',sans-serif">eel free to ask questions, criticize this draft and share your ideas and thoughts. :)</span></div>

<div><font face="'Droid Sans', sans-serif"><br></font></div><div><font face="'Droid Sans', sans-serif">Best regards,</font></div><div><font face="'Droid Sans', sans-serif">Morris Jobke</font></div>

<div><font face="'Droid Sans', sans-serif"><br></font></div>
        
        
        


<div><br><div class="gmail_quote">Am 26. März 2012 12:14 schrieb kabum <span dir="ltr"><<a href="mailto:uu.kabum@gmail.com" target="_blank">uu.kabum@gmail.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">


Hi,<div><br></div><div>me again. Derick answered my PM and I recognized, that I've missed some features.</div><div><br></div><div>The interface should be a simple website listing the suspicious changesets. As well a possibility to mark false positives and false negatives were great.</div>




<div><br></div><div>Derick suggested also a integration with JOSM and mentioned its changeset reverting capabilities.</div><div><br></div><div>Best regards,</div><div>Morris Jobke<br><br><div class="gmail_quote">Am 26. März 2012 00:36 schrieb kabum <span dir="ltr"><<a href="mailto:uu.kabum@gmail.com" target="_blank">uu.kabum@gmail.com</a>></span>:<div>


<div><br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi,<br><br><div class="gmail_quote">Am 19. März 2012 22:45 schrieb Graham Jones <span dir="ltr"><<a href="mailto:grahamjones139@gmail.com" target="_blank">grahamjones139@gmail.com</a>></span>:<div>




<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

<p>Hi,<br>Thank you for your interest in applying for GSoC with Openstreetmap.   This list will be fine to ask questions.</p><p>Here are a few suggestions to get you started:</p><p>- It is important to understand the fundamentals of what OSM is, so if you have not done so before, please start by creating an account and making some improvements to the map in your local area.</p>






</blockquote></div><div>I heard of OSM a long time ago, but was just to lazy to contribute to. So I tried these days and I was really surprised how fast changes are visible in the rendered map. I've taken several notes of my surrounding waiting for filled into the OSM database. :)</div>




<div>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<p>- It would also be good to look at the OSM data structure.  Details of the xml file format can be found on our wiki. </p></blockquote></div><div>Done :) </div><div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">






<p>- If you search for Nominatim on the OSM wiki you should find some information on the current service and links to the source code to see how it currently does searching to see how it could be improved. </p></blockquote>






<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<p>The project idea was suggested by 'sabas88' - could he/she provide some more information on the issues behind this project suggestion please?</p></blockquote></div><div>I've asked him and the only answer was a link to the GSoC project site in the OSM wiki. :(</div>






<div><br></div><div>I read a lot about OSM, it's mechanism, assistant tools, etc and also about Nominatim and I realized, that this isn't what I want to do. I've looking for some other contribution to OSM and GSoC and found the suggestion for an quality assurance tool specialized for edits/changesets (by Derick Rethans). There are many quality assurance tools but no one like this - or have I missed it?</div>






<div><br></div><div>The idea is to have a engine that gets a (set of) changesets or edits and analyse them. It should detect things like logical mistakes, mass deletions without corresponding insertions, etc and take also user metadata like duration of membership or count of his edits into account. It would be great if it compare the changes with current state of the data in this area and detect senseless checks, because the data is out of date and already corrected. </div>






<div><br></div><div>Some other things to keep in mind while planning:</div><div>- extensibility through "plugins": engine (calls)-> several detection plugins</div><div>- there could be searches for suspicious changesets/edits in specific area</div>






<div><br></div><div>This was just a quick outline of the proposal. Are there some suggestions, wishes, questions or doubts?</div><div><br></div><div>In the next days I plan to specify this proposal.</div><div><br></div><div>






Best regards,</div><div>Morris Jobke</div><div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><p>Hope that helps.   Please feel free to ask more questions as you develop your proposal.</p>







<p>Regards</p><p>Graham</p><br><div class="gmail_quote"><div><div>On 19 March 2012 21:28, kabum <span dir="ltr"><<a href="mailto:uu.kabum@gmail.com" target="_blank">uu.kabum@gmail.com</a>></span> wrote:<br>
</div></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div>
Hi,<div><br></div><div>I am interested in "Nominatim (or alternative)", but there isn't any mentor mentioned. Where could I discuss about the idea?</div><div><br></div><div>Best regards,</div><div>Morris Jobke</div>









<br></div></div>_______________________________________________<br>
dev mailing list<br>
<a href="mailto:dev@openstreetmap.org" target="_blank">dev@openstreetmap.org</a><br>
<a href="http://lists.openstreetmap.org/listinfo/dev" target="_blank">http://lists.openstreetmap.org/listinfo/dev</a><br>
<br></blockquote></div><span><font color="#888888"><br><br clear="all"><div><br></div>-- <br>Graham Jones<div>Hartlepool, UK.</div><br>
</font></span></blockquote></div></div><br>
</blockquote></div></div></div><br></div>
</blockquote></div><br></div>