1) Remote consoles would seem to be a high priority<br><br>2) Each server should have a primary and a secondary sysadmin that can kill / restart stuff if the primary sysadmin is not available<br><br>3) OSMF should have a board member with executive responsibility for Operations.
<br><br><br><div><span class="gmail_quote">On 7/18/07, <b class="gmail_sendername">Steve Coast</b> <<a href="mailto:steve@asklater.com">steve@asklater.com</a>> wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
All<br><br>Despite handing off tile to jburgess and www to TomH, and sysadmin in<br>general to NickH I'm still accused of centralising control and being<br>evil (I'm looking at you Lars). I don't think I'll ever stop being
<br>accused of being evil but I will admit to the frailty of not having<br>infinite hours in the day.<br><br>We need to fix the sysadmin situation.<br><br>I'm really sorry if you think I got it wrong, but I did the best I
<br>could.<br><br>When OSM started it ran on my desktop machine at UCL where I was a<br>sysadmin. I used to love tuning MySQL and setting up mail servers for<br>the little corner of a department I occupied. That was 3 years ago.
<br>Today, unless I'm much mistaken, my old desktop is still sitting in<br>the rack unused. That, or it was sold off.<br><br>I somehow managed to convince a very competent sysadmin, Nick Hill,<br>to be our sysadmin. He really helped us in setting up the racks we
<br>got. You may remember that we (Nick Black too) salvaged these from a<br>storage depot in the middle of nowhere, arranged hosting (which we<br>have till this day) and installed a bunch of machines which NickH<br>built. He built them from parts he spent time buying after selling
<br>off donated old machines we got. He did some really innovative things<br>to make this all happen, but I'm not going to tell you about that.<br>Suffice to say we owe him a debt of gratitude for all this. Never<br>mind that he mapped a significant section of London.
<br><br>I became aware that I wasn't getting the time to load up planet every<br>week to tile and so I handed that off to jburgess and he's done great<br>work there. It now works. www similarly with TomH. 80n and ojw have
<br>requested handing root on dev to spaetz which I'm doing now. That<br>just leaves wiki - a VM machine hosted at bytemark for free very<br>kindly. So the current set up looks like this for root accesS:<br><br>all machines: nick hill, steve coast
<br><br>additionally:<br><br>www: tomh<br>tile: jburgess<br>dev: spaetz, nick black (for stateofthemap hosting stuff)<br>wiki: none<br><br>I've shared root with people before on a machine, and it's always<br>ended in tears. Someone installs a cpan module, and then someone else
<br>the same thing as a debian package. Things break. Communications<br>fail. So, I've been reluctant to hand off root control simply because<br>of the organisational hassles and innevitable failures. It makes it<br>simple to hand off machines to those that not only want to sysadmin
<br>but are deeply involved in the aspects. That is, jburgess does just<br>sysadmin tile, hes also fixed lots of cool stuff with the tile<br>software itself. Same applies to the others.<br><br>This would all be wonderful, but we now have the unfortunate problem
<br>that Nick Hill has other priorities right now and can't devote as<br>much time and energy to OSM.<br><br>Even if Nick had infinite time, we're growing at such a rate that we<br>need to distribute control of this stuff _anyway_.
<br><br>While I'd love to give you all root access and break things to your<br>hearts content, we have a very serious problem. Only 2 or 3 people<br>know where the machines are physically located, how they work and can
<br>get access to them. Those people are me, nick hill and nick black.<br>The people with all the passwords are me and nick hill. So, I've been<br>avoiding handing out root passwords like candy not because I really<br>
hate the idea of other people running the machines - viz handing off<br>www an tile - but because if you break anything then I will have to<br>drop everything and visit the machines. I just don't have the time,<br>closeness or patience for this any more. I've made it very clear to
<br>the people with root that if they break anything they have to go in<br>to central london and reboot the machines. Really.<br><br>Of course, this is not sustainable. But, I hope this is all giving an<br>insight in to my thinking. Sorry, my evil thinking.
<br><br>Over in the corner, OSMF has magically raised some pesos for spending<br>on, you guessed it, servers. So we're in the joint positions of<br>needing a/many sysadmin(s), people who can access the machines,<br>people deeply competent, and people to buy and install the new
<br>machines we need.<br><br>Where all the machines are, today, is in central london. I'd love you<br>to host machines. Multiple times people have offered to host T@H on<br>their servers, and it's not happened. <a href="http://openstreetmap.de">
openstreetmap.de</a> sits basically<br>idle AFAIK. So - while I respect that you may want to host some part<br>of OSM at your machine, and I think it's a good idea, and I'll help<br>if I can, and I'm sorry that I'm evil, I have to deal with the
<br>immediate problem of a lack of sysadmins and people who can fix the<br>existing machines, which are spinning right now.<br><br>Please help me deal with this problem.<br><br>I need people who are very competent with machines in racks, _very_
<br>competent with linux, who have people skills to communicate with our<br>hosts at UCL, who can travel to central London and install / fix<br>things that arise and who are trusted by the community. Such people<br>might live in Oxford. You will need to help price, buy and install
<br>new machines and remote power and remote consoles. Really - I cannot<br>describe to you how difficult it is going to be to move forward with<br>new hardware if we don't have one or two people as described in this<br>
paragraph.<br><br>It will be a pain in the arse - but you'll be helping your 9,000<br>friends.<br><br>Next, we need more sysadmins. How do we do this? Do we continue with<br>a person per machine or function (eg, all the tile machines say, if
<br>we have more than one?). Do we have some other system? Do we need a<br>steering committee for this? How have other projects managed it?<br><br>have fun,<br><br>SteveC | <a href="mailto:steve@asklater.com">steve@asklater.com
</a> | <a href="http://www.asklater.com/steve/">http://www.asklater.com/steve/</a><br><br><br><br>_______________________________________________<br>dev mailing list<br><a href="mailto:dev@openstreetmap.org">dev@openstreetmap.org
</a><br><a href="http://lists.openstreetmap.org/cgi-bin/mailman/listinfo/dev">http://lists.openstreetmap.org/cgi-bin/mailman/listinfo/dev</a><br></blockquote></div><br>