<blockquote>
<p>I can see plenty of false positives</p>
</blockquote>

<p>Every imagery_used tag it matches is a Google URL.</p>

<blockquote>
<p>, starting with any domain containing google that isn't a google domain, for example:</p>

<pre><code>http://test.google.compton.nu/vt?x=1&y=2&z=3
</code></pre>

<p>would match if I've read things right.</p>
</blockquote>

<p>No one has ever used a domain even remotely similar to that except for those accessing Google, and the same for endpoints named <code>vt</code> or <code>kh</code>.</p>

<blockquote>
<p>If we were happy to only match the domain before then why not stick with that but broaden the domain match?</p>
</blockquote>

<p>Do you have a suggestion for a regex which will catch all the local Google sites?</p>

<p>The closest I can come is <code>.*\.google(apis)?(\..)?\...?/</code>. Do you think that's better?</p>

<blockquote>
<p>Why start trying to (badly) match the rest of the URL as well, which just means it will break every time google tweak their URLs... </p>
</blockquote>

<p>They've been using the vt endpoint since 2013. The domain part of the URL changes more often.</p>

<blockquote>
<p>I mean it already matches anything with three x, y or z parameters not just those with one of each.</p>
</blockquote>

<p>I'm fine with it matching a URL with three of the same parameter.</p>

<p>The current patterns have theoretical false positives too. I believe in practice the new pattern will have no more false positives than the current ones.</p>

<p style="font-size:small;-webkit-text-size-adjust:none;color:#666;">—<br />You are receiving this because you are subscribed to this thread.<br />Reply to this email directly, <a href="https://github.com/openstreetmap/openstreetmap-website/pull/1267#issuecomment-239647730">view it on GitHub</a>, or <a href="https://github.com/notifications/unsubscribe-auth/ABWnLTCmUx9g3xaJFw-FS_dEyhKGZvMCks5qflcpgaJpZM4Jjwzk">mute the thread</a>.<img alt="" height="1" src="https://github.com/notifications/beacon/ABWnLfxUArBylcZGIsUjUNrdfW1wV1vAks5qflcpgaJpZM4Jjwzk.gif" width="1" /></p>
<div itemscope itemtype="http://schema.org/EmailMessage">
<div itemprop="action" itemscope itemtype="http://schema.org/ViewAction">
  <link itemprop="url" href="https://github.com/openstreetmap/openstreetmap-website/pull/1267#issuecomment-239647730"></link>
  <meta itemprop="name" content="View Pull Request"></meta>
</div>
<meta itemprop="description" content="View this Pull Request on GitHub"></meta>
</div>

<script type="application/json" data-scope="inboxmarkup">{"api_version":"1.0","publisher":{"api_key":"05dde50f1d1a384dd78767c55493e4bb","name":"GitHub"},"entity":{"external_key":"github/openstreetmap/openstreetmap-website","title":"openstreetmap/openstreetmap-website","subtitle":"GitHub repository","main_image_url":"https://cloud.githubusercontent.com/assets/143418/17495839/a5054eac-5d88-11e6-95fc-7290892c7bb5.png","avatar_image_url":"https://cloud.githubusercontent.com/assets/143418/15842166/7c72db34-2c0b-11e6-9aed-b52498112777.png","action":{"name":"Open in GitHub","url":"https://github.com/openstreetmap/openstreetmap-website"}},"updates":{"snippets":[{"icon":"PERSON","message":"@pnorman in #1267: \u003e I can see plenty of false positives\r\n\r\nEvery imagery_used tag it matches is a Google URL.\r\n\r\n\u003e , starting with any domain containing google that isn't a google domain, for example:\r\n\u003e \r\n\u003e     http://test.google.compton.nu/vt?x=1\u0026y=2\u0026z=3\r\n\r\n\u003e would match if I've read things right.\r\n\r\nNo one has ever used a domain even remotely similar to that except for those accessing Google, and the same for endpoints named `vt` or `kh`.\r\n\r\n\u003e If we were happy to only match the domain before then why not stick with that but broaden the domain match?\r\n\r\nDo you have a suggestion for a regex which will catch all the local Google sites?\r\n\r\nThe closest I can come is `.*\\.google(apis)?(\\..)?\\...?/`. Do you think that's better?\r\n\r\n\u003e Why start trying to (badly) match the rest of the URL as well, which just means it will break every time google tweak their URLs... \r\n\r\nThey've been using the vt endpoint since 2013. The domain part of the URL changes more often.\r\n\r\n\u003e I mean it already matches anything with three x, y or z parameters not just those with one of each.\r\n\r\nI'm fine with it matching a URL with three of the same parameter.\r\n\r\nThe current patterns have theoretical false positives too. I believe in practice the new pattern will have no more false positives than the current ones."}],"action":{"name":"View Pull Request","url":"https://github.com/openstreetmap/openstreetmap-website/pull/1267#issuecomment-239647730"}}}</script>