[osm-pl] geokodowanie - nowy serwis :)
Michał Rogala
michal.rogala w gmail.com
Pią, 28 Lis 2014, 11:23:10 UTC
Wszystko jest kwestią tuningu i postgresa i zapytań do bazy - ja spędziłem
wiele godzin nad profilerem postgresowym, żeby to śmigało - czasami drobna
zmiana sprawia że zamiast 30 sekund czekasz 0.5 ;). Wrzuć sobie do osobnej
tabeli granice państw i jakiś ważnych admin_level - mocno Ci to przyśpieszy
działanie, chociażby przez fakt zbuforowania takiej małej ilości danych w
RAM-ie. Nie robiłem stricte benchmarków, ale przypisanie punktu do kraju
(Europa) na domowym laptopie to nieco mniej niż 100 milisekund (tyle
pokazuje konsola SQL).
Dlaczego akurat Norwegia tak boli? :D
Co do wyszukiwania nazw - wszystko się rozbija o masę zagadnień związanych
z wyszukiwaniem danych nieustrukturalizowanych (bo user może wpisać
wszystko - niekoniecznie oddzielając miasto i ulicę przecinkiem),
scoringiem wyszukiwań, itp. Jeżeli user wpisze samą nazwę Osiek bez ulicy
to sam się prosi o problem - bo dostanie 100 wyników :). Aplikacja (i API)
może to uwzględnić przesyłając razem z wyszukiwaniem przybliżoną
lokalizację użytkownika - wtedy wyżej w wynikach wyszukiwania znajdą się
miejscowości znajdujące się geograficznie bliżej. Nie mówię już o banałach
typu scoring na podstawie populacji czy rozgraniczenia wieś/miasto.
Z tego co wiem i Nominatim i Google dają możliwość podania bounding boxa -
choć osobiście uważam że to głupota, żeby developerów aplikacji którzy
zazwyczaj niewiele mają wspólnego z GIS-em zmuszać do wyliczania box-a,
wystarczą najprostsze koordynaty latlon.
MR
W dniu 27 listopada 2014 19:17 użytkownik Tom <tomeks at spoko.eu.org> napisał:
> > Dzięki za te screeny - nie rozumiem tylko test2 - chodzi o brak nazwy
> > miejscowości? Na co Ci klienci głównie narzekają? :)
> Masz tam nazwę ulicy w miejscowości Ołdrzychowice, a jest "gmina
> Kłodzko".
>
> Klienci? niektórzy na wszystko :) drobiazgi.
> We wspomnianych Ołdrzychowicach ja jeden adres dekodowałem jako
> Trzebieszowice, bo do POI village Trzebieszowice było ciut bliżej, a
> granica administracyjna jest 100m obok mojego punktu.
> Z mojego punktu widzenia serce mi się cieszy na każdy email o nowych
> punktach adresowych.
> Kwestia nazywania landuse=residential .... jest przeróżnie...czasami
> jest tam nazwa dzielnicy, najczęściej nie ma nic.
>
> Weź pozycje GPS ładowania śmietników z jakiejś śmieciarki, zobacz
> poprawność dekodowania adresów, a potem porozmawiaj z klientem o jego
> oczekiwaniach...że numeru 42 nie powinno być na raporcie, bo tam nie
> odbierali :)
>
> > Zasadniczo przypisanie punktu do kraju to nie jest problem - ja od zera
> > zaprojektowałem sobie struktury danych pod kątem poszczególnych usług
> (nie
> > korzystam z planet_osm_*) - sprawdzenie kraju w którym jesteś to są
> > milisekundy (możesz sprawdzić co się stanie, jak klikniesz na mapie demo
> > poza obszarem Polski).
> Sprawdzenie czy jesteś w Polsce, czy dowolnego kraju w Europie?
> milisekundy - wiadomo - ale ile tych milisekund :)
>
> Ja używam tej samej bazy co do renderowania, ale do krajów muszę użyć
> shapefile...i to mnie boli...jak mam sprawdzić Norwegię :)
>
>
> > Zasadniczo problem jest taki, że co klient to inne wymagania (tak samo
> jak
> > z POI o których piszesz) - mam to tak zrobione tak, że do każdego klucza
> > API mogę przypisać osobny, pisany pod konkretne zastosowanie algorytm. Do
> > tego dochodzi jeszcze osobna warstwa normalizacji danych odpalanych w
> > zależności od kraju w którym "jesteś" żeby pokryć różne regionalne
> > udziwnienia.
> O kurcze, to jest naprawdę indywidualne podejście.
>
> > W drugą stronę też mam bardzo fajną technologię - łącznie z
> wychwytywaniem
> > literówek, niespójnych adresów, itp. Mam cichą nadzieję, że uda się tego
> > użyć np. na potrzeby osmapa.pl bo teraz jak w Nominatimie wpiszesz
> > "wrocław, rynek" to dostajesz wioskę Rynek w gminie Pakosław :P
>
> No właśnie...czekam aż pokażesz :)
> Ja po wstępnym rozpoznaniu zawiesiłem pracę nad tym aż będę miał
> więcej czasu, bo oprócz API robię też UI.
> Np. masz problem identycznych nazw i wyświetlania ich w jakiejś
> kolejności (np. malejącej populacji).
> np...taki Osiek:
> http://pl.wikipedia.org/wiki/Osiek
>
>
> Tomek
>
> > Michał
>
> > W dniu 27 listopada 2014 17:59 użytkownik Tom <tomeks at spoko.eu.org>
> napisał:
>
> >> MR> Na chwile obecną udostępniamy usługę odwróconego geokodowania,
> >> wyszukiwanie
> >> MR> adresów uruchomimy produkcyjnie w ciągu kilku tygodni. Do zastosowań
> >> MR> niekomercyjnych usługa jest za darmo.
> >> MR> Wszystko opiera się na własnym kodzie i rozwiązaniach, nie ma tam
> ani
> >> grama
> >> MR> Nominatima.
> >>
> >> Reverse zrobiłem jakiś czas temu na własne (komercyjne) potrzeby.
> >> Nominatim - masz rację - to niestety porażka.
> >>
> >> Najtrudniejsza rzecz to radzenie sobie z niespójnymi danymi w OSM.
> >>
> >> Fajnie widać błędy gdy się ma dziesiątki pozycji z GPS i ich adresy
> >> obok...
> >>
> >> Mam za sobą takie doświadczenia (i skargi klientów :) ) więc
> >> szybciutko udało mi się wygenerować problematyczne adresy u Ciebie
> >> (załącznik). Żeby nie było, to w niektórych miejscach gdzie ja mam
> problem
> >> Tobie działa
> >> lepiej :)
> >>
> >> No i trochę przydługie są np.
> >> "województwo dolnośląskie, Legnica, Świętego Maksymiliana Kolbe 8"
> >>
> >> Do tego jeszcze jest kwestia kraju. W adresach w OSM nie ma kraju.
> >> Zamiast szukać najbliższego punktu (co jest indeksowane i szybkie)
> >> to trzeba to robić w oparciu o sprawdzenie obecności punktu w
> >> obszarze...a to już trwa.. w przypadku takiej Norwegii dość długo :)
> >>
> >> Ogólnie bardzo kłopotliwa usługa.
> >>
> >> W drugą stronę chyba nawet bardziej kłopotliwa, bo musi zakładać błędy w
> >> pisowni
> >> miejscowości.
> >>
> >> Jeśli już jesteśmy
> >> >w różnych zastosowaniach, np. przy monitoringu pojazdów
> >>
> >> to fajnie byłoby dekodować miejsca związane z obsługą pojazdów - w
> >> szczególności - stacje benzynowe.
> >> Brakuje POI z pełnym opisem -operatorem, godzinami otwarcia itd.
> >>
> >> Może udałoby się nam dogadać i z pomoca stowarzyszenia zrobić konkurs
> >> na dodawanie tych POI?
> >>
> >> Pozdrawiam
> >>
> >> Tomasz Salwach
> >>
> >>
>
>
>
> --
> Pozdrowienia,
> Tom
>
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.openstreetmap.org/pipermail/talk-pl/attachments/20141128/321c13fa/attachment.html>
Więcej informacji o liście Talk-pl