[Talk-de] Straßenname kurz oder lang?

Jochen Plumeyer jochen at plumeyer.org
Fr Feb 5 18:28:49 UTC 2010


Hallo Martin,

On Vie 05 Feb 2010, Martin Trautmann wrote:
> Bei mir konvertiere ich erst mal alle Accents und Umlaute nach A, AE und
> suche iterativ nach SS, SSS oder SS-S

Nur mal zur Rückfrage: Wo konvertierst Du das? Doch nicht in OSM?
Beim Bauen eines Suchindex, und der der Entgegennahme des Suchtextes, nehme 
ich an?

Reguläre Ausdrücke sind nicht effizient in großen Datenbanken, aber es gibt 
Datenbank-Tabellentypen, die Volltext-Suche mit Operatoren wie  NEAR, OR, 
NOT, AND unterstützen. Oft wächst dadurch das Indizieren die Datenbank-Größe 
um das Dreifache an.
Ganz ohne Installation geht das mit SQLite und der Google-schen 
FTS3-Erweiterung dafür (FTS=fulltext search). Google verwendet SQLite+FTS3 
für Volltextsuche bei einigen seiner Desktop-Produkte.
Die Suchergebnisse kommen damit quasi instantan.
SQLite mußte man früher explizit mit dieser FTS3-Option kompilieren.

Also meine Empfehlung: Automatisch als OR-Ausdruck alternative Schreibweisen 
abfragen.
Alternativ gibt es in vielen Datenbanken und Programmiersprachen wie PHP und 
Perl "soundex()"-Funktionen, auch in PostgreSQL und MySQL, bei denen nach 
ähnlicher Aussprache gesucht wird.

Was ich nicht weiß ist, welche Phoneme durch soundex() abgedeckt werden.

Nur meine dos centavos,

Jochen






Mehr Informationen über die Mailingliste Talk-de