[Talk-de] Straßenname kurz oder lang?
Jochen Plumeyer
jochen at plumeyer.org
Fr Feb 5 18:28:49 UTC 2010
Hallo Martin,
On Vie 05 Feb 2010, Martin Trautmann wrote:
> Bei mir konvertiere ich erst mal alle Accents und Umlaute nach A, AE und
> suche iterativ nach SS, SSS oder SS-S
Nur mal zur Rückfrage: Wo konvertierst Du das? Doch nicht in OSM?
Beim Bauen eines Suchindex, und der der Entgegennahme des Suchtextes, nehme
ich an?
Reguläre Ausdrücke sind nicht effizient in großen Datenbanken, aber es gibt
Datenbank-Tabellentypen, die Volltext-Suche mit Operatoren wie NEAR, OR,
NOT, AND unterstützen. Oft wächst dadurch das Indizieren die Datenbank-Größe
um das Dreifache an.
Ganz ohne Installation geht das mit SQLite und der Google-schen
FTS3-Erweiterung dafür (FTS=fulltext search). Google verwendet SQLite+FTS3
für Volltextsuche bei einigen seiner Desktop-Produkte.
Die Suchergebnisse kommen damit quasi instantan.
SQLite mußte man früher explizit mit dieser FTS3-Option kompilieren.
Also meine Empfehlung: Automatisch als OR-Ausdruck alternative Schreibweisen
abfragen.
Alternativ gibt es in vielen Datenbanken und Programmiersprachen wie PHP und
Perl "soundex()"-Funktionen, auch in PostgreSQL und MySQL, bei denen nach
ähnlicher Aussprache gesucht wird.
Was ich nicht weiß ist, welche Phoneme durch soundex() abgedeckt werden.
Nur meine dos centavos,
Jochen
Mehr Informationen über die Mailingliste Talk-de