[Talk-de] API / Suche nach Namensbestandteilen

Thomas Reincke mail at thomas-reincke.de
Di Apr 17 04:40:05 UTC 2012


Am 16.04.2012 21:11, schrieb hansdorfff:
> Soweit ich das sehe, sind API/XAPI nicht für die Suche nach
> Teilzeichenketten geeignet -- es ist einfach nicht vorgesehen.

Reichen Dir Teilzeichenketten? Oder brauchst Du eine phonetische Suche, 
die auch bei Buchstabendrehern etc. weiter kommt.

Für eine richtige Suche wird eine Trigrammsuche der beste Ansatz sein sein.

Aus Trigramm wird
Tri
  rig
   igr
    gra
     ram
      amm

Dann kann man bestimmte Dinge noch normalisieren, z.B. alle 
Nicht-Buchstaben ignorieren, Doppelungen raus, Ersetzungsregelungen für 
ä/ae etc.




Mehr Informationen über die Mailingliste Talk-de