LuisRohden
unread,Nov 26, 2008, 2:25:26 PM11/26/08Sign in to reply to author
Sign in to forward
You do not have permission to delete messages in this group
Either email addresses are anonymous for this group or you need the view member email addresses permission to view the original message
to LISTA PHP
Bom dia pessoas.
Estou pensando em como funciona exatamente a função você quis dizer
usada pelo google e alguns outros buscadores. No primeiro momento
tentei fazer com SOUNDEX do mysql. O resultado foi insatisfatorio já
de inicio. Pois obviamente o mysql estava comparando o som de palavras
em ingles.
Eu precisava fazer isso em português. Repensei, fiz um script que
fazia a transcrição da palavra antes e gravava sua fonetica no banco.
Reli uns textos sobre transcrição fonetica que já tinha lido em outras
oportunidades, e por fim fiz uma versão simplificada da transcrição
fonetica.
Mas logo percebi que não me bastava, pois tem casos que a transcrição
fonetica não alcança os erros gramaticais comuns, como troca de
letras. Pensei em fazer um sistema com anagrama da transcrição
fonetica. Mas sei que vai faltar o caso onde as pessoas ao inves de
trocarem as letras. E logo um novo dilema, como abraçar todas as
soluções que eu tenho e resolver o que ainda tenho pendente
Tenho um banco de palavras e espressões com cerca de 150.000 mil
termos. O que é um começo significativo.
Se alguem já pensou, desenvolveu ou solucionou este dilema, fala ai.
Obs: script que utilizam o banco de dados do google, como tem muitos
por ai, não me adiantam.