En este artículo se describe la mejor forma de hacerlo en español, aunque no hay nada programado, te será fácil hacerlo siguiendo sus indicaciones. Para mí este trabajo es definitivamente el mejor sobre este terreno.
Para lo que te propones es posible que esa nueva función "Soundex española" funcione bastante bien, pero tienes que tener en cuenta que Soundex elimina las vocales y da excesiva preponderancia a la letra inicial y por tanto si tu objetivo es otro, por ejemplo detectar parecidos entre denominaciones (por ejemplo entre marcas, para evitar que se registren otras confundibles con las ya registradas) tendrás que cambiar bastante más el algoritmo. Si este es tu campo te puedo ayudar bastante, ya que llevo más de 20 años con aplicaciones de este estilo funcionando.
Si eres tan amable, cuando hayas resuelto tu algoritmo compártelo. Un saludo,
Miguel A.