Buenas tardes a todos
Tengo 2 tablas, una de 3.000.000 y otra de 6 millones de registros. Ambas tienen dos campos comunes nombre y apellido.
Sucede que la segunda tabla posee el campo “docuid” o documento de identidad que deseamos asignar a la primer tabla, pero con el inconveniente de que como ambos tienen diferentes orígenes de registro los nombres y apellidos no necesariamente habran sido ingresados exactamente igual.
Ejemplo
En la tabla A
Nombre Apellido Docuid
JUAN CARLOS SANCHO PANZA 0
En la tabla B
Nombre Apellido Doduid
JUAN C. SANCHO PANZA 6732881
Y Miles de otras posibles variaciones. Mi idea es asignar el docuid a la tabla A, cuando estas sean SIMILARES.
Alguna sugerencia ?
En este caso lo que estoy buscando son ideas de como plantar, no precisamente CODIGO DE PROGRAMACION.
Una vez mas, muchas gracias a todos.
Javier cabrera blanco
Algo asi, pero teniendo en cuenta la complejidad de mi caso
WAIT WINDOW SOUNDEX('JUAN CARLOS SANCHO PANZAAAAAA') = SOUNDEX('JUAN CARLOSSSS SANCHO PANZA') && RETORNA .T.
Pero
WAIT WINDOW SOUNDEX('JUAN C. SANCHO PANZA') = SOUNDEX('JUAN CARLOS SANCHO PANZA') && RETORNA .F. cuando debio retornar .T.
Javier Cabrera Blanco
Ahí podrias hacerlo al reves….empezar por los apellidos…..
MK
Amigo, explícame esto que a mi parecer es algo asombroso…
Las tablas de Fox, Soportan 6 millones de registros a más???, o son de algún RDBMS
Saludos…
Grisson
Hasta 2gb por tabla, todos los registros que quieras creo.
Esta de 6 millones es lo máximo que tengo.
De: publice...@googlegroups.com [mailto:publice...@googlegroups.com] En nombre de grisson
Enviado el: martes, 05 de febrero de 2013 03:07 p.m.
Para: publice...@googlegroups.com
SOUNDEX ¡!!
Era eso lo que buscaba ¡!!
Gracias Victor ¡
Jajajajaja ZeRoberto
Es cierto, yo pensé que era otra función la que puse de ejemplo. Como no estoy acompañando mucho los mensajes no entiendo eso de Fox Friends.
Mientras me llegaba la respuesta conseguí hacerlo planteando por etapas, procesando primeramente las coincidencias directas que según estoy viendo son del 80%, el proceso es lento, 30 mil registros por hora. Pero como se haría esto una sola vez, me la tendré que aguantar.
Saludos.
Javier cabrera blanco
Hola Carlos
Wow !! Gracias por tu tiempo
Te explico mi caso. Tengo una tabla de 3 millones de registros con números telefónicos (móvil/celulares) y nombres y en otra tabla tengo fecha de nacimiento, sexo y ciudad en donde vive, etc. Del proceso que consegui desarrollar consegui relacionar en un 80%, es decir de cada 10.000 registros 80.000 son idénticos o sea se pertenecen. Con esto ya es suficiente, pues lo que estoy buscando crear es una lista para envios de mensajes promocionales SMS dirigidos por edad, sexo y ciudad.
Fuerte abrazo ¡! Y gracias de nuevo.
Sucede que spam via email ya no funcionan como antes desde que llego Facebook.
Increíblemente los SMS siguen siendo un medio efectivo para divulgar promociones o mensajes “útiles”.
Javier Cabrera Blanco
PD: Yo también odio esos mensajes, especialmente cuando provienen de la compañía telefónica.
Seguramente intentó decir que de cada 100,000 registros, 80,000 son idénticos
Saludos
De cada 100.000, 80.000 son idénticos. Equivale al 80%. Estos es comparando la cadena completa de nombres.
De: publice...@googlegroups.com [mailto:publice...@googlegroups.com] En nombre de miltonvas
Enviado el: jueves, 07 de febrero de 2013 08:55 p.m.
Para: publice...@googlegroups.com
CC: lis...@foxparaguay.com.py