Despus de conectarse a sus fuentes de datos y comenzar a construir su flujo, es posible que desee actualizar sus conexiones de datos a medida que ingresan nuevos datos. Tambin puede unir columnas o filas de conjuntos de datos en el paso de entrada para hacer ms eficiente el trabajo con fuentes de datos ms grandes.
Si los datos cambian en las tablas o archivos de entrada despus de haber empezado a trabajar con el flujo, puede actualizar el paso de entrada para incorporar los nuevos datos opuede modificar y actualizar cada conexin del paso de entrada sin romper su flujo.
En el panel de flujo del men superior, haga clic en el botn Actualizar para actualizar todos los pasos de entrada. Para actualizar un nico paso de entrada, haga clic en la flecha del men desplegable junto al botn de actualizar y seleccione el paso de entrada de la lista.
Reemplace fcilmente una fuente de datos existente en su flujo con cualquier fuente de datos nueva sin interrumpir la conexin del flujo. Segn su versin de Tableau Prep, puede arrastrar y soltar una nueva fuente de datos sobre su antigua fuente de datos o desconectar y volver a conectar manualmente su fuente de datos.
Si trabaja con varios archivos o tablas de base de datos de una nica fuente de datos, puede aplicar filtros para buscar los archivos o tablas mediante una bsqueda con comodines y, a continuacin, unir las filas de datos para incluir todo el archivo o la tabla de datos en el paso de entrada. Para la unin de filas de archivos, los archivos deben estar en el mismo directorio o subdirectorio.
Los archivos nuevos que se aadan a la misma carpeta que coincida con los criterios de filtros se incluirn automticamente en la unin de filas la prxima vez que abra el flujo o ejecute la lnea de comandos.
Los archivos de flujos empaquetados (.tflx) no elegirn automticamente archivos nuevos porque los archivos ya estn empaquetados en el flujo. Para incluir archivos nuevos para flujos empaquetados, abra el archivo de flujo (.tfl) en Tableau Prep Builder para elegir los nuevos archivos y, luego, vuelva a empaquetar el flujo para incluir los nuevos datos del archivo.
Para unir tablas de base de datos, deben estar en la misma base de datos y la conexin de la misma debe admitir el uso de la bsqueda de comodn. Las bases de datos siguientes admiten este tipo de unin de filas:
Si requiere unir filas de datos de diferentes fuentes de datos, puede hacerlo mediante un paso de unin de filas. Para obtener ms informacin sobre los pasos para crear una unin de filas, consulte Unir filas de datos(El enlace se abre en una ventana nueva).
De forma predeterminada, Tableau Prep Builder une filas de todos los archivos .csv en el mismo directorio que el archivo .csv al que se ha conectado, o todas las hojas en el archivo de Excel al que se ha conectado.
Patrn coincidente (xxx*): escriba un patrn de bsqueda con caracteres comodn para buscar archivos que tengan esos caracteres en el nombre de archivo. Por ejemplo, si escribe orden*, se devuelven todos los archivos que incluyan "orden" en el nombre de archivo. Si deja este campo en blanco, se incluirn todos los archivos del directorio especificado.
A partir de Tableau Prep Builder 2022.2.1 y posteriores, las opciones de filtrado al buscar archivos para unir han cambiado. Si bien an especifica un directorio y un subdirectorio para buscar, ahora puede configurar varios filtros para realizar una bsqueda ms granular.
Estas opciones de filtrado se aplican a los tipos de archivo Texto, Microsoft Excel y Estadsticos. Puede seleccionar varios filtros. Cada filtro se aplica por separado, en el orden en que los seleccione, de arriba a abajo. Actualmente, los filtros no se pueden mover una vez agregados, pero puede eliminarlos y agregarlos segn sea necesario.
Haga clic en el botn Aadir conexin y, en Conectar, haga clic en Archivo de texto para archivos .csv o Microsoft Excel para archivos de Excel, o Archivo estadstico para archivos estadsticos y seleccione un archivo que desea abrir.
El ejemplo siguiente muestra una unin de filas de entrada mediante un patrn coincidente. El signo ms en el icono de archivo del paso de entrada de Orders_Central en el panel de flujo indica que este paso incluye una unin de filas de entrada. Los archivos de la unin de filas se muestran en Archivos incluidos.
Solo se pueden incluir en la unin de filas las tablas que se muestran en el panel Conexiones de la seccin Tablas. La bsqueda de unin de filas de entrada no busca en los esquemas ni en la conexin de base de datos para encontrar las tablas.
Despus de crear una unin de filas en el paso de entrada, es posible que desee fusionar campos. Puede hacerlo en cualquier paso subsiguiente, a excepcin de los pasos de entrada y salida. Para obtener ms informacin, consulte Opciones adicionales de fusin de campos(El enlace se abre en una ventana nueva).
En Tableau Prep Builder (2019.3.1 y posteriores) y en la web, al conectarse a bases de datos que incluyen tablas con datos de relaciones, Tableau Prep puede detectar y mostrar los campos de una tabla que se identifican con un identificador nico y los que se identifican como un campo relacionado. Asimismo, puede mostrar los nombres de tablas relacionadas para dichos campos.
Identificador nico. Este campo identifica de forma nica cada fila de la tabla. Puede haber varios identificadores nicos en una tabla. Los valores de los campos deben ser nicos y no pueden estar en blanco ni ser nulos.
Puede aprovechar estas relaciones para encontrar y aadir rpidamente las tablas relacionadas al flujo o crear uniones de columnas desde el paso de entrada. Esta caracterstica est disponible para cualquier conector de base de datos compatible en el que se definan relaciones de tabla.
Tambin puede unir tablas columnas de relacionadas desde el men del panel de flujo. Haga clic en el icono ms y seleccione Aadir unin de columnas para ver una lista de tablas relacionadas. Tableau Prep crea la unin de columnas basndose en los campos que establecen la relacin entre las dos tablas.
Si acaba de aprender a usar JOIN en SQL, es posible que piense que su uso est limitado a dos tablas. Es algo habitual, este concepto puede ser difcil de entender, y la idea de que los JOIN pueden ser an ms complicados puede ser realmente aterradora al principio. La verdad es que, se pueden usar para unir tres tablas o, incluso, ms. Observe la consulta de abajo:
Pero, antes de continuar, le recomiendo encarecidamente que entienda bien los JOIN de SQL. El concepto que voy a explicar se basa, en gran medida, en conocimientos bsicos. Si an no est a ese nivel, consulte el curso Tipos de JOIN en SQL en LearnSQL.es.
En el diagrama de entidad-relacin (ERD) anterior, se pueden ver las tablas, sus columnas, los tipos de datos de las columnas y las referencias entre las tablas. Por ejemplo, hay una referencia entre las tablas alumno y curso_del_alumno. Cada alumno puede estar vinculado a varias filas de la tabla curso_del_alumno. Para saber ms sobre cmo entender un diagrama, lea el artculo Notacin Crow's Foot del blog de Vertabelo.
Por ejemplo, "Shreya Bain" (la alumna con id = 1) est conectada con "English literature" (el curso con id = 2) y "Python programming" (el curso con id = 3). Cmo lo sabemos? Observe las dos primeras filas de la tabla curso_del_alumno. La primera fila dice que el alumno cuyo ID es igual a 1 (columna id_del_alumno) est conectado al curso cuyo ID es igual a 2 (columna id_del_curso). En la segunda fila, vemos que el alumno cuyo ID es igual a 1 est conectado al curso cuyo ID es igual a 3. Entonces, si miramos a la tabla alumno, podemos ver que el ID de Shreya Bain es 1. Por ltimo, si miramos a la tabla curso, podemos ver que los ID de "English literature" y "Python programming" son 2 y 3, respectivamente.
Como puede ver, estamos utilizando la tabla alumno en la clusula FROM. Luego, la unimos con la tabla curso_del_alumno y, por ltimo, con la tabla curso. De este modo, podemos mostrar el nombre y el apellido de cada alumno junto con los cursos a los que asiste. El cdigo le sigue pareciendo confuso? No se preocupe, lo explicaremos a fondo en la siguiente seccin.
El primer paso es mirar al diagrama y seleccionar las columnas que queremos mostrar. Como queremos mostrar a los alumnos junto con sus cursos, necesitaremos tres columnas: alumno.nombre, alumno.apellido y curso.nombre.
Es importante que utilicemos los nombres de las tablas cuando enumeremos las columnas. De esta manera, no nos perderemos en los diferentes nombres de las columnas y siempre sabremos a qu tabla pertenece cada columna.
El siguiente paso es determinar qu tablas sern necesarias para la consulta. Hay dos obvias: alumno y curso. Sin embargo, tendremos que encontrar la manera de unirlas. En el diagrama de la base de datos, vemos que curso_del_alumno es una tabla de unin para las dos. As que, tambin la necesitaremos.
En la parte final, tendremos que unir todas las tablas. La primera tarea es elegir la tabla que ir en la clusula FROM. En teora, puede ser cualquiera de las tablas que estamos utilizando. A m, personalmente, me gusta empezar con una tabla que no sea de unin. En este caso, utilizaremos la tabla alumno.
Antes de aadir la ltima tabla, deberamos pensar en lo que ya conseguimos. Tenga en cuenta que, al escribir una clusula JOIN, no estamos limitados a las columnas de la clusula SELECT, tenemos acceso a todas las columnas! As que, nuestra consulta tiene el siguiente aspecto:
Esta consulta muestra casi todas las columnas que podemos utilizar para escribir la siguiente expresin JOIN. (Elimin la columna curso_del_alumno.id, ya que no la necesitaremos). Eche un vistazo a los datos con los que estamos trabajando:
As se ven nuestros datos a mitad de camino. A menudo, en este punto, es bueno pensar en los datos. Es posible que usted, a veces, quiera escribir una consulta de este tipo solo para analizar las filas y columnas.
d3342ee215