24:24
2025-01-27 13:13:59
2:06:12
2025-01-27 13:42:41
3:36:29
2025-01-28 09:08:14
4:33
2025-01-28 13:48:42
55:46
2025-01-28 14:06:51
2:02
2025-01-29 10:22:33
1:02:14
2025-01-29 10:25:14
2:10
2025-01-29 11:38:26
2:26
2025-01-29 12:03:00
1:23:37
2025-01-29 12:05:56
35:40
2025-01-29 15:01:26
1:40:43
2025-01-30 09:07:07
1:08:48
2025-01-30 11:20:20
1:10:50
2025-01-30 13:15:56
3:50:03
2025-01-31 07:20:07
Visit the Talend Big Data Integration y Ecosistema de Talend course recordings page
United Arab Emirates - Talend Big Data Integration
WEBVTT--> la forma en que hay trabajo. Vamos a lo siguiente. Esta campaña hay que configurarla. La configuración --> te aparece del lado derecho. ¿La ves? Cuando aparece esa acción, hay solamente dos acciones --> que puede hacer con el talent pipeline. O yo inserto registros que al final son tareas --> o yo borro registros. En este caso deseo insertar. Me preguntan el estado. El estado --> va a coincidir con el workflow. Entonces, aquí van a aparecer todos los estados que están --> establecidos en el workflow. Pero ya a nivel de producción, si tú nada más tienes acceso a un --> solo estado de workflow, solamente te va a aparecer ese estado. No te aparecen los demás. ¿Por qué --> no hicimos ese ejemplo? Porque me tocó entrar el TMC, crear un usuario, dar unos permisos ahí --> especiales y me demoraba más. Pues tienes que tener en cuenta que aquí aparecen todos los --> datos. Todos tres paso del workflow sencillamente porque están asignados al mismo usuario. Pero --> solamente a cada usuario le va a aparecer el estado en el cual fue asignado. No le va a --> aparecer más nada. En este caso coloca el estado en revisión. Y en asignado, por favor, --> dale click y debería aparecerte el nombre del usuario. En este caso el tuyo, porque --> nada más es un nombre de usuario. Si el nombre de usuario no te aparece, eso indica en que quizás --> creaste el rol y no le adicionaste el usuario. Entonces, escuade por favor tu usuario. --> Aquí hay un tab que normalmente haces para agregarle más información al proceso. No lo --> vamos a trabajar. Y aquí hay algo que se nos puede olvidar. El olvidar es que necesariamente --> que dales safe. Si no, eso no guarda automático. Entonces, dale safe aquí. --> Verifica, dale click nuevamente aquí en cliente y verifica para ver la salida que --> debe estar configurada con lo que hiciste. Inser en revisión. --> Perfecto. Si éste es, vamos a darle ahora en run. --> Un momento, ya ejecutó. No, pero cuando yo ya lo run ya. --> Vamos a darle run un momento, que pronto el guardia no se sigue el mismo que salió acá. --> Bien, sí, dígame. --> Ah, sí, sí, el preview no aparece porque no hay datos, porque esa campaña está vacía. --> Por eso intenta hacer un preview y no encuentra datos. Dele click en run, por favor. --> Bueno, sí, no, no, un momento, explicar aquí algo. Aquí hay lo que llaman profiles. --> Esto lo agrego. Quizás te toque. Rátimosamente no tenemos ese curso, que es el Talent MC, --> el Manus Consoles, pero te lo adiciono aquí. Tú puedes decidir la infraestructura en la cual --> vas a ejecutar estos pipeline. Entonces, esta infraestructura puede ser en el cloud de Talent --> o puedes configurar una infraestructura propia en tu empresa para ejecutarlo internamente en --> tu empresa, si es lo que tú quieres. Pero note lo siguiente. Aquí dele click en estándar, --> que es que estar aquí y aquí aparece Spark, que es una tecnología a nivel de Big Data. --> Entonces hay un cluster de estar Spark, Spark, donde se esto porque va a demorar, --> demora como 20 segundos, porque ya vuelvo, repito, son millones de usuarios en un --> flotenan. Hay que esperar a que se desbloquee. Dele aquí, entonces, en run, por favor. --> Y es yo que empieza a ejecutarse. --> Puede demorar alrededor de 30 segundos. --> Por ahí, quizás. --> Esa parte de Spark, tú la configuras en realidad en la misma forma. Imagínate que tú hagas un --> proceso en un job. Para convertir esto a Big Data, nada más escoger y darle click ahí a un --> Spark y ya te lo convierte automáticamente el código Spark. Y eso pues en realidad te ayuda --> mucho. Pero bueno, debes que analizar cuál es el costo de la herramienta versus al costo --> a nivel de tiempo que estás ganando usando la herramienta. Bueno, aquí al parecer ya terminó. --> Perfecto. Me marco error. Creo que si le doy click aquí, él intenta consultar, --> él hace un preview. Hay veces que demora un poco. Creo que aquí puede demorar un ratico. --> Hay veces que demora y veces que no. --> Bueno, para evitar esto, hagámoslo de otra forma. Vamos a consultar otra forma diferente. --> Váyase, por favor, al menú de la parte de arriba y cambie de herramienta y dígale data --> teamwork. Ops, hay un error aquí de 500, el F5. Esos errores pues asumo que a nivel de --> producción no deben salir. Es decir, en el día de... Si quieres dale click en campañas --> y escoge la campaña. Si no te aparecen tareas, verifica el mi que está de este lado y --> verifica si está en mayor a cero. Dale click. En este caso yo tengo 20, doy click aquí en este 20 --> y me aparecen las tareas de esta campaña. Recuerde, estoy en campaña. Me voy a mostrar --> las tareas y aquí está asignado. Aquí no puedo cambiar las tareas. No puedo hacer proceso --> de revisión. No puedo hacer nada aquí. Simplemente es para visualización. Ahora vamos a --> cambiar que se parece mucho al menú. Vamos ahora, damos aquí en la flechita hacia atrás --> y vamos al menú de tareas y escoja la campaña curación de datos clientes. --> Y en este caso sí podías hacer cambios. Bueno, veamos entonces, perito Marco, el caso tuyo, --> Elizabeth, en la parte... Brenda, Elizabeth, en la parte... Ahí está el mouse, permítame --> ampliarlo. Notarás que en la parte izquierda hay un mi y te aparece un 20. Del lado --> izquierdo te aparece mi de yo y tienes un 20. Dale click en el 20 por favor. Ese mi 20 indica --> que tú o el usuario que está conectado tiene 20 tareas. Como estás en el menú de campaña, --> ese menú de campaña no te va a permitir modificar las tareas. Entonces devuélvete --> con la flecha negra que está del lado izquierdo ahí, devuélvete y escoge la opción de --> Bueno, ya hicimos el perfil que es propietario de campaña. Crea el modelo de datos, --> crea la campaña y define y asigna los pasos a los diferentes Datastores. --> Hicimos el poco del perfil que es un usuario técnico que es el que... Ah, perdón, --> hicimos el del perfil que es operador de campaña que es el que puede crear tareas. --> Hicimos una tarea de forma manual. Y hicimos un perfil un poco más técnico en el cual se --> pobló la campaña a través de un archivo. Es el más común. Aclaro que yo lo hice con un --> data sec. Espero que me de un ejemplo para hacerlo con bases de datos. Tú puedes tener --> bases de datos. Actualmente hay 600 conexiones que te puedes conectar a muchos componentes de --> Azure. Te puedes conectar a AWS, te puede conectar a BigQuery. Bueno, hay una cantidad de --> componentes de conexión, no solamente a nivel de bases de datos y archivos SV, --> sino hay una gran cantidad de elementos. Espero que me de tiempo para hacer otro --> ejemplito diferente con un tipo de conexión diferente. Pero bueno, estoy ahora mismo en --> el perfil, vamos en el perfil, en el perfil Datastores. Es decir, ahora se le asignaron --> unas tareas a alguien para que las pueda revisar. Ok. Este señor normalmente, --> pues su conocimiento técnico no es tan alto, pero aquí hay unas pequeñas funciones que le --> deben ayudar a resolver algunos problemas de calidad de datos que requiere esta parte de aquí. --> Ok. Este menú que está aquí, para aprovecharlo, lo que voy a hacer es lo siguiente. Este menú --> es prácticamente el mismo de una sección de Talent Data Preparation. Entonces, --> lo que yo de en Talent Data Preparation se aplica en el Talent Data Server, porque --> son prácticamente el Talent Data Preparation tiene otro menú, pero incluye esto que está --> acá. Ok. Listo. Entonces, le llegó una campaña. Para llegar a campañas, --> vamos a hacer lo siguiente, por favor, váyase aquí a donde dice, en su avatar, --> la parte superior derecha, dele clic ahí en ese avatar. Váyase al menú que dice Profiles Preferences. --> Profiles Preferences. Bueno, aquí hay muchas cosas. Esto es más del TMC, --> pero bueno, hay algo que le incluye a usted, que ahí en About Me le define los roles a los --> cuales tiene permiso. En este caso, como usted es el dueño de la cuenta, tiene permiso, --> pues a todo. Pero me interesa, pues, la parte de notificación esta que está aquí. Notificación, --> notificación. Y si quiere, usted chulee ese que dice Data Stewards. No me meto con el otro, --> porque me tocaría incluir unos temas ahí. ¿Qué significa que esté chuleado ese Data Stewards? --> Bueno, pasa lo siguiente. Imagínate que tú eres un Data Stewards y a ti te pueden asignar --> campañas en un momento determinado. Entonces, ¿qué hace? Que tú, como usuario, entras y --> habilitas esta opción. Esa opción te habilita y lo que va a hacer es que cada vez que te --> manden unas tareas para solucionar, te llega un mensaje de correo, te notifica el mensaje de --> correo que te llegaron algunas cuentas ahí que tendrías que revisar. Para eso es que sirve la --> notificación. Para esta parte del lenguaje es sencillo, es que lo que vas a escoger el --> lenguaje nada más son cualquier tipo de lenguaje, es inglés, francés, --> japonés y alemán. ¿Español? No hay. No creo que por el momento se cree algo en --> español. No lo veo dentro de lo que quiera ser talento. Está en inglés. Bueno, esto sí, --> ya es muy particular del TMS, entonces no me meto con eso. Aquí lo que quería llegar es --> que deberías habilitar esta notificación. Aquí le toca a cada usuario entrar a su cuenta y --> habilitar para que le notifique por correo cada vez que tenga unas nuevas tareas. Por --> favor, déle click aquí en la rechita. Listo, perfecto. Entonces, note que me aparecen las --> columnas. Los nombres de columnas van a coincidir con el nombre más no con el identificador. --> Entonces, tengo nombre, espacio completo, para eso que es el label, para que se vea mucho --> mejor. Y en cada columna me aparece un tipo de datos, ¿cierto? Aquí aparece mira que aquí --> están los tipos de datos que definí en el modelo. Texto, texto, texto, texto, marcas de vehículo, --> integer, date, que son los que tiene. Yo puedo modificar esos datos en el modelo si yo quiero, --> pero en este caso pues no lo vamos a hacer. Debajo de cada uno de estos atributos aparece --> una línea. La línea indica, verde significa que en esa columna no hay ningún error de --> validación de datos. Si aparece un robo significa que hay un error de validación de datos. Entonces, --> si tú quieres, por ejemplo, en la columna email, date cuenta que aparecen tres en rojo. Si tú quieres --> aquí en la columna que está en las líneas, dale click nada más en rojo y te hace un filtro --> para que aparezca nada más lo que no cumple con la condición. Le das click ahí en el rojito, --> en la línea roja. Y si quieres quitarle el filtro, en la parte de arriba te aparece y --> lo cierras acá. Le das click nuevamente aquí en rojo y te agrega el filtro acá arriba. --> Si deseas saber por qué no está cumpliendo la condición, te puedes ir a la línea roja que --> aparece en cada columna, colocas el mouse en esa línea roja y te dice qué es lo que no está --> cumpliendo esa columna. Ahí te está diciendo, mira, el valor que está digitado en esa columna --> no corresponde o no hace match con el patrón de validación que habíamos definido con el --> GPT, que era determinada en MX. Perfecto, listo. Ahora, aquí viene el proceso, ve que esto es --> un proceso netamente visual. Aquí viene un proceso netamente visual. Me doy cuenta que --> el correo de señor está mal porque ese correo de señor no termina en .com si no termina, --> por ejemplo, en MX. Entonces tú accedes, accede por favor, dale doble click a la celda --> y haces el cambio que tú requieras. Este cambio se registra y después tú lo puedes --> ver en el salario, te digo cómo. Dale aquí MX.MX y ya ese señor no aparece, aquí me faltó un --> punto y ya date cuenta que no aparece como revisado. Ahora, tú puedes agregar comentarios, --> por ejemplo, en esta columna que tengo aquí se llama Juan Martínez, dale click derecho aquí --> y te aparece click derecho sobre la columna y te sale la noción que dice at coming. Dale click --> en este at coming y tú puedes darle un comentario para que la siguiente paso pueda --> revisar porque lo hiciste. Entonces vamos a colocar aquí en mi libreta --> el correo del señor Juan termina en MX y no en .com. Bueno, aquí puedes colocar lo que tú --> quieras, aquí le das entonces un chulito, le das a adicionar aquí, perdón, listo, el chulito y te --> aparece. Aquí automáticamente va a aparecer en la parte de arriba con una especie de --> angulito diciéndole que esa columna tiene comentarios y procede por favor a cambiar el --> punto el .com, el .com ese a MX para que va a seguir la misma idea, MX, listo, voy a quitar el --> filtro que está aquí. Sí tenemos cual es la idea, verdad, entonces es muy manual. Ahora, --> aquí hay unas funciones que me pueden ayudar, por ejemplo, vamos a suponer que tú detectaste --> que hay un problema, que los .com debían ser .mx, entonces para no hacer eso tan manual puedes --> aprovecharte de algunas funciones que están. Pues brevito, estas funciones las voy a ver más --> en detalle cuando vea el Talent Appropriation porque son las mismas, pero veamos algunas y --> podamos entonces avanzar. Escoge la columna esta que está aquí que es email y te vas --> acá a las funciones del lado derecho. Dentro de estas funciones busca y coloca la palabra --> search, pero una función de búsqueda, search y te vas a encontrar con una función que dice --> search and replace. En el search and replace aparece con un pequeño botón que tiene como --> una irea al revés, aquí este botón de aquí que es como si fuese una ola y aquí hay --> varios criterios de búsquedas. No vamos a escoger por defecto entonces, aquí nada más, --> me va a buscar por expresión, voy a decirle búscame todo lo que termina en .com y reemplázalo --> por .mx. Si le coloco override en tera celda me va a reemplazar toda la celda por mx, --> entonces ahí lo que voy a hacer es que nada más reemplace ese pedazo de su cadena y aquí --> le voy a dar su mi, creo que eso es su mi nada más aquí y solamente me quedó uno ese --> que es el que tiene error porque está vacío, no cumple con la condición, porque yo valide --> y especificé en el modelo de datos que eso tenía que tener algún elemento ahí. Perfecto, --> continuo, vamos a tratar de solucionar la mayor cantidad de problemas para poder continuar, --> listo entonces y entender un poco la herramienta. Aquí voy a filtrar los en números de --> polisa, aquí los en números de polisa tengo aquí un problema que esta polisa es claro que --> no está cumpliendo el formato, porque parece ser que está completo y lo que no tiene son los --> guiones, entonces voy a aprovechar y soluciono los guiones aquí pol le doy guión 2024 guión y --> debería corregirlo ahí está y solamente tengo dos columnas que no he podido solucionar el --> problema porque si no sabía que es, una está vacía y una aparece como error, quite este --> filtro por favor y veamos a nivel de teléfono cuáles no cumplen, bueno en este caso --> hay muchos que no cumplen específicamente si te quiere ya recordará para ver que no --> cumple voy aquí a una de las columnas esa y le doy clic en eso colocó el mouse sobre el punto --> rojo la línea roja y me dice qué es lo que no está cumpliendo ahí no está cumpliendo un --> reyes básicamente ahí tengo un más 57 y tengo en realidad debería empezar como más 52 aquí --> si es un poco más complejo porque había que revisar cada uno de los teléfonos y hacer --> la corrección pero de forma sencilla solamente para probar se cambie todo lo que empieza por --> 52 en Serran Replay selecciona la columna teléfono y cámbielo por perdón 52 momento que --> porque no la cumple un momento no la cumple porque si hay unos espacios en blanco si vamos --> a ver cuáles cumple momento a ver quito el filtro a ver cuál es la cumple porque son --> tres dígitos separados por espacio después tres dígitos y termina con cuatro dígitos ese reyes --> que tengo entonces la mayoría pues no lo está cumpliendo voy a corregir nada más uno --> solo voy a corregir este primerito que me dice primero empieza con más 52 espacio tres dígitos --> después siguen tres dígitos y termina con cuatro dígitos --> aquí estoy inventando aquí ahí está si ese es el reyes sería más 52 espacio tres dígitos --> espacio tres dígitos espacio cuatro dígitos ahí sería interesante hacer una función en la --> cual me reemplace los espacios que requiero y lleva el formato pero es un poco más --> interesante la única forma que se me ocurre de hacerla es hacer un reyes es decir yo puedo --> hacer un replays con un reyes y que reyes borre esos espacios en blanco pero sinceramente una --> función que haga eso que es una buena pregunta que haga eso en específico --> no me tocaría formarla con varias funciones pero no hay una que ese formato lo haga --> por eso decía cuando lo ve cuando lo vi ahora es un poquito complejo pero así directamente no --> me sale bueno vamos a ver entonces ya casi para arlar algunos porque no vamos a ponernos uno --> por uno porque demoramos más esto lo aprendemos mejor con el talent operation vamos aquí en el --> estado me aparece suspendida y voy a ver por qué me aparece rora a ver porque los tipos --> de datos es el tipo de tipo list y debería el valor no está definido al estado porque --> es el activa pendiente se me escapó la otra que es cancelada entonces está suspendida debe --> ser cancelada entonces voy a cambiar esta suspendida por cancelada --> y ahí está si en la parte de arriba notará que aquí hay un botoncito que se llama --> y aquí están dos flechas hacia adelante y hacia atrás si digo hacia atrás debería --> colocarme la suspendida y aquí estaría nuevamente buena pregunta y ahí estaría --> sería el condo sete y el control y el segundo sete sería la flecha hacia atrás el control --> y sería la fecha serán listo --> bueno aquí noto que hay unos errores porque seguramente en la lista de valores no están --> esto de marca no estarían estos vehículos este error de modelo es mucho más sencillo porque --> aquí lo que tendría que hacer es reemplazar los espacios en blanco entonces voy aquí a coger --> modelo y voy a hacer un replays replays bueno aquí hay unas funciones específicas pero --> va a hacerla con replays un momento y eso lo voy allá lo veo allá en mi talent --> aquí de un espacio en blanco y lo reemplazo por vacío --> no lo hizo espere un momento no perdón creo que tienes un número pero no alcanzó a ver --> el número ese espacio blanco lo que tiene ahí o un separador --> si si si es como un pequeño separador de miles si si entonces no por eso no lo no lo --> valido aquí hay un error con el 79 porque seguramente no cumple aquí dice que debe --> estar entre 1980 y 2025 recuerdan que esa regla la colocamos y entonces por eso es que no lo --> valido dice que no cumple con la condición bueno terminemos ya de solucionar y ver para --> qué se hace en este caso fecha inicio voy a filtrar las fechas que están erradas al --> parecer hay un error primero de separador porque está esperando el guión ya le había --> dicho que la fecha por defecto es año mes día y tengo otro pequeño error que sería --> con el formato el formato que tengo está en día mes año entonces el primero es fácil --> de solucionar porque es un service play le digo reemplaza de slash por guión aquí --> perfecto y este voy a intentar solucionarlo voy a buscar una función aquí de tipo date --> a ver si me aparece --> debe ser convertir date no este convertir de ahí no me funciona modificar me lo convierte --> años mes días no ese formato en esta herramienta no lo podría lo podía hacer con el talent data --> preparation ese formato me va a quedar complicado hacerlo a menos que lo haga con una expresión --> regular pero no aquí lo va a cambiar de forma manual entonces sería 20 25 guión 0 1 0 1 --> perfecto listo --> aquí me sale todavía error vamos a ver qué pasa --> aquí tengo que se no lo cambió --> a poco estoy en fecha de vencimiento pero en fecha de vencimiento también a un ser --> replace para cambiar el carácter es las por guión serán replace --> bueno esto ya es un poco más tedioso y corrigiendo las funciones --> pues repito las explicó mejor en el talent data preparation --> bueno sigamos