Talend Big Data Integration y Ecosistema de Talend


language: ES

                  WEBVTT
la forma en que hay trabajo. Vamos a lo siguiente. Esta campaña hay que configurarla. La configuración
te aparece del lado derecho. ¿La ves? Cuando aparece esa acción, hay solamente dos acciones
que puede hacer con el talent pipeline. O yo inserto registros que al final son tareas
o yo borro registros. En este caso deseo insertar. Me preguntan el estado. El estado
va a coincidir con el workflow. Entonces, aquí van a aparecer todos los estados que están
establecidos en el workflow. Pero ya a nivel de producción, si tú nada más tienes acceso a un
solo estado de workflow, solamente te va a aparecer ese estado. No te aparecen los demás. ¿Por qué
no hicimos ese ejemplo? Porque me tocó entrar el TMC, crear un usuario, dar unos permisos ahí
especiales y me demoraba más. Pues tienes que tener en cuenta que aquí aparecen todos los
datos. Todos tres paso del workflow sencillamente porque están asignados al mismo usuario. Pero
solamente a cada usuario le va a aparecer el estado en el cual fue asignado. No le va a
aparecer más nada. En este caso coloca el estado en revisión. Y en asignado, por favor,
dale click y debería aparecerte el nombre del usuario. En este caso el tuyo, porque
nada más es un nombre de usuario. Si el nombre de usuario no te aparece, eso indica en que quizás
creaste el rol y no le adicionaste el usuario. Entonces, escuade por favor tu usuario.
Aquí hay un tab que normalmente haces para agregarle más información al proceso. No lo
vamos a trabajar. Y aquí hay algo que se nos puede olvidar. El olvidar es que necesariamente
que dales safe. Si no, eso no guarda automático. Entonces, dale safe aquí.
Verifica, dale click nuevamente aquí en cliente y verifica para ver la salida que
debe estar configurada con lo que hiciste. Inser en revisión.
Perfecto. Si éste es, vamos a darle ahora en run.
Un momento, ya ejecutó. No, pero cuando yo ya lo run ya.
Vamos a darle run un momento, que pronto el guardia no se sigue el mismo que salió acá.
Bien, sí, dígame.
Ah, sí, sí, el preview no aparece porque no hay datos, porque esa campaña está vacía.
Por eso intenta hacer un preview y no encuentra datos. Dele click en run, por favor.
Bueno, sí, no, no, un momento, explicar aquí algo. Aquí hay lo que llaman profiles.
Esto lo agrego. Quizás te toque. Rátimosamente no tenemos ese curso, que es el Talent MC,
el Manus Consoles, pero te lo adiciono aquí. Tú puedes decidir la infraestructura en la cual
vas a ejecutar estos pipeline. Entonces, esta infraestructura puede ser en el cloud de Talent
o puedes configurar una infraestructura propia en tu empresa para ejecutarlo internamente en
tu empresa, si es lo que tú quieres. Pero note lo siguiente. Aquí dele click en estándar,
que es que estar aquí y aquí aparece Spark, que es una tecnología a nivel de Big Data.
Entonces hay un cluster de estar Spark, Spark, donde se esto porque va a demorar,
demora como 20 segundos, porque ya vuelvo, repito, son millones de usuarios en un
flotenan. Hay que esperar a que se desbloquee. Dele aquí, entonces, en run, por favor.
Y es yo que empieza a ejecutarse.
Puede demorar alrededor de 30 segundos.
Por ahí, quizás.
Esa parte de Spark, tú la configuras en realidad en la misma forma. Imagínate que tú hagas un
proceso en un job. Para convertir esto a Big Data, nada más escoger y darle click ahí a un
Spark y ya te lo convierte automáticamente el código Spark. Y eso pues en realidad te ayuda
mucho. Pero bueno, debes que analizar cuál es el costo de la herramienta versus al costo
a nivel de tiempo que estás ganando usando la herramienta. Bueno, aquí al parecer ya terminó.
Perfecto. Me marco error. Creo que si le doy click aquí, él intenta consultar,
él hace un preview. Hay veces que demora un poco. Creo que aquí puede demorar un ratico.
Hay veces que demora y veces que no.
Bueno, para evitar esto, hagámoslo de otra forma. Vamos a consultar otra forma diferente.
Váyase, por favor, al menú de la parte de arriba y cambie de herramienta y dígale data
teamwork. Ops, hay un error aquí de 500, el F5. Esos errores pues asumo que a nivel de
producción no deben salir. Es decir, en el día de... Si quieres dale click en campañas
y escoge la campaña. Si no te aparecen tareas, verifica el mi que está de este lado y
verifica si está en mayor a cero. Dale click. En este caso yo tengo 20, doy click aquí en este 20
y me aparecen las tareas de esta campaña. Recuerde, estoy en campaña. Me voy a mostrar
las tareas y aquí está asignado. Aquí no puedo cambiar las tareas. No puedo hacer proceso
de revisión. No puedo hacer nada aquí. Simplemente es para visualización. Ahora vamos a
cambiar que se parece mucho al menú. Vamos ahora, damos aquí en la flechita hacia atrás
y vamos al menú de tareas y escoja la campaña curación de datos clientes.
Y en este caso sí podías hacer cambios. Bueno, veamos entonces, perito Marco, el caso tuyo,
Elizabeth, en la parte... Brenda, Elizabeth, en la parte... Ahí está el mouse, permítame
ampliarlo. Notarás que en la parte izquierda hay un mi y te aparece un 20. Del lado
izquierdo te aparece mi de yo y tienes un 20. Dale click en el 20 por favor. Ese mi 20 indica
que tú o el usuario que está conectado tiene 20 tareas. Como estás en el menú de campaña,
ese menú de campaña no te va a permitir modificar las tareas. Entonces devuélvete
con la flecha negra que está del lado izquierdo ahí, devuélvete y escoge la opción de
Bueno, ya hicimos el perfil que es propietario de campaña. Crea el modelo de datos,
crea la campaña y define y asigna los pasos a los diferentes Datastores.
Hicimos el poco del perfil que es un usuario técnico que es el que... Ah, perdón,
hicimos el del perfil que es operador de campaña que es el que puede crear tareas.
Hicimos una tarea de forma manual. Y hicimos un perfil un poco más técnico en el cual se
pobló la campaña a través de un archivo. Es el más común. Aclaro que yo lo hice con un
data sec. Espero que me de un ejemplo para hacerlo con bases de datos. Tú puedes tener
bases de datos. Actualmente hay 600 conexiones que te puedes conectar a muchos componentes de
Azure. Te puedes conectar a AWS, te puede conectar a BigQuery. Bueno, hay una cantidad de
componentes de conexión, no solamente a nivel de bases de datos y archivos SV,
sino hay una gran cantidad de elementos. Espero que me de tiempo para hacer otro
ejemplito diferente con un tipo de conexión diferente. Pero bueno, estoy ahora mismo en
el perfil, vamos en el perfil, en el perfil Datastores. Es decir, ahora se le asignaron
unas tareas a alguien para que las pueda revisar. Ok. Este señor normalmente,
pues su conocimiento técnico no es tan alto, pero aquí hay unas pequeñas funciones que le
deben ayudar a resolver algunos problemas de calidad de datos que requiere esta parte de aquí.
Ok. Este menú que está aquí, para aprovecharlo, lo que voy a hacer es lo siguiente. Este menú
es prácticamente el mismo de una sección de Talent Data Preparation. Entonces,
lo que yo de en Talent Data Preparation se aplica en el Talent Data Server, porque
son prácticamente el Talent Data Preparation tiene otro menú, pero incluye esto que está
acá. Ok. Listo. Entonces, le llegó una campaña. Para llegar a campañas,
vamos a hacer lo siguiente, por favor, váyase aquí a donde dice, en su avatar,
la parte superior derecha, dele clic ahí en ese avatar. Váyase al menú que dice Profiles Preferences.
Profiles Preferences. Bueno, aquí hay muchas cosas. Esto es más del TMC,
pero bueno, hay algo que le incluye a usted, que ahí en About Me le define los roles a los
cuales tiene permiso. En este caso, como usted es el dueño de la cuenta, tiene permiso,
pues a todo. Pero me interesa, pues, la parte de notificación esta que está aquí. Notificación,
notificación. Y si quiere, usted chulee ese que dice Data Stewards. No me meto con el otro,
porque me tocaría incluir unos temas ahí. ¿Qué significa que esté chuleado ese Data Stewards?
Bueno, pasa lo siguiente. Imagínate que tú eres un Data Stewards y a ti te pueden asignar
campañas en un momento determinado. Entonces, ¿qué hace? Que tú, como usuario, entras y
habilitas esta opción. Esa opción te habilita y lo que va a hacer es que cada vez que te
manden unas tareas para solucionar, te llega un mensaje de correo, te notifica el mensaje de
correo que te llegaron algunas cuentas ahí que tendrías que revisar. Para eso es que sirve la
notificación. Para esta parte del lenguaje es sencillo, es que lo que vas a escoger el
lenguaje nada más son cualquier tipo de lenguaje, es inglés, francés,
japonés y alemán. ¿Español? No hay. No creo que por el momento se cree algo en
español. No lo veo dentro de lo que quiera ser talento. Está en inglés. Bueno, esto sí,
ya es muy particular del TMS, entonces no me meto con eso. Aquí lo que quería llegar es
que deberías habilitar esta notificación. Aquí le toca a cada usuario entrar a su cuenta y
habilitar para que le notifique por correo cada vez que tenga unas nuevas tareas. Por
favor, déle click aquí en la rechita. Listo, perfecto. Entonces, note que me aparecen las
columnas. Los nombres de columnas van a coincidir con el nombre más no con el identificador.
Entonces, tengo nombre, espacio completo, para eso que es el label, para que se vea mucho
mejor. Y en cada columna me aparece un tipo de datos, ¿cierto? Aquí aparece mira que aquí
están los tipos de datos que definí en el modelo. Texto, texto, texto, texto, marcas de vehículo,
integer, date, que son los que tiene. Yo puedo modificar esos datos en el modelo si yo quiero,
pero en este caso pues no lo vamos a hacer. Debajo de cada uno de estos atributos aparece
una línea. La línea indica, verde significa que en esa columna no hay ningún error de
validación de datos. Si aparece un robo significa que hay un error de validación de datos. Entonces,
si tú quieres, por ejemplo, en la columna email, date cuenta que aparecen tres en rojo. Si tú quieres
aquí en la columna que está en las líneas, dale click nada más en rojo y te hace un filtro
para que aparezca nada más lo que no cumple con la condición. Le das click ahí en el rojito,
en la línea roja. Y si quieres quitarle el filtro, en la parte de arriba te aparece y
lo cierras acá. Le das click nuevamente aquí en rojo y te agrega el filtro acá arriba.
Si deseas saber por qué no está cumpliendo la condición, te puedes ir a la línea roja que
aparece en cada columna, colocas el mouse en esa línea roja y te dice qué es lo que no está
cumpliendo esa columna. Ahí te está diciendo, mira, el valor que está digitado en esa columna
no corresponde o no hace match con el patrón de validación que habíamos definido con el
GPT, que era determinada en MX. Perfecto, listo. Ahora, aquí viene el proceso, ve que esto es
un proceso netamente visual. Aquí viene un proceso netamente visual. Me doy cuenta que
el correo de señor está mal porque ese correo de señor no termina en .com si no termina,
por ejemplo, en MX. Entonces tú accedes, accede por favor, dale doble click a la celda
y haces el cambio que tú requieras. Este cambio se registra y después tú lo puedes
ver en el salario, te digo cómo. Dale aquí MX.MX y ya ese señor no aparece, aquí me faltó un
punto y ya date cuenta que no aparece como revisado. Ahora, tú puedes agregar comentarios,
por ejemplo, en esta columna que tengo aquí se llama Juan Martínez, dale click derecho aquí
y te aparece click derecho sobre la columna y te sale la noción que dice at coming. Dale click
en este at coming y tú puedes darle un comentario para que la siguiente paso pueda
revisar porque lo hiciste. Entonces vamos a colocar aquí en mi libreta
el correo del señor Juan termina en MX y no en .com. Bueno, aquí puedes colocar lo que tú
quieras, aquí le das entonces un chulito, le das a adicionar aquí, perdón, listo, el chulito y te
aparece. Aquí automáticamente va a aparecer en la parte de arriba con una especie de
angulito diciéndole que esa columna tiene comentarios y procede por favor a cambiar el
punto el .com, el .com ese a MX para que va a seguir la misma idea, MX, listo, voy a quitar el
filtro que está aquí. Sí tenemos cual es la idea, verdad, entonces es muy manual. Ahora,
aquí hay unas funciones que me pueden ayudar, por ejemplo, vamos a suponer que tú detectaste
que hay un problema, que los .com debían ser .mx, entonces para no hacer eso tan manual puedes
aprovecharte de algunas funciones que están. Pues brevito, estas funciones las voy a ver más
en detalle cuando vea el Talent Appropriation porque son las mismas, pero veamos algunas y
podamos entonces avanzar. Escoge la columna esta que está aquí que es email y te vas
acá a las funciones del lado derecho. Dentro de estas funciones busca y coloca la palabra
search, pero una función de búsqueda, search y te vas a encontrar con una función que dice
search and replace. En el search and replace aparece con un pequeño botón que tiene como
una irea al revés, aquí este botón de aquí que es como si fuese una ola y aquí hay
varios criterios de búsquedas. No vamos a escoger por defecto entonces, aquí nada más,
me va a buscar por expresión, voy a decirle búscame todo lo que termina en .com y reemplázalo
por .mx. Si le coloco override en tera celda me va a reemplazar toda la celda por mx,
entonces ahí lo que voy a hacer es que nada más reemplace ese pedazo de su cadena y aquí
le voy a dar su mi, creo que eso es su mi nada más aquí y solamente me quedó uno ese
que es el que tiene error porque está vacío, no cumple con la condición, porque yo valide
y especificé en el modelo de datos que eso tenía que tener algún elemento ahí. Perfecto,
continuo, vamos a tratar de solucionar la mayor cantidad de problemas para poder continuar,
listo entonces y entender un poco la herramienta. Aquí voy a filtrar los en números de
polisa, aquí los en números de polisa tengo aquí un problema que esta polisa es claro que
no está cumpliendo el formato, porque parece ser que está completo y lo que no tiene son los
guiones, entonces voy a aprovechar y soluciono los guiones aquí pol le doy guión 2024 guión y
debería corregirlo ahí está y solamente tengo dos columnas que no he podido solucionar el
problema porque si no sabía que es, una está vacía y una aparece como error, quite este
filtro por favor y veamos a nivel de teléfono cuáles no cumplen, bueno en este caso
hay muchos que no cumplen específicamente si te quiere ya recordará para ver que no
cumple voy aquí a una de las columnas esa y le doy clic en eso colocó el mouse sobre el punto
rojo la línea roja y me dice qué es lo que no está cumpliendo ahí no está cumpliendo un
reyes básicamente ahí tengo un más 57 y tengo en realidad debería empezar como más 52 aquí
si es un poco más complejo porque había que revisar cada uno de los teléfonos y hacer
la corrección pero de forma sencilla solamente para probar se cambie todo lo que empieza por
52 en Serran Replay selecciona la columna teléfono y cámbielo por perdón 52 momento que
porque no la cumple un momento no la cumple porque si hay unos espacios en blanco si vamos
a ver cuáles cumple momento a ver quito el filtro a ver cuál es la cumple porque son
tres dígitos separados por espacio después tres dígitos y termina con cuatro dígitos ese reyes
que tengo entonces la mayoría pues no lo está cumpliendo voy a corregir nada más uno
solo voy a corregir este primerito que me dice primero empieza con más 52 espacio tres dígitos
después siguen tres dígitos y termina con cuatro dígitos
aquí estoy inventando aquí ahí está si ese es el reyes sería más 52 espacio tres dígitos
espacio tres dígitos espacio cuatro dígitos ahí sería interesante hacer una función en la
cual me reemplace los espacios que requiero y lleva el formato pero es un poco más
interesante la única forma que se me ocurre de hacerla es hacer un reyes es decir yo puedo
hacer un replays con un reyes y que reyes borre esos espacios en blanco pero sinceramente una
función que haga eso que es una buena pregunta que haga eso en específico
no me tocaría formarla con varias funciones pero no hay una que ese formato lo haga
por eso decía cuando lo ve cuando lo vi ahora es un poquito complejo pero así directamente no
me sale bueno vamos a ver entonces ya casi para arlar algunos porque no vamos a ponernos uno
por uno porque demoramos más esto lo aprendemos mejor con el talent operation vamos aquí en el
estado me aparece suspendida y voy a ver por qué me aparece rora a ver porque los tipos
de datos es el tipo de tipo list y debería el valor no está definido al estado porque
es el activa pendiente se me escapó la otra que es cancelada entonces está suspendida debe
ser cancelada entonces voy a cambiar esta suspendida por cancelada
y ahí está si en la parte de arriba notará que aquí hay un botoncito que se llama
y aquí están dos flechas hacia adelante y hacia atrás si digo hacia atrás debería
colocarme la suspendida y aquí estaría nuevamente buena pregunta y ahí estaría
sería el condo sete y el control y el segundo sete sería la flecha hacia atrás el control
y sería la fecha serán listo
bueno aquí noto que hay unos errores porque seguramente en la lista de valores no están
esto de marca no estarían estos vehículos este error de modelo es mucho más sencillo porque
aquí lo que tendría que hacer es reemplazar los espacios en blanco entonces voy aquí a coger
modelo y voy a hacer un replays replays bueno aquí hay unas funciones específicas pero
va a hacerla con replays un momento y eso lo voy allá lo veo allá en mi talent
aquí de un espacio en blanco y lo reemplazo por vacío
no lo hizo espere un momento no perdón creo que tienes un número pero no alcanzó a ver
el número ese espacio blanco lo que tiene ahí o un separador
si si si es como un pequeño separador de miles si si entonces no por eso no lo no lo
valido aquí hay un error con el 79 porque seguramente no cumple aquí dice que debe
estar entre 1980 y 2025 recuerdan que esa regla la colocamos y entonces por eso es que no lo
valido dice que no cumple con la condición bueno terminemos ya de solucionar y ver para
qué se hace en este caso fecha inicio voy a filtrar las fechas que están erradas al
parecer hay un error primero de separador porque está esperando el guión ya le había
dicho que la fecha por defecto es año mes día y tengo otro pequeño error que sería
con el formato el formato que tengo está en día mes año entonces el primero es fácil
de solucionar porque es un service play le digo reemplaza de slash por guión aquí
perfecto y este voy a intentar solucionarlo voy a buscar una función aquí de tipo date
a ver si me aparece
debe ser convertir date no este convertir de ahí no me funciona modificar me lo convierte
años mes días no ese formato en esta herramienta no lo podría lo podía hacer con el talent data
preparation ese formato me va a quedar complicado hacerlo a menos que lo haga con una expresión
regular pero no aquí lo va a cambiar de forma manual entonces sería 20 25 guión 0 1 0 1
perfecto listo
aquí me sale todavía error vamos a ver qué pasa
aquí tengo que se no lo cambió
a poco estoy en fecha de vencimiento pero en fecha de vencimiento también a un ser
replace para cambiar el carácter es las por guión serán replace
bueno esto ya es un poco más tedioso y corrigiendo las funciones
pues repito las explicó mejor en el talent data preparation
bueno sigamos                

on 2025-01-27

Visit the Talend Big Data Integration y Ecosistema de Talend course recordings page