15 videos 📅 2025-01-27 09:00:00 America/Bahia_Banderas
24:24
2025-01-27 13:13:59
2:06:12
2025-01-27 13:42:41
3:36:29
2025-01-28 09:08:14
4:33
2025-01-28 13:48:42
55:46
2025-01-28 14:06:51
2:02
2025-01-29 10:22:33
1:02:14
2025-01-29 10:25:14
2:10
2025-01-29 11:38:26
2:26
2025-01-29 12:03:00
1:23:37
2025-01-29 12:05:56
35:40
2025-01-29 15:01:26
1:40:43
2025-01-30 09:07:07
1:08:48
2025-01-30 11:20:20
1:10:50
2025-01-30 13:15:56
3:50:03
2025-01-31 07:20:07

Visit the Talend Big Data Integration y Ecosistema de Talend course recordings page

United Arab Emirates - Talend Big Data Integration

                WEBVTT

00:00:00.000 --> 00:00:08.400
y lo volvemos a abrir nuevamente y aquí sí está el nombre del job que es

00:00:08.400 --> 00:00:12.960
transformaciones básicas versión 2 eso es un pequeño bot que tiene la

00:00:12.960 --> 00:00:16.960
herramienta no lo no lo ha corregido todavía

00:00:18.440 --> 00:00:19.480
ejecutamos aquí

00:00:21.540 --> 00:00:27.580
y ahora sí empieza a ejecutar de se cuenta que está en multi trea y todavía

00:00:27.580 --> 00:00:31.000
sigue ejecutando el primer sub job aún estando en multi trea porque hay una

00:00:31.000 --> 00:00:35.640
jerarquía de job entonces tú puedes jerarquitar su job de esta manera y

00:00:35.640 --> 00:00:39.600
sería mejor práctica si tienes varios sub jobs si hay la jerarquía pues

00:00:39.600 --> 00:00:43.360
evidentemente que las marque de esta manera porque así cualquier persona que

00:00:43.360 --> 00:00:46.240
vaya a leer el job ya entiende que se ejecuta primero que se ejecuta

00:00:46.240 --> 00:00:50.220
después y cómo están las dependencias de esos sub jobs

00:00:50.220 --> 00:00:53.440
perfecto creo que ya lo hicieron vamos a ver el caso de Beatriz creo que tiene

00:00:53.440 --> 00:00:57.680
un error mostré para ver si salió un error ahí extraño vuelva a ejecutar

00:00:57.680 --> 00:01:01.740
nuevamente para ver no ahí está ejecutando la versión anterior cierre

00:01:01.740 --> 00:01:04.840
ese sub job por favor, cierre el job perdón, cierre el archivo vuelvelo a abrir

00:01:04.840 --> 00:01:08.860
para ver el click para si lo tomo de se cuenta que ahí le aparece de

00:01:08.860 --> 00:01:14.480
ejecutar ahora ahí le aparece el run y el empertre bar en sí aparece ya la

00:01:15.140 --> 00:01:18.920
listo ahí lo que hemos modificado es la jerarquía para que ahora sí

00:01:18.920 --> 00:01:22.160
primero se ejecute el primero y después el segundo independiente que

00:01:22.160 --> 00:01:27.760
estén multitread por último acá visualicen lo siguiente veanlo a este

00:01:27.760 --> 00:01:32.280
lado no lo haga usted allá para ganar más tiempo la otra opción es que yo

00:01:33.460 --> 00:01:39.320
coloque no coloque un sub job sino un component ok

00:01:39.320 --> 00:01:44.320
significa que es lo siguiente cuando este componente se haya terminado de

00:01:44.320 --> 00:01:49.000
ejecutar correctamente se va a ejecutar esto de acá abajo si lo

00:01:49.340 --> 00:01:54.600
ejecutar con un component va a dar exactamente lo mismo con un sub job ok

00:01:54.600 --> 00:02:01.080
ya le explico por qué mira voy a volver aquí a ejecutar con un component y me

00:02:01.080 --> 00:02:05.020
va a dar exactamente lo mismo que un sub job ok vea que está primero

00:02:05.020 --> 00:02:09.780
terminando acá y después sigue acá porque un component para este caso

00:02:09.780 --> 00:02:13.860
funciona exactamente igual porque resulta que este componente para

00:02:13.860 --> 00:02:18.360
verificar que terminó correctamente tuvo que haber recorrido los 25

00:02:18.360 --> 00:02:22.620
registros entonces como él se ejecuta registros por registro al final

00:02:22.620 --> 00:02:27.700
ejecuta todo el flujo y tendría que terminar de ejecutar los 25 para que

00:02:27.700 --> 00:02:31.340
este terminara de la ejecución del componente pero normalmente que hace

00:02:31.340 --> 00:02:35.160
lo con un component que es diferente a un sub job quedado un componente en

00:02:35.160 --> 00:02:40.800
particular si ese componente se ejecuta de forma correcta pasa entonces al

00:02:41.600 --> 00:02:45.720
siguiente sub job esa es la diferencia fundamental que hay por otro lado aquí

00:02:45.720 --> 00:02:53.380
puede encontrar si te quiere agreguen un temesas box aquí tmsg

00:02:54.260 --> 00:02:58.480
tmsg box ese es para hacer una casilla de texto

00:03:00.140 --> 00:03:01.340
tmsg box

00:03:03.320 --> 00:03:08.380
y aquí hay una opción que dice el disparador o el sub job error las

00:03:08.380 --> 00:03:13.680
conecta acá ahí entenderá lo siguiente que si hay un error en el sub job

00:03:14.560 --> 00:03:18.660
manda a ejecutar el mesas box si no hay ningún error pues sigue su flujo

00:03:18.660 --> 00:03:22.740
normal en este caso pues no nos va a mostrar error porque la lectura del

00:03:22.740 --> 00:03:26.100
componente la está haciendo de forma correcta pero para eso que sirve recuerde

00:03:26.100 --> 00:03:30.640
la diferencia del sub job, el sub job termina el sub job completo y un component

00:03:30.640 --> 00:03:33.960
solamente ejecuta el siguiente sub job cuando el componente ya terminó de

00:03:33.960 --> 00:03:38.780
ejecutar de forma correcta esa es la diferencia que hay

00:03:39.420 --> 00:03:44.120
ya unió, Beatriz tiene que unir el primer componente con click derecho

00:03:45.080 --> 00:03:47.540
disparador voy a hacer el primer componente del sub job

00:03:49.560 --> 00:03:52.620
click derecho ahí sí

00:03:55.740 --> 00:03:59.700
disparador y on sub job ok

00:03:59.700 --> 00:04:04.640
tiene el tmsg box no ya está conectado está bien está conectado

00:04:04.640 --> 00:04:07.260
está bien está en rojo ahí está conectado está bien

00:04:07.260 --> 00:04:12.400
ah no perdón usted lo conectó con un regex, ese regex es para cosas diferentes

00:04:12.400 --> 00:04:17.420
haga lo siguiente bueno bien sirve para lo siguiente si hay una línea que

00:04:17.420 --> 00:04:22.480
está más conectada dele click en la línea roja que es la que queremos

00:04:23.440 --> 00:04:27.380
eliminar y dele suprimir selecciona el click creo que no lo ha seleccionado

00:04:27.380 --> 00:04:32.020
y ahí está creo que está seleccionado ya ya está seleccionado dele click entonces

00:04:32.020 --> 00:04:39.520
en el row 3 donde dice row 3 dele click dele ahora suprimir ahora sí

00:04:39.520 --> 00:04:46.640
vayas al primer componente click derecho vamos a disparador y vamos a un sub job

00:04:47.940 --> 00:04:50.620
ok perdón era error que pena era error

00:04:50.620 --> 00:04:56.260
porque un sub job que debemos hacer, dele escape click derecho disparador

00:04:56.260 --> 00:05:02.320
con su job error y lo conecta ahí perfecto ahí está bien

00:05:02.320 --> 00:05:06.080
esto solamente se ejecutaría siempre cuando haya cualquier error en el job

00:05:06.080 --> 00:05:11.500
eso es piensa lo que pronto tienes un job y quisieras mandarlo a un correo o

00:05:11.500 --> 00:05:15.500
a un celular que te manda un mensaje entonces para hacer cualquier

00:05:15.500 --> 00:05:20.640
actividad de mantenimiento como tal por último ya para mirar esta parte

00:05:20.640 --> 00:05:23.220
básica crees un nuevo job

00:05:26.260 --> 00:05:32.060
crear job que lo va a llamar job on the record integrador

00:05:32.060 --> 00:05:35.680
job on the record integrador te da finish

00:05:36.540 --> 00:05:41.420
entonces ya le mostré la forma en la cual tú puedes definir la jerarquía de

00:05:41.420 --> 00:05:46.280
ejecución de varios sub jobs de igual forma puedes definir jerarquía de

00:05:47.380 --> 00:05:51.620
cómo lo haces dos formas de hacerlo

00:05:51.620 --> 00:05:59.580
primera forma y vas a buscar un un componente que se llama troom de

00:05:59.580 --> 00:06:04.740
ejecutar troom job troom job

00:06:05.980 --> 00:06:09.920
troom siempre cuando vayas a configurar un componente en talent es lo mismo le

00:06:09.920 --> 00:06:13.960
da doble clic y te va a aparecer en la parte de abajo te debe aparecer la

00:06:13.960 --> 00:06:17.520
configuración de ese componente entonces aquí hay diferentes elementos

00:06:17.520 --> 00:06:23.000
aquí está lo que se llama trabajo dele aquí entonces al laito del text box

00:06:23.000 --> 00:06:27.080
hay un botoncito con tres puntos dele clic y va a escoger el job que quiere

00:06:27.080 --> 00:06:31.760
ejecutar ese componente espere que ahora que a veces demora un poquito

00:06:31.760 --> 00:06:40.200
aquí tengo axa básicos y voy a escoger yo transformaciones básicas 1.0

00:06:40.200 --> 00:06:45.800
ok ahí estamos en la configuración del job verdad doble clic

00:06:45.800 --> 00:06:51.440
aquí aparece una sección que dice trabajo para ese motivo trabajo

00:06:54.700 --> 00:06:59.800
aquí ven aquí sale aquí listo aquí en la configuración trabajo aquí está

00:06:59.800 --> 00:07:05.760
un text file y aquí está un botón con tres puntos le da clic para que

00:07:05.760 --> 00:07:10.140
escoja a que quiere referenciar ahí escoge el trabajo que fue el primero

00:07:13.140 --> 00:07:18.180
perfecto y la otra forma de hacer lo mismo es se va a repositorio y vamos a

00:07:18.180 --> 00:07:23.220
seleccionar el job que hicimos 2 que es versión número 2 clic sostenido y

00:07:23.220 --> 00:07:25.480
lo suelta de este lado

00:07:26.500 --> 00:07:30.620
aquí se aplica lo siguiente que está si está en multitread va a intentar

00:07:30.620 --> 00:07:35.040
ejecutar los dos jobs de manera paralela pero para ejecutarlo de

00:07:35.040 --> 00:07:40.820
manera jerárquica le da aquí en fila y de aquí hay un main y los conecta aquí

00:07:41.980 --> 00:07:48.160
y ahí ejecutaría primero el job 1 y después ejecutaría el job 2

00:07:48.160 --> 00:07:52.280
cualquiera de las dos formas bueno déle guardar eso no lo vamos a

00:07:52.280 --> 00:07:56.700
ejecutar pero eso es lo que hacen en la primera lo que hace es ejecutar

00:07:56.700 --> 00:08:00.120
su job dentro de un job y este ternón job lo que hace es que ejecuta

00:08:00.120 --> 00:08:07.800
y puede ejecutar varios yo que en un solo yo listo listo falta jorge falta

00:08:07.800 --> 00:08:14.820
te falta unir el los dos componentes en cual lo ejecutó

00:08:15.660 --> 00:08:20.800
este warning no aquí dice más que todo es no hay un esquema definido

00:08:20.800 --> 00:08:22.700
como si no

00:08:29.360 --> 00:08:35.480
aparece en el primero en el segundo no

00:08:36.020 --> 00:08:41.100
si pero si está definido no sé si guarden ahí no fundaría porque está

00:08:41.100 --> 00:08:45.840
ahora lo reviso para ver bien bueno ahora sí terminamos esta parte básica

00:08:45.840 --> 00:08:50.260
y nos vamos entonces a la parte de ahora sí vamos a entrar un poco en la

00:08:50.260 --> 00:08:52.680
parte del dato para trabajar con teclas y en la parte de la parte de

00:08:52.680 --> 00:08:56.240
entonces vamos a hacer lo siguiente minimiza esta ventana por favor de

00:08:56.240 --> 00:09:03.120
gesto abierto y yo tengo una máquina virtual en el cual tengo bueno un

00:09:03.120 --> 00:09:07.300
clóster pero ese clóster nada más tiene un solo maestro y un solo

00:09:07.300 --> 00:09:11.760
worker que está en una máquina virtual no armé un clóster completo

00:09:11.760 --> 00:09:14.580
porque en realidad no te lleva tenía poca máquina

00:09:14.580 --> 00:09:17.200
necesitaba necesitaba mucha infraestructura entonces vamos a lo

00:09:17.200 --> 00:09:23.700
siguiente en el en el escritorio vayas aquí al ícono que está al final de

00:09:23.700 --> 00:09:28.580
la primera línea y aquí hasta que se administró de hay para mí del doble

00:09:29.880 --> 00:09:30.400
clic

00:09:34.700 --> 00:09:38.300
a todos de aparecerle por defecto una máquina virtual que se llama a

00:09:38.300 --> 00:09:44.660
lo que le doble clic a ese jado que está ahí

00:09:44.660 --> 00:09:49.340
y él va a intentar entonces le abre una ventana para que inicie la máquina

00:09:50.840 --> 00:09:54.580
virtual dele iniciar por favor si aparece un

00:09:54.580 --> 00:09:58.760
warning de un punto de control dele continuar no hay ningún problema

00:10:02.000 --> 00:10:02.440
continuar

00:10:04.620 --> 00:10:09.320
a les de usted aceptar ahí en el caso de brenda no sé qué salió mucho

00:10:09.320 --> 00:10:11.700
para ver hoy nuevamente su máquina brenda un momento a ver

00:10:15.840 --> 00:10:19.420
voy un momento su máquina brenda por favor y déjeme yo ser

00:10:22.800 --> 00:10:27.960
a perdón creo que no creo que hay dos conexiones un momento

00:10:28.540 --> 00:10:32.100
no lo que hace que haya dos conexiones

00:10:35.900 --> 00:10:38.640
perfecto listo pero hemos que carguen entonces

00:10:40.760 --> 00:10:44.780
explico listo explico a mientras va cargando la máquina virtual voy a

00:10:44.780 --> 00:10:47.620
explicar lo que vamos a hacer entonces

00:10:48.660 --> 00:10:54.280
voy a pintar aquí un diagrama tenemos entonces lo siguiente tengo una

00:10:54.280 --> 00:10:59.280
máquina que es la máquina windows en esta máquina windows tengo el tal en

00:10:59.280 --> 00:11:03.180
big data como herramienta tal en big data que es la que tenemos montada

00:11:03.180 --> 00:11:06.880
ahora mismo en windows tengo el hipervisor de windows que es hay

00:11:08.320 --> 00:11:11.820
y en este hay que tengo aquí tengo una

00:11:11.820 --> 00:11:19.240
máquina virtual esta máquina virtual de aquí esta máquina virtual tiene montado

00:11:19.240 --> 00:11:24.380
un clóster de hadut con lo único es que ese clóster nada más tiene un

00:11:24.380 --> 00:11:29.520
worker no agrego más porque en realidad me lleva mucha infraestructura

00:11:30.160 --> 00:11:34.960
y al final pues tenemos 15 y que sería un poco más costoso la parte de

00:11:34.960 --> 00:11:39.900
la máquina o cada máquina porque entonces por por por hora y por recursos

00:11:39.900 --> 00:11:44.100
que consume la máquina entonces qué es lo que vamos a hacer al final este

00:11:44.100 --> 00:11:48.900
tal en big data se va a conectar a este clóster dejado y va a hacer

00:11:48.900 --> 00:11:53.140
operaciones sobre este clóster dejado listo eso es lo que vamos a

00:11:53.140 --> 00:11:57.080
hacer entonces vamos nuevamente a la máquina que ya tuvo que haber cargada

00:11:58.040 --> 00:12:06.180
y ahora dele clic en el usuario hdud el password es el mismo hdud pero en h

00:12:06.180 --> 00:12:12.620
minúscula hdud le da enter hdud en minúscula por favor

00:12:12.620 --> 00:12:19.100
perfecto ya cargo ahora hagamos lo siguiente entonces

00:12:19.100 --> 00:12:24.960
abra una terminal como lo hace se va el menú de los puntos que están en

00:12:24.960 --> 00:12:26.720
la parte de abajo

00:12:29.040 --> 00:12:33.140
y ahí le aparece la terminal aquí mismo que sería en la primera fila última

00:12:37.180 --> 00:12:37.700
columna

00:12:42.300 --> 00:12:46.720
y vamos a comprobar entonces conectividad para esto vamos a dar el

00:12:46.720 --> 00:12:49.560
siguiente comando va a colocar el estado de comandos aquí en un

00:12:49.560 --> 00:12:53.700
archivito que vamos a hacer vamos a ver primer comando vamos a darle el

00:12:53.700 --> 00:13:00.980
comando ip addr con doble de ip espacio addr

00:13:02.280 --> 00:13:06.420
bueno listo yo le voy a dar ip addr acá

00:13:06.420 --> 00:13:12.700
ip addr y aquí me salen entonces dos direcciones la

00:13:12.700 --> 00:13:20.960
look back que es la 127.0.0.1 pero me interesa la dirección que es 10.0.3.6

00:13:20.960 --> 00:13:25.960
en pocas palabras para completar este diagrama esta máquina que está aquí

00:13:25.960 --> 00:13:36.080
tiene dirección ip 10.10.0.3.16 esta es la ip de esta

00:13:36.080 --> 00:13:41.040
máquina de acá y como sé que la máquina está clonada la máquina

00:13:41.040 --> 00:13:46.220
windows debe tener la misma dirección para todas entonces voy a la máquina

00:13:46.220 --> 00:13:49.080
windows no sé si me hace el favor alguno que me haga la comprobación

00:13:49.680 --> 00:13:55.400
no creo que haya una diferencia voy a la máquina windows está acá

00:13:55.400 --> 00:14:00.200
algunos nada más voy a escribir aquí cmd

00:14:00.200 --> 00:14:03.260
y voy a dar comando ip config

00:14:04.860 --> 00:14:09.800
y todos deberíamos si no estoy mal cada máquina tiene la misma dirección

00:14:09.800 --> 00:14:15.440
yo tengo dirección 10.0.3.15

00:14:18.000 --> 00:14:23.280
cmd o power power shell la que tú quieras y colocas ip addr

00:14:23.280 --> 00:14:28.400
si voy a colocar el comando acá sería el otro comando y pequeño que

00:14:28.400 --> 00:14:33.740
ip config y pequeño y creo que

00:14:36.000 --> 00:14:43.760
la 10.0.3.15 verdad listo por favor vamos a probar conectividad

00:14:43.760 --> 00:14:53.040
tele pin comando pin y coloque 10.0.3.16 y debería responder la máquina virtual

00:14:53.920 --> 00:15:03.200
en ahí en el cmd por favor en la en cmd de windows coloque pin 10.0.3.16 y debería devolver

00:15:06.080 --> 00:15:14.540
entonces pin 10.0.3.16 perfecto tenemos respuesta listo no hay ningún problema

00:15:14.540 --> 00:15:21.040
a nivel de conectividad de redes vayamos nuevamente a esta máquina que está

00:15:21.040 --> 00:15:25.440
aquí a la de máquina virtual por favor se sitúa en la terminal le da con el

00:15:25.440 --> 00:15:30.980
mouse y ya aquí tengo instalado el cluster de hadut vamos a iniciar

00:15:30.980 --> 00:15:36.860
entonces ese cluster de cero entonces vamos a lo siguiente vamos a dar el siguiente comando

00:15:36.860 --> 00:16:00.960
si son tan amables por aquí lo tengo y se me perdió eso vamos a dar el comando todo en

00:16:04.000 --> 00:16:05.240
menos forma

00:16:17.200 --> 00:16:23.080
explico rápidamente entonces que hicimos ahí lo que hicimos ahí voy a buscar la gráfica

00:16:24.560 --> 00:16:29.240
recuerden que la arquitectura de claus se basa en master es clavo entonces el master

00:16:29.240 --> 00:16:37.680
de hadut lo llama name node o sea el master de hadut se llama name node y el

00:16:37.680 --> 00:16:45.920
walker de hadut se llama datanode lo que estamos haciendo es que estamos formateando

00:16:46.700 --> 00:16:52.100
el cluster de hadut es decir si ahí había en archivos lo formateamos ya eso es lo que

00:16:52.100 --> 00:16:59.020
estamos haciendo listo seguimos entonces vamos a levantar dos servicios vamos a levantar en

00:16:59.020 --> 00:17:06.020
la instancia vamos a levantar el servicio para el almacenamiento distribuido con hdfs para eso

00:17:06.020 --> 00:17:15.480
va a dar el siguiente comando va a dar start de iniciar en inglés guión de fs punto sh entonces

00:17:15.480 --> 00:17:28.820
start guión de fs punto sh e intenta subir unos demonios recuerde que el concepto de lino el

00:17:28.820 --> 00:17:34.580
demonio es lo mismo que hablamos en windows como servicio son procesos que se ejecutan en

00:17:34.580 --> 00:17:38.980
background siendo que como se cambia el sistema operativo hay veces que se cambian los nombres

00:17:40.960 --> 00:17:45.860
no sé fernanda si si te ejecutó bien nuestra parada de fernanda voy a tu máquina

00:17:52.080 --> 00:17:58.800
si espacio dale flecha arriba flecha arriba flecha arriba para hacer para recuperar el

00:17:58.800 --> 00:18:04.420
vuelve con flecha izquierda y bueno y borras ahí listo perfecto enter perfecto listo cuando

00:18:04.420 --> 00:18:09.880
termine de ejecutar va a ejecutar ahora un comando que es un servicio que se llama el

00:18:09.880 --> 00:18:16.600
servicio de ya ya el servicio que le va a permitir poder compartir los recursos entonces

00:18:16.600 --> 00:18:28.800
aquí está estar ya punto sh ya con g y termina en rn punto sh entonces le damos aquí estar

00:18:31.380 --> 00:18:34.180
ya punto sh

00:18:47.040 --> 00:18:52.120
esto nada más lo vamos a hacer una sola vez perfecto listo

00:18:55.240 --> 00:18:59.200
cuando termine hay un comando que le va a permitir verificar cuáles

00:19:00.900 --> 00:19:06.040
servicios de nacionados con con jadu que están arriba el comando es jps

00:19:08.680 --> 00:19:09.240
jps

00:19:12.360 --> 00:19:21.880
y debería tener 1 2 3 4 5 bueno 6 con el jps servicio arriba bueno 6 demonios arriba

00:19:22.420 --> 00:19:31.240
uno que es no resource managers secundaria y no jps de no y no maya no un manager

00:19:32.700 --> 00:19:38.040
a betis parece que te veo menos a ti un momento y a tu máquina algo raro en el tuyo no le veo

00:19:39.080 --> 00:19:46.680
el no no lo veo permíteme accedo a tu máquina un momento se me hace raro que

00:19:46.680 --> 00:19:53.500
voy a intentar bajar los servicios por favor ahora dele el siguiente comando los que terminaron

00:19:53.500 --> 00:19:58.160
por favor vamos a verificar el tuvo que haber abierto unos puertos para los servicios

00:19:58.160 --> 00:20:05.840
entonces démosle el comando net está menos punta por favor esperan un momento por favor

00:20:07.820 --> 00:20:12.860
si aquí lo subió este que no dice no bueno yo voy a dar el comando aquí mientras termina

00:20:12.860 --> 00:20:17.680
acá con net está menos punta

00:20:20.300 --> 00:20:26.540
ven aquí sigo va a tener que ampliar para poder verlo bien aquí amplié esto para

00:20:26.540 --> 00:20:35.860
que se lo vea mejor aquí confirme que tenga abierto el puerto 98 70

00:20:38.520 --> 00:20:44.280
necesito dos puertos abiertos a claro a modo informativo el 0 0 0 que está indica ahí

00:20:44.280 --> 00:20:51.220
significa que cualquier máquina de la red se puede conectar a este puerto si aparece 127

00:20:51.220 --> 00:20:55.980
indica que solamente la máquina local se puede conectar entonces me interesa que

00:20:55.980 --> 00:21:04.720
verifique que tenga el 98 70 aquí abierto y el 9000 abierto que son los que necesito

00:21:04.720 --> 00:21:10.260
inicialmente para comprobar si quieres no comprueba comprobamos de esta forma

00:21:10.260 --> 00:21:15.800
esa windows ahora abre el browser de su preferencia el que usted quiera yo voy a abrir

00:21:15.800 --> 00:21:27.880
entonces hech y va a colocar la siguiente dirección va a colocar 10.0.3.16 dos puntos

00:21:27.880 --> 00:21:36.160
puerto 98 70 voy a parar a voy a coger jps que raro el caso suyo voy a comprobar

00:21:36.420 --> 00:21:44.780
un momento veatriz 10 puntos a comprobar acá el caso mío para ver

00:21:50.340 --> 00:21:57.100
listo aquí debería aparecer esa ventana el caso suyo batriz voy a sumar nuevamente que no sé qué está pasando

00:22:02.580 --> 00:22:09.060
aquí hay algo que pasó no sé

00:22:09.060 --> 00:22:16.560
vamos a intentar hacer un formateo para alguien más tuvo problemas para subir esto no sé de pronto

00:22:16.560 --> 00:22:23.780
alguien más voy a verificar aquí las pantallas bueno veo veatriz hizo brenda no sé si probó ya

00:22:23.780 --> 00:22:30.020
para ver si le funciona fernanda no sé si coloca la dirección en el blog se para ver 16 no 16

00:22:30.020 --> 00:22:36.620
sería estar 16 listo abre el browser que usted quiera desea este hecho ahora cron el que usted

00:22:36.620 --> 00:22:40.160
quiera y coloca esa dirección que está ahí perfecto entonces en la barra direcciones coloque

00:22:40.160 --> 00:22:48.380
10.0.3.16 dos puntos 98 70 perfecto

00:22:56.400 --> 00:23:05.960
este fue el pequeño problemita que faltó un menos parece a mí que ese fue el error

00:23:09.600 --> 00:23:12.700
me esperan un momentico por favor los demás mientras solucionan que un problemito

00:23:15.040 --> 00:23:18.300
bien esto lo hacemos nada más una sola vez perfecto listo

00:23:21.940 --> 00:23:26.420
perfecto bien vamos todos entonces ahora estamos aquí en esta ventana listo bueno

00:23:26.420 --> 00:23:31.000
esta es una ventana de la información de clósteres a dos si usted quiere vayas aquí

00:23:31.000 --> 00:23:38.260
donde dice data nodos un nuevo de datos note que nada más hay uno entonces prácticamente

00:23:38.260 --> 00:23:43.720
lo que tenemos en la arquitectura montada tomando esta gráfica es como si tuviese

00:23:43.720 --> 00:23:49.220
este clóster pero nada más estos workers no están aquí nada más hay un solo worker tengo

00:23:49.220 --> 00:23:53.600
una y no y tengo un solo worker casualidad que están en la misma máquina por buena práctica

00:23:53.600 --> 00:23:57.520
pues no debería estar en la misma máquina pero listo esto es lo que tengo configurado

00:23:59.380 --> 00:24:04.100
actualmente vayamos entonces no voy a meterme en detalle con esta parte vayamos lo que me

00:24:04.900 --> 00:24:10.420
interesa en la última opción que dice utilities hay una opción que dice bros de

00:24:10.420 --> 00:24:15.620
system que me queda ahí por favor utilities la última en el menú horizontal que está en la barra

00:24:17.160 --> 00:24:23.500
utilities le da click ahí y le da un browser listo ahí debe aparecer que está vacío ok

00:24:26.360 --> 00:24:33.180
por último ya para finalizar la configuración en la máquina virtual vayas nuevamente en la

00:24:33.180 --> 00:24:38.620
máquina virtual y va a dar los siguientes comandos se me tocó volverme a loguiar a

00:24:40.600 --> 00:24:41.900
todo el minúsculo

00:24:48.460 --> 00:25:00.040
va al siguiente comando entonces va a escribir hdfs hdfs de sistema de ficheros dfs o con el

00:25:00.040 --> 00:25:05.540
menos este que puede estar ese no sale directamente es las vamos a crear una carpeta que se llama

00:25:07.320 --> 00:25:14.100
así y por último después de esto le da este mismo comando hdfs para darle permisos

00:25:17.480 --> 00:25:21.680
vamos a crear una carpeta para poder organizar los archivos que vamos a trabajar con el

00:25:21.680 --> 00:25:25.500
tal en big data fernando voy a ver que creo que le salió algo raro está

00:25:27.500 --> 00:25:31.540
si hay un espacio exactamente de flecha arriba por favor para ver el comando

00:25:33.360 --> 00:25:39.420
si hay un espacio exactamente por eso es que los que estudiamos esta carrera nos volvemos

00:25:39.420 --> 00:25:44.580
cuadriculados sin el espacio no funciona sin el menos no funciona de lente por favor perdón

00:25:44.580 --> 00:25:47.900
aquí aquí hay un comando está raro este comando aquí que pena si es ese

00:25:49.460 --> 00:26:00.060
ahí corregí el comando porque es ch mod 77 de flecha arriba y cambia el ch dir y le

00:26:02.780 --> 00:26:10.940
equivoqué 777 entra hoy el f5 ahora al browser en el edge el que tiene abierto en windows

00:26:11.980 --> 00:26:16.100
el f5 momento debería apreciar la carpeta perfecto la carpeta no no voy a proceder

00:26:16.100 --> 00:26:26.620
entonces a hacer esto acá en mi máquina sería ch mod dfs menos m cadir es las axas

00:26:26.680 --> 00:26:32.960
minúsculas perdón aquí dfs hdfs

00:26:40.280 --> 00:26:47.880
y después le hago un ch mod con 777 ch mod 777

00:26:55.960 --> 00:27:01.560
listo perfecto entonces cuando termine de hacer esto le da f5 acá en el windows

00:27:03.020 --> 00:27:08.220
y debería aparecer entonces la carpeta que creo allá falta todavía alejando que es el

00:27:08.220 --> 00:27:14.460
último comando que hace falta y continuamos entonces te pongo el comando del sachet

00:27:14.460 --> 00:27:21.980
aquí te lo colocó alejando nuevamente la pantalla sería lo mismo pero cambia el m cadir por ch mod

00:27:21.980 --> 00:27:30.520
y le agrega el 777 bueno continuamos entonces ahora sí vamos a utilizar el talent big data

00:27:30.520 --> 00:27:32.780
váyase ahora sí a herramienta el talent big data

00:27:35.600 --> 00:27:39.380
cierre por favor los chocs que tenga por ahí que pronto le van a causar confusión

00:27:39.380 --> 00:27:51.620
y ahora voy a hacer lo siguiente entonces vamos a crear en la carpeta kiaxa vamos a

00:27:51.620 --> 00:27:59.120
crear una subcarpeta y esta voy a colocarla como jadut el talent big data entonces creamos

00:27:59.120 --> 00:28:07.340
una carpeta listo jadut talent big data sobre la carpeta jadut vamos a crear un job

00:28:09.920 --> 00:28:16.260
y lo vamos a llamar job on the record subir

00:28:17.800 --> 00:28:23.520
on the record archivo on the record jadut no voy a agregarle propósito de descripción

00:28:23.520 --> 00:28:27.300
porque me desgasta mucho entonces es como buena práctica ya tenerlo en cuenta pero

00:28:29.020 --> 00:28:34.280
por cuestión de tiempo nada vamos a colocarle job on the record subir on the record archivo

00:28:34.280 --> 00:28:37.960
on the record jadut le damos aquí finish para que nos cree listo en el dado finish

00:28:40.520 --> 00:28:45.100
bien hay diferentes formas de hacer esto voy a tratar de dar varias no puedo dar todas

00:28:45.100 --> 00:28:52.780
porque se me quedan después los los ejemplos vamos a buscar los siguientes componentes vamos

00:28:52.780 --> 00:29:02.440
a buscar un componente que se llama thdfs si usted quiere se va acá a la paleta va

00:29:02.440 --> 00:29:08.160
donde dice hdfs y va a encontrar los mismos componentes que voy a escribir yo acá como

00:29:08.160 --> 00:29:13.820
ustedes se hacerlo o los busca de este lado o los consulta acá ahí me gusta más buscarlo

00:29:13.820 --> 00:29:18.960
de este lado pero si usted quiere pues puede ser de varias formas vamos a buscar uno que

00:29:18.960 --> 00:29:31.760
se llama thdfs thdfs connection ese thdfs connection lo que hace es que hace una conexión

00:29:31.760 --> 00:29:41.520
a un sistema de ficheros hdfs hdfs connection vamos a agregar ahora lo siguiente vamos a agregar

00:29:42.060 --> 00:29:54.560
otro componente que se llama thdfs put aquí un tema esa voz que ya lo veíamos pero vamos

00:29:54.560 --> 00:29:58.440
a configurarlo cuando lo configuramos por si acaso hay algún error evidentemente el mesa

00:29:58.440 --> 00:30:04.840
vos carece de sentido porque tendría más sentido que mande un error ya sea un correo

00:30:04.840 --> 00:30:09.640
o a un sistema de issues que disidencia que maneje pero bueno para verlo aquí gráficamente

00:30:10.200 --> 00:30:20.540
vamos a agregar aquí un tmsg vos continuamos entonces ahora vamos a unir los diferentes

00:30:20.540 --> 00:30:26.640
componentes y después los configuramos entonces lo que hace este hdfs connection lo que va

00:30:26.640 --> 00:30:31.140
a hacer es conectarse a un sistema de ficheros después que me conecte voy a intentar subir

00:30:31.140 --> 00:30:35.620
un fichero para esto entonces voy ya como sería ya todos los componentes va a ser

00:30:35.620 --> 00:30:40.280
igual es cual la forma en que lo quiere conectar a mí me gusta más el componente

00:30:40.280 --> 00:30:51.980
clic derecho voy disparador y vamos a escoger un component ok y une el tema esa voz con

00:30:51.980 --> 00:30:59.100
el t-connection con un t o un component error disparador t o un component error

00:31:04.640 --> 00:31:11.040
procedamos entonces a configurar los diferentes componentes primero vamos a configurar el thdfs

00:31:11.800 --> 00:31:17.980
connection dele doble clic Beatriz tiene que seleccionar la mitad en toda la mitad

00:31:17.980 --> 00:31:22.780
del componente o sea de clic exactamente en el icono ahora si clic derecho disparador y ahí

00:31:22.780 --> 00:31:32.580
escoge un component error y ahora si lo conecta perfecto dele ahora después que termina y le

00:31:32.580 --> 00:31:37.640
da doble clic al thdfs connection para configurarlo recuerde para darle con para

00:31:37.640 --> 00:31:45.620
configurar siempre damos doble clic y vamos a configurar el componente listo cada configuración

00:31:45.620 --> 00:31:49.620
de los componentes en tal en es claro que varía dependiendo de lo que tú quieres hacer

00:31:49.620 --> 00:31:55.880
entonces ahí la configuración pues no es única para todos vamos entonces aquí nos pregunta

00:31:55.880 --> 00:32:02.440
el en la parte en la perspectiva de abajo nos pregunta la distribución resulta que hay

00:32:02.440 --> 00:32:07.880
diferentes distribuciones de jadut así como hay diferentes distribuciones de gene ulinus

00:32:08.820 --> 00:32:13.760
tofedora existen diferentes distribuciones para jadut entre esas las más importantes

00:32:13.760 --> 00:32:21.320
tenemos claudera y horton pero claudera compró a horton y dentro del esquema del señor

00:32:21.940 --> 00:32:29.380
aws tenemos a amazon emr como esta es una distribución particular no es una distribución

00:32:29.380 --> 00:32:34.520
ya de estos señores de ya sea de emr de horton vamos a hacer lo siguiente donde dice

00:32:34.520 --> 00:32:40.900
distribución dele clic por favor y va a escoger la que dice universal ahí aparece

00:32:40.900 --> 00:32:48.020
también la de ashur pero me interesa la que dice universal lo deja por favor en versión 3

00:32:49.160 --> 00:32:57.240
y note que automáticamente le define un esquema c hdfs listo vamos a configurar ahora el

00:32:57.240 --> 00:33:03.700
no el no es el no do maestro de una arquitectura de un clóster de jadut hay lo único que hay

00:33:03.700 --> 00:33:09.900
que hacer es cambiar la dirección ip donde se encuentra este clóster si ese clóster tú lo

00:33:10.160 --> 00:33:15.980
tienes a nivel de la nube ahí colocarás la url donde se encuentra ese clóster sea en ashur o

00:33:15.980 --> 00:33:21.160
sean aws o en horton el que tú quieras entonces voy a colocar aquí en grande algo muy particular

00:33:21.160 --> 00:33:26.840
porque esto viene de java entonces voy a colocar este señor aquí en uno para que entienda

00:33:26.840 --> 00:33:37.280
lo siguiente resulta en que la cuando vas a definir un texto en algún componente de

00:33:37.460 --> 00:33:43.040
talent la mayor parte de las veces nada te va a decir una sola vez en el cual no se aplica

00:33:43.040 --> 00:33:48.280
esto ahora te la digo cual en la mayor parte cuando es textual lo que vas a configurar tienes

00:33:48.280 --> 00:33:52.800
que meterlo entre comillas dobles porque entre comillas doble porque él al final transforma

00:33:52.800 --> 00:33:58.980
en java y java un string es comilla doble entonces de esto que está aquí vas a quitar

00:33:58.980 --> 00:34:06.740
la palabra localhost esta que está aquí y vas a colocar la dirección ip donde está el

00:34:06.740 --> 00:34:16.540
clóster que sería 10.0.3.16 te quedaría así como estoy mostrándolo aquí voy a quitar

00:34:16.540 --> 00:34:20.380
este señor de acá entonces perdón voy a copiarlo y lo voy a sobre escribir aquí

00:34:23.820 --> 00:34:26.980
sigo acá perfecto 316

00:34:29.020 --> 00:34:34.460
aquí vienen dos elementos que es la parte de autenticación la parte de autenticación

00:34:34.460 --> 00:34:40.320
hay unos sistemas autenticación tipo carveros que son muy buenos definen un token para en este

00:34:40.320 --> 00:34:45.700
caso de ese cuenta que yo cree la carpeta y le cree un chemos 777 de tal forma que

00:34:45.700 --> 00:34:50.400
tenga cualquiera permiso de acceder pero si tiene esta autenticación tendría que

00:34:50.400 --> 00:34:56.340
especificar las credenciales en la parte de abajo este no es el caso porque lo dejé abierto

00:34:56.340 --> 00:35:01.940
la configuración para que no pidiera ninguna credencial entonces carece de sentido la

00:35:01.940 --> 00:35:06.980
configuración que está ahí pero ahí colocaría lo de las credenciales correspondiente listo ahí

00:35:06.980 --> 00:35:12.060
no hay ningún problema ahí termina la configuración de la conexión ahí eso es lo que entabla es una

00:35:12.060 --> 00:35:18.480
conexión hacia el clóster vamos a configurar ahora el componente para subir ficheros dentro

00:35:18.480 --> 00:35:25.100
de lo que es el clóster date cuenta que ya yo me sé los componentes te los colocas y

00:35:26.060 --> 00:35:32.820
no sé es a mí me ha fusionado las dos prácticas una práctica que cuando tengo tiempo libre estudio

00:35:33.420 --> 00:35:38.700
digamos en detalle los componentes y me acuerdo de un componente y lo otro me da la práctica

00:35:38.700 --> 00:35:42.760
pero vuelvo repito a nivel de metodología carecía sentido en que yo me pusiera tres horas

00:35:42.760 --> 00:35:48.080
a describir componente por componente entonces voy directo los componentes mejor vayamos

00:35:48.080 --> 00:35:52.440
entonces al put que como su nombre dice pone un archivo en el sistema de ficheros

00:35:52.440 --> 00:35:54.300
vamos a darle doble clic

00:35:55.740 --> 00:36:00.520
y ahora aquí tú tienes una opción de volver a configurar la conexión pero como ya yo ya yo

00:36:00.520 --> 00:36:05.940
la configuré vamos a usar una conexión existente entonces notarás que aquí debajo

00:36:05.940 --> 00:36:11.580
del property type hay un chulito de una opción que dice usar conexión existente chuléala

00:36:11.580 --> 00:36:16.840
por favor es importante que es cojas en el combo voz de la lista de componentes dale

00:36:16.840 --> 00:36:22.060
clic ahí y te debería aparecer todas las conexiones existentes en el job que sería esta

00:36:23.200 --> 00:36:27.840
perfecto listo está dele doble clic a la conexión del hdfs putos no sé si le

00:36:28.420 --> 00:36:34.800
hay ya de que me dijo veatriz puede ver que no me habló brenda a brenda que pena no me

00:36:34.800 --> 00:36:41.100
conozco hoy a las dos a un momento dele doble clic está en la si se da cuenta

00:36:41.840 --> 00:36:47.720
está donde dice hdfs con está en el componente hdfs conécteo tiene que ir la configuración

00:36:47.720 --> 00:36:54.080
del componente hdfs está bien está bien a mi pantalla si mira mi pantalla un momento

00:36:54.080 --> 00:36:59.300
note que cuando yo doy doble clic aquí en la parte de arriba me aparece en que componente

00:36:59.300 --> 00:37:05.040
estoy dele doble clic aquí al hdfs puto para cambiar la configuración doble clic en el centro

00:37:05.620 --> 00:37:12.160
y ese cuenta que está y le parece ahí usar conexión existente o el property type listo ahí

00:37:12.160 --> 00:37:18.360
aparecer entonces hay escuas y están amables component list ahí dele clic ahí hdfs conexión

00:37:18.360 --> 00:37:29.040
perfecto listo permítame comprobó aquí algo de permítame comprobó algo aquí del sistema

00:37:29.040 --> 00:37:39.960
de ficheros momento para que sea más fácil hagamos lo siguiente pero no tenía que escribir

00:37:41.340 --> 00:37:53.440
vayas a la carpeta de recursos que está en el escritorio recursos en tbd data sets ccv

00:37:54.080 --> 00:37:56.760
escoa todos los archivos que están ahí menos el genre

00:38:04.560 --> 00:38:07.940
copie pegue en temporal aquí en esta carpeta ten

00:38:11.820 --> 00:38:18.760
esos tres que están ahí en re está en escritorio recursos los todos se sube data set ccv

00:38:20.120 --> 00:38:27.320
se sube y escoja todos menos el genre y los coloca en la carpeta tengo que yo creo que

00:38:27.320 --> 00:38:32.720
esto me funcionaba bueno para que hice eso bueno al final ya sé para qué lo hice

00:38:34.970 --> 00:38:40.410
bueno aquí el local director y darey por favor aquí en el en los botones que están

00:38:40.410 --> 00:38:46.670
acá el último botón que aparece para los tres puntitos para escoger una carpeta escoja la

00:38:48.050 --> 00:38:56.030
carpeta ten seleccionar carpeta quería demostrar algo pero al final creo que no no era necesario

00:38:56.030 --> 00:39:03.710
lo muestro ahora ten una cosa particular y esto ya va en ese caso de ese cuenta que la

00:39:03.710 --> 00:39:09.650
ubicación está de esta forma c2 punto es la ten el separador es a veces me pierdo si

00:39:09.650 --> 00:39:14.050
este es la inverso en las buenas entonces creo que es inverso no sé en caso este

00:39:14.990 --> 00:39:22.370
el separador típico de linux o de sistemas unix de unix y linux pero entonces en windows

00:39:22.370 --> 00:39:29.050
normalmente recuerde que windows lo tiene de esta manera c2 puntos así perdón se me así

00:39:29.690 --> 00:39:36.330
sería en windows en este caso en particular cuando es las de esa forma ahí le marcaría

00:39:36.330 --> 00:39:40.890
un error porque para yaba cuando ese es la esta forma hay que colocarlo doble porque

00:39:40.890 --> 00:39:51.970
este carácter de el carácter especial de yaba entonces las dos formas si es

00:39:52.430 --> 00:39:59.010
tiene que ser dos porque si no sale un error de compilación bueno continúo entonces váyase

00:39:59.010 --> 00:40:08.030
ahora al hdfs directory dele clic ahí en los tres puntos y debería conectarse vamos a ver

00:40:08.030 --> 00:40:12.470
aquí me pide que me instale unos componentes esperamos que no haya ningún tipo de error

00:40:14.210 --> 00:40:15.990
acepto listo lo y finis

00:40:18.350 --> 00:40:23.710
va a intentar conectarse y debería mostrarme el sistema de fichero que tengo en la máquina

00:40:23.710 --> 00:40:29.790
virtual que es con hadut en este caso lo voy a mandar a axa escoja entonces el folder de

00:40:29.790 --> 00:40:38.230
axa aquí ok perfecto escoja axa ahí está en axa es que coger axa y debería aparecer acá

00:40:39.370 --> 00:40:45.810
espera un momento que algunos le termine de configurar algunos componentes dele clic

00:40:45.810 --> 00:40:53.050
veatriz en su caso bajar a instalar el download a incisal abajo el de abajo el de abajo ese que

00:40:53.050 --> 00:40:58.410
está ahí dale acepte todo por favor y ahí escoja por favor si están amable axa exactamente

00:40:58.410 --> 00:41:03.990
ok continuamos entonces ahora he definido la carpeta de entrada y la carpeta de salida

00:41:07.450 --> 00:41:13.670
ahora por favor vamos a agregar los archivos que quiero subir en la parte de abajo dele por favor

00:41:13.670 --> 00:41:19.950
si están amable en el más y vamos a subir los siguientes archivos vamos a subir el archivo que

00:41:19.950 --> 00:41:27.830
se llama producción pero antiguo que se me escapó el nombre se llama production.csv esta

00:41:27.830 --> 00:41:39.230
en inglés production production.csv y te pregunta ese el de entrada cómo quiere

00:41:39.230 --> 00:41:43.310
llamarlo en el de salida en este caso en particular pues puede llamarlo exactamente igual

00:41:48.870 --> 00:41:55.950
listo voy a agregar otro archivito aquí que sería el que se llama fill actor fill

00:41:58.890 --> 00:42:04.950
recuerde que en el caso particular de windows no hay problema no es sencilla los nombres de

00:42:04.950 --> 00:42:14.790
archivos pero en el caso del señor linux y unis hizo sensibles fill actor.csv

00:42:17.170 --> 00:42:25.130
y voy a hacerlo exactamente acá y el último sería super market on the record sales

00:42:29.510 --> 00:42:39.390
hubiera sido mejor copiar el nombre del fichero verdad super market on the record sales.csv

00:42:42.250 --> 00:42:46.830
te quedaría la configuración de esa manera revisa por favor que los nombres coincidan

00:42:46.830 --> 00:42:53.890
exactamente porque si no va a salir un error entonces al ejecutar perfecto termina entonces

00:42:53.890 --> 00:42:58.510
de configurar el tema es a vos entonces te pregunta el título que quieres que aparezca

00:42:58.510 --> 00:43:06.210
en la casilla de texto voy a colocar aquí error error hadut como título el título tiene que

00:43:06.210 --> 00:43:10.870
estar entre comillas doble porque va a ser un stream encierra entre comillas doble porque

00:43:10.870 --> 00:43:14.970
si no encierra sale un error entonces entre comillas doble es el mensaje voy a decir error

00:43:14.970 --> 00:43:20.530
de conexión al cluster hadut

00:43:23.110 --> 00:43:29.950
vamos a proceder a ejecutar dese cuenta que acá en este run de acá aparezca el nombre del job

00:43:29.950 --> 00:43:35.930
voy a ejecutarlo de forma diferente me voy acá a la pestaña de la perspectiva de acá abajo

00:43:35.930 --> 00:43:41.690
de run y aquí me aparece un botón que se llama run verifica que el nombre del job coincida

00:43:41.690 --> 00:43:45.450
con el nombre del que quieres ejecutar vamos a darle aquí run

00:43:49.830 --> 00:43:56.390
ahí lo que está haciendo es que genera el código java para poder ejecutar listo empieza

00:43:56.390 --> 00:44:02.190
la ejecución para algunos y termina sin ningún tipo error para confirmar que todo

00:44:02.190 --> 00:44:07.490
esté bien se van al browser entran a la carpeta axa y deberían estar los archivos

00:44:07.490 --> 00:44:12.770
migrados al sistema de ficheros entre la carpeta axa entonces de aquí puedes migrar lo que tú

00:44:12.770 --> 00:44:17.310
quieras como hablamos de variedad aquí estamos hablando de almacenamiento tú podrías mandar

00:44:17.310 --> 00:44:24.650
una imagen un audio al sistema de ficheros ya automáticamente el maestro se encarga de tomar

00:44:24.650 --> 00:44:28.970
el archivo y dividirlo en varias partes noté por ejemplo que ahí tengo una replicación de

00:44:28.970 --> 00:44:34.710
3 y tengo un tamaño de bloque de 128 en pocas palabras el archivo se divide en bloques

00:44:34.710 --> 00:44:40.650
128 y se reparten los diferentes nodos como solamente hay un solo nodo pues ahí no hay

00:44:40.650 --> 00:44:46.930
problema replicaciones que ese archivo se guarda tres veces por si acaso hay algún error perdón

00:44:46.930 --> 00:44:51.770
el bloque de se guarda tres veces por si acaso hay un bloque que causa errores no se pueda

00:44:51.770 --> 00:44:56.210
recuperar en un momento determinado perfecto listo lo sé si acudo es el error no sé si

00:44:56.210 --> 00:45:00.250
si funcionó vamos a esperar para ver creo que a todos me parece que ya le funcionó voy

00:45:00.250 --> 00:45:03.170
el caso suyo fernanda que tiene un error allá voy a ver para ver pero

00:45:05.090 --> 00:45:11.970
ah listo pasa lo siguiente fernanda se me escapó esto todos acá que lo entiendo que

00:45:11.970 --> 00:45:18.630
dice fernanda aquí en el put yo coloqué en el put noté cuenta que yo creo que el

00:45:18.630 --> 00:45:24.510
action file en create significa que si yo vuelvo a ejecutar este job si lo vuelvo a

00:45:24.510 --> 00:45:29.870
ejecutar este yo voy a tener un error porque va a intentar crear un archivo que ya está allá

00:45:32.370 --> 00:45:38.850
entonces qué me tocaría hacer ahí aquí sale está el error que me tocaría hacer aquí si

00:45:38.850 --> 00:45:43.190
hay algunos archivos que voy a sobre escribir lo mejor entonces es cambiar el create por

00:45:43.190 --> 00:45:48.170
overwrite y ahí los que están ahí los sobre escribe y los nuevos pues los copiará en el

00:45:48.170 --> 00:45:53.170
caso suyo fernanda por favor cámbiale a action file y esto lo que haría sería que

00:45:54.550 --> 00:45:59.850
volvería a ejecutar sobre escribiría los archivos y los que sean nuevos lo volvería a crear

00:46:00.930 --> 00:46:06.130
voy a su voy a su equipo para ver si error tiene ahora sí revisa por favor su carpeta

00:46:07.470 --> 00:46:10.930
si está amable el f5 ahí ahí está perfecto ahí está

00:46:13.430 --> 00:46:21.090
listo perfecto vamos entonces a lo siguiente ahora vamos a crear aquí un nuevo yo crear yo

00:46:22.850 --> 00:46:27.770
y este yo que lo voy a llamar entonces yo leer

00:46:31.270 --> 00:46:34.810
archivo jaud listo leer archivo jaud finish

00:46:38.750 --> 00:46:43.970
ahora tengo un pequeño si nota un poco la forma de este yo

00:46:46.350 --> 00:46:52.590
este yo me queda poco flexible porque porque la conexión está dependiendo netamente de esta

00:46:53.410 --> 00:47:02.150
si la url me cambia entonces me tocaría entrar al yo cambiar la url y bueno y ejecutar entonces

00:47:02.670 --> 00:47:07.970
entonces para eso es que existen las variables de entorno para flexibilizar entonces la

00:47:07.970 --> 00:47:13.210
configuración de los yo así mismo como estemos al desarrollo entonces para esto vamos ahora a

00:47:13.210 --> 00:47:19.910
ver a en el repositorio vamos al menú de contextos por favor context ahí está context

00:47:19.910 --> 00:47:27.910
debajito de yo design debajito del yo design context seleccionamos aquí vamos a darle clic

00:47:27.910 --> 00:47:33.250
derecho y voy a decir que voy a crear un grupo de contexto aquí que está aquí y lo voy a

00:47:33.250 --> 00:47:41.590
llamar axa se lo coloqué con a mayúscula vamos a darle aquí entonces next y aquí le

00:47:41.590 --> 00:47:48.450
coloca los ambientes que vaya a trabajar usted para confiar los ambientes notará que

00:47:48.450 --> 00:47:54.670
aquí está un table en la parte superior del table horizontal aquí la parte derecha hay un

00:47:54.670 --> 00:47:59.350
más ese más que está ahí le va a permitir configurar los diferentes ambientes entonces

00:47:59.350 --> 00:48:05.790
vale aquí clic vamos a generar un nuevo ambiente este lo voy a llamar producción

00:48:07.390 --> 00:48:08.110
ok

00:48:09.790 --> 00:48:18.010
y el default lo selecciono y lo voy a editar ahora edit y lo voy a llamar cua

00:48:20.050 --> 00:48:27.950
ok y escogemos por defecto que el entorno por defecto va a ser cua es el que está ahí definido

00:48:27.950 --> 00:48:35.010
pero tú puedes cambiar la producción en este caso sería cua vamos a darle aquí ok listo

00:48:37.470 --> 00:48:43.810
vamos a crear entonces ahora una nueva variable les espero algunos que todavía están listo

00:48:43.810 --> 00:48:51.330
ahora vamos al más que está acá bajito este más de acá abajo me permite crear y el de aquí que

00:48:51.330 --> 00:48:58.570
está la mitad vamos a darle aquí un más ese que está aquí y me pregunta entonces ahora

00:48:58.570 --> 00:49:03.610
lo siguiente el nombre de la variable entorno que quiero manejar en este caso le voy a llamar

00:49:03.670 --> 00:49:10.750
entonces url on the record cluster on the record hadith

00:49:16.070 --> 00:49:20.150
me pregunta el tipo de datos y los tipos de datos que van a aparecer son específicamente

00:49:20.150 --> 00:49:26.490
de java no cambio porque me interesa que sea string el tipo de datos me pregunta si

00:49:26.490 --> 00:49:31.910
quiero un comentario y me pregunta ahora para que especifice los valores para cua y para

00:49:31.910 --> 00:49:35.510
entonces para no tener que copiar eso vamos a darle aquí un momento finish

00:49:37.430 --> 00:49:46.150
se va al job que se llama subir archivo hadith y vamos a copiar la url que está ahí la del

00:49:46.950 --> 00:49:54.630
hdfs cópies eso que está aquí por favor copiar va nuevamente a la variable del grupo de

00:49:54.910 --> 00:50:03.670
esto que creo él le va a decir que va a editarlo editar next y va a pegar ese valor debajo del

00:50:03.670 --> 00:50:09.690
valor de cua y por favor aquí hay algo particular que aunque esto sea string en

00:50:09.690 --> 00:50:15.230
esta parte específica no requiere comillas doble y si la colocas a un error porque

00:50:15.230 --> 00:50:19.870
está así no sé pero está así entonces quitéle las comillas doble al fin al inicio y al

00:50:19.870 --> 00:50:24.510
final listo y si desea copia eso y lo coloca en producción es claro entonces en

00:50:24.510 --> 00:50:28.310
producción es claro que en producción vas a colocar un IP diferente pero como no tengo

00:50:28.310 --> 00:50:32.590
un cluster adicional pues voy a dejar la misma dirección para hacer la prueba cambie

00:50:33.190 --> 00:50:37.310
para hacer una prueba que se me ocurrió ahora cambie la dirección 16 por 17 por favor si

00:50:37.310 --> 00:50:42.590
están amables 16 por 17 a ver si sale si mando un error ahora 16 por 17 y le da finish

00:50:45.810 --> 00:50:46.250
ok

00:50:48.650 --> 00:50:54.310
me voy a ubicar entonces en el en el job a este viejo que tengo aquí voy a concentrarme

00:50:54.310 --> 00:50:59.550
en el de leer archivos a dos listo voy a hacer entonces de forma diferente voy a

00:50:59.550 --> 00:51:10.570
crear aquí ahora voy a agregar un archivo que se llama thdfs input de fs input el put es

00:51:10.570 --> 00:51:18.030
para agregar y el input es para leer thdfs recordará que la conexión en el pasado la

00:51:18.030 --> 00:51:24.930
hice en el thdfs connection esta la voy a hacer directamente en el componente como voy a hacer

00:51:26.050 --> 00:51:35.230
aquí primero voy a coger como distribución universal y ahora deseo usar la variable de

00:51:35.230 --> 00:51:42.670
contexto que tengo como se hace aquí cuando note lo siguiente que aquí tengo un contexto

00:51:42.670 --> 00:51:48.310
en el repositorio y tengo un contexto a nivel del job en él en la perspectiva que está abajo

00:51:48.910 --> 00:51:54.670
entonces el tale maneja dos tipos de contexto un contexto a nivel del proyecto que esa puede

00:51:54.670 --> 00:52:01.170
ser compartido con diferentes job o poder con textos muy particulares de cada job si tú sabes

00:52:01.170 --> 00:52:05.370
que los contextos lo vas a utilizar en diferentes elementos de los job lo mejor es

00:52:05.370 --> 00:52:10.750
que lo haga de tipo project o sea de este lado si es una variable que es muy particular

00:52:10.750 --> 00:52:16.830
del job la puedes crear en los contextos de estos que están acá entonces pasa lo siguiente

00:52:16.830 --> 00:52:24.130
en esta perspectiva situate en context por favor aquí lo que dice context al

00:52:24.130 --> 00:52:29.670
ladito casi el del componente y qué vamos a hacer vamos a importar los contextos que

00:52:29.670 --> 00:52:35.090
tenemos a nivel del proyecto lo tengo que importar al job para eso aquí a donde están

00:52:35.090 --> 00:52:40.410
los botones de acá abajo que hay un más un x aparece con una pequeña limita con un

00:52:41.330 --> 00:52:46.330
y ahí te debe aparecer todos los contextos que están a nivel de proyecto nada más hay uno

00:52:46.330 --> 00:52:53.510
porque fue el que creamos entonces voy aquí cojo ese señor ok selecciono todas las variables

00:52:53.510 --> 00:53:02.150
de los entornos y le doy ok y me hace el import para que pueda usar esa variable dentro

00:53:02.150 --> 00:53:05.810
de este elemento que está acá perdón alguien me habló pero no sé si la si fue que no lo

00:53:05.810 --> 00:53:09.530
escuché bien a ver si me puede hablar un poquito más duro que no sé por qué perdí

00:53:09.530 --> 00:53:16.090
no lo escucho muy bien no sé si le escuché por muy bajito que soy yo no usted soy yo

00:53:21.030 --> 00:53:24.890
si alguien me puede de pronto alguien puede repetir la pregunta que la escuché muy

00:53:24.890 --> 00:53:27.050
bajo verdad no sé si alguien no

00:53:30.410 --> 00:53:39.050
lo que pasa es que aquí listo si no la tiene ahí ya estoy viendo sí entonces voy a

00:53:39.050 --> 00:53:47.250
ver lo siguiente se le perdió la configuración y esa pesaña donde está ahora hoy entonces aquí

00:53:47.850 --> 00:53:56.650
estoy en su máquina ok ventana aquí hay un show y voy a buscar aquí contexto le doy doble clic

00:53:58.310 --> 00:54:04.630
aquí está ahora sí es que como que de pronto la cerró aquí y cuando hay una ventana que

00:54:04.630 --> 00:54:08.930
se me pierde entonces tengo que ir acá show y busco la ventana en particular que la

00:54:08.930 --> 00:54:14.530
de contexto y ya es la hora ahora sí sí ya entendí ahora haga el import que sería en la

00:54:16.230 --> 00:54:21.190
desde clic aquí en este botoncito el que está al ladito del más aquí por aquí hay

00:54:21.190 --> 00:54:29.930
un botoncito ese que está ahí para que importe el perfecto listo entonces ahora

00:54:29.930 --> 00:54:37.270
vamos entonces a la configuración del hsb input borre ahora todo lo que está en el

00:54:38.350 --> 00:54:50.870
eso que está ahí y va a colocar la palabra con le da control espacio control espacio y ahí le

00:54:50.870 --> 00:54:55.790
va a aparecer todas las variables de contexto que están definidas en ese yo entonces la

00:54:55.790 --> 00:55:00.630
variable de contexto que me interesa es la que dice context punto urel cluster y la pego ahí

00:55:00.630 --> 00:55:05.810
cuál es la ventada de usar variable de contextos en que ahora si hay un cambio nada más hago en

00:55:05.810 --> 00:55:11.510
la variable de contexto y automáticamente afecta la dependencia de esas variables es lo que

00:55:11.510 --> 00:55:19.710
mencioné alguna vez que es reutilizar veatriz voy a su venta en un momento que ahí está sí ok

00:55:19.710 --> 00:55:28.570
de ley veatriz estoy su venta ok ok seleccione ahí chulé ahí listo ok perfecto vamos a

00:55:28.570 --> 00:55:34.050
configurar ahora el componente t hd fe input dele doble clic es el componente t de exactamente

00:55:34.050 --> 00:55:43.650
se ubica donde tiene no urión está hd fs localhost y borra todo lo que tenga el borra todo eso

00:55:45.510 --> 00:55:51.290
ahora escribe con el edad control espacio con cebo en

00:55:54.210 --> 00:56:03.730
faltó la c la c o n control espacio ahora y ahí le aparece en toda la

00:56:05.110 --> 00:56:12.770
escuela por favor perfecto entonces como venía diciendo la ventada de la variable de contexto

00:56:12.770 --> 00:56:20.210
es que si hay un cambio en la url nada más lo haría en la variable de contexto y automáticamente

00:56:20.210 --> 00:56:26.730
afectaría a todos los yo que dependan de esa variable entonces ahí flexibilizo más mi código

00:56:28.450 --> 00:56:35.270
listo ahora voy a proceder entonces sí dígame a listo perfecto buena pregunta porque cuando usted

00:56:35.270 --> 00:56:40.810
vaya aquí en el rum cuando usted lo vaya a ejecutar en el rum aquí tengo las opciones

00:56:40.810 --> 00:56:50.450
que son cua y producción listo entonces tú escoge ahora en un sistema en el caso de ustedes

00:56:51.150 --> 00:56:56.290
las ejecuciones no se van a hacer directamente en la máquina sino ustedes van a tener un

00:56:56.290 --> 00:57:01.970
sistema que se llama el tmc el manas console que tú subes el job a ese manas console y

00:57:01.970 --> 00:57:06.690
te lo ejecuta allá arriba en el clóster o donde tenga montado el tmc pero lo que si es seguro

00:57:06.690 --> 00:57:14.690
que la confesión la toma de aquí cuando tú especifica esta parte acá listo sigamos entonces

00:57:16.950 --> 00:57:25.230
ahora resulta pasa ya acontece en que lo que va a intentar hacer este yo es leer este

00:57:25.230 --> 00:57:31.110
archivo pero este archivo está estructurado por lo tanto necesito definir la estructura del

00:57:31.110 --> 00:57:37.130
archivo en pocas palabras voy a leer en este caso en particular voy a leer este filáctor que

00:57:37.130 --> 00:57:45.050
está aquí este filáctor voy a mostrarlo aquí directamente aquí este señor que tengo que

00:57:45.050 --> 00:57:50.270
definir la estructura de este filáctor por ejemplo que hay una columna aquí que el

00:57:50.270 --> 00:57:54.790
nombre coincida va y venga pero sé que tengo que especificar una columna las columnas que

00:57:54.790 --> 00:58:01.050
acá lo más posible sería que sea el mismo nombre entonces una forma de hacerlo de hacer

00:58:01.050 --> 00:58:11.230
esta parte sería lo siguiente sería lo siguiente aquí vaya la confesión del hdf input que está

00:58:11.230 --> 00:58:19.370
aquí y aquellos componentes de talen que de una u otra forma tienen que tener una estructura

00:58:19.370 --> 00:58:25.750
para poderlo leer como el caso un ccv un jason una tabla van a encontrar quizás en

00:58:25.750 --> 00:58:30.370
diferente ubicación pero siempre vas a encontrar una opción que dice editar esquema

00:58:31.730 --> 00:58:39.170
si tú le das aquí clic aquí entonces tú puedes definir el esquema que coincida con el

00:58:39.170 --> 00:58:45.830
archivo que tú vas a leer aclaro si le hacemos manual esto es muy engorroso te voy

00:58:45.830 --> 00:58:52.370
a decir cuál es la mejor forma la mejor forma es que si aunque el archivo sea muy grande lo

00:58:52.370 --> 00:58:58.070
que tú vas a hacer es que vas a tomar solamente la estructura las dos primeras filas la fila de

00:58:58.070 --> 00:59:02.250
arriba y la fila de abajo o sea la primera y la segunda aquí como este archivo es muy

00:59:02.250 --> 00:59:07.210
pequeño en realidad puedo hacerlo directamente pero te aconsejaría entonces que tengas

00:59:07.210 --> 00:59:12.470
una copia a nivel local de la estructura del archivo y hagan lo siguiente crees una

00:59:12.470 --> 00:59:20.410
metadata de ese archivo como sería el cuento como el archivo es ccv los archivos ccv se dotan

00:59:20.410 --> 00:59:25.530
como archivos delimitados entonces voy aquí al delimite voy a darle clic derecho y voy

00:59:25.530 --> 00:59:31.030
a crear una conexión hacia ese archivo de los metadatos que tiene entonces lo voy a llamar

00:59:32.830 --> 00:59:40.870
on the record actor se va a file delimited clic derecho crear file delimite le da

00:59:40.870 --> 00:59:47.410
entonces next ubica el archivo porque usted va a tener una copia muy pequeña para la estructura

00:59:47.410 --> 00:59:57.770
en este caso vayas en la carpeta ten que es tenerlo ahí escoge fila aquí puede visualizar

00:59:57.770 --> 01:00:03.070
cuál sería el carácter de separación que tiene y note algo particular que aquí ahora sí

01:00:03.070 --> 01:00:08.450
le está apareciendo unos símbolos especiales eso porque el sistema de codificación no lo

01:00:08.450 --> 01:00:11.530
ve yo de forma correcta vamos a darle aquí un next

01:00:16.950 --> 01:00:20.490
aquí me lo está leyendo pero tiene encabezado me interesa voy a decirles

01:00:20.490 --> 01:00:26.730
que encabezado y voy a cambiar no sé cuál en qué idioma está voy a cambiar a windows voy

01:00:26.730 --> 01:00:36.050
a crear aquí a windows 12 52 saber si el problema era si el problema era de codificación pero

01:00:36.670 --> 01:00:42.350
esto no tiene nada que ver aquí la codificación por qué porque al final le interesaría es para

01:00:42.350 --> 01:00:45.830
los nombres de columna recuerde que es lo que va a guardar los metadatas no guarda los datos

01:00:45.830 --> 01:00:51.670
del archivo pero aquí me sirvió el ejemplo para para ver para que entendiera este sistema

01:00:51.670 --> 01:00:56.690
de codificación acá listo entonces vamos a darle aquí next

01:01:00.590 --> 01:01:06.870
perfecto vamos a darle aquí finish y ahora se sitúa en el archivo delimitado

01:01:06.870 --> 01:01:11.630
mira lo que va a ser ahora va a archivo delimitado y aquí una opción que dice

01:01:11.630 --> 01:01:17.030
metadata le expande el árbol el archivo delimitado que se llama filácto le da click

01:01:17.030 --> 01:01:26.310
derecho editar esquema y aquí hay un botoncito que dice que es el penúltimo

01:01:26.690 --> 01:01:33.650
que dice exportar en un xml el metadata o sea el penúltimo el penúltimo le da click

01:01:35.710 --> 01:01:39.770
importante entonces coge la ubicación vamos a dejarlo ahí en temporal y lo voy a llamar

01:01:39.770 --> 01:01:46.030
entonces fil actor y muy importante que le agregué el punto xml porque después no lo

01:01:46.030 --> 01:01:56.070
lee bien fil actor punto xml punto xml guardar y listo ahí le da finish ahí ya después

01:01:56.070 --> 01:02:02.790
que tiene la metadata entonces se va al input nuevamente hf input se va el esquema

01:02:02.790 --> 01:02:09.850
del input y aparece un botón de penúltimo casualmente para importar ahí le va a dar

01:02:09.850 --> 01:02:20.990
click y va a buscar su listo es quién me habló a ese Brenda Brenda Brenda Brenda

01:02:22.930 --> 01:02:28.130
Brenda ahí en el componente en la parte de abajo suba un momento suba un poquito más

01:02:28.130 --> 01:02:35.710
suba y listo dele editar esquema y dele click en editar esquema a la parte de arriba

01:02:35.710 --> 01:02:40.530
abajito ahí donde dice property type ya veo property type abajo y esquema y ahí

01:02:40.530 --> 01:02:47.150
ahí lo tiene ahí lo tenía ese de aquí no sé si alcanzaba mi mouse dele click un momento

01:02:48.390 --> 01:02:54.630
escoja el penúltimo botón busque el sería fil actor dele abrir dele ok

01:02:56.470 --> 01:03:02.050
haga por favor una corrección ahí en el net no uri la o está hdfs local borre por

01:03:02.050 --> 01:03:10.710
favor esa línea toda la línea borre la toda que quede en blanco escriba con con control

01:03:10.710 --> 01:03:15.370
espacio de aleora control espacio y escoja ahí la variedad de contexto que ya definió

01:03:15.370 --> 01:03:21.810
que se llama url en la primerita url closer perfecto listo que se bien vamos entonces

01:03:21.810 --> 01:03:27.250
como el lo que buscamos era leer entonces vamos a hacer lo siguiente vamos a colocar

01:03:27.250 --> 01:03:33.010
aquí un telor row para que me muestre aquí internamente los datos telor row

01:03:34.670 --> 01:03:43.250
y conecte el hdf input a este telor row quieren para variar vamos a configurar

01:03:43.250 --> 01:03:48.510
telor un poco diferente vaya aquí al telor row aquí hay varias formas en que le va a

01:03:48.510 --> 01:03:51.930
mostrar dígale que le muestre los datos en tipo table no básico table

01:03:55.730 --> 01:04:00.050
doble clic en el telor row y cambie el modo que estaba en básico a table hay tres

01:04:00.690 --> 01:04:07.270
modos básico table y vertical entonces eso puede jugar después es para teníamos tiempo

01:04:07.270 --> 01:04:12.890
a veces para ir a cada uno con identidad a configuración ejecutamos aquí y debería

01:04:12.890 --> 01:04:20.950
entonces listar perdón aquí me ejecutó pues subir archivo entonces voy a cerrar este señor

01:04:21.930 --> 01:04:31.770
aquí salmar y voy a verlo abrir que es el leer aquí está voy a ejecutar aquí

01:04:37.470 --> 01:04:44.270
error aliso ya que pena se me escapó algo sirvió el error tengo un error de ejecución este error

01:04:44.270 --> 01:04:50.290
de ejecución que está aquí seguramente pasó con lo siguiente el archivo que subimos hay

01:04:50.290 --> 01:04:57.170
una particularidad que el archivo que subimos tiene está separado por punto y coma y este

01:04:57.170 --> 01:05:03.870
archivo en particular en punto y coma y tiene un encabezado se nos olvidó confiar esa parte

01:05:03.870 --> 01:05:09.170
entonces vamos aquí nuevamente al vamos al hf input

01:05:14.170 --> 01:05:21.610
y me pregunta el nombre del archivo que pena se me olvidó confiar es confiar esta parte

01:05:21.610 --> 01:05:26.250
nombre del archivo entonces vaya aquí al que vamos a leer que no lo habíamos especificado

01:05:26.250 --> 01:05:31.770
esta parte dele clic aquí y escoja entonces que se llama filácton

01:05:34.070 --> 01:05:40.030
el tipo de archivo es text file ya explico esta parte de sequestras adelante el separador

01:05:40.030 --> 01:05:45.690
es punto y coma y como tiene un hider me toca colocarle aquí un uno diciéndole que tiene

01:05:46.890 --> 01:05:51.310
encabezado fernanda bueno dale al bajar a instalar ahí por favor dale ahí bajar a

01:05:51.310 --> 01:05:57.550
instalar dale a aceptar todo no no dale que no botón aceptar todo ese que está ahí

01:05:58.830 --> 01:06:05.870
dale nuevamente ahí bueno ahí escoge expanda y axa y escoge filácton ok

01:06:07.490 --> 01:06:12.550
bien el tipo de archivos es text file está bien en separador de filas ya lo viste está

01:06:12.550 --> 01:06:19.130
bien el separador de campo es ssv es punto y coma y como tiene un hider tienes que colocarle

01:06:19.130 --> 01:06:25.890
que elegir está en la posición número uno o sea que no lo va a leer perfecto vamos entonces

01:06:25.890 --> 01:06:45.310
a ejecutar ahora aquí a ver qué pasa voy a ver un momento bueno a ver si termina de cargar

01:06:45.310 --> 01:06:49.470
voy a revisar un momentico a fernanda que lo volviste a ejecutar salió error vamos a ver

01:06:50.870 --> 01:06:55.070
mientras de pronto se bloqueó dele cancelar y vuelve a ejecutar nuevamente prenda a ver listo

01:06:56.830 --> 01:07:02.270
pax vamos a ver qué pasó esto no había configurado el pack fernanda me pareció que

01:07:02.270 --> 01:07:07.170
tuviera configurado el pack ya no me pareció a mí permite lo vuelvo a ejecutar aquí aquí

01:07:07.170 --> 01:07:12.470
aclaro que todavía no he hecho progresamiento de data estoy simplemente es haciendo ejemplos

01:07:12.470 --> 01:07:18.750
para subir archivos hacia adu todavía big data no ha hecho todavía ya explico no sé qué pasó

01:07:19.370 --> 01:07:26.850
aquí hay algo en particular a que está aquí a fernanda aquí parece que estuviese ejecutando

01:07:26.850 --> 01:07:32.270
el primer yo que teníamos antes fernanda lo que pasa es que cogimos escogiste el archivo

01:07:32.280 --> 01:07:37.880
diferente el archivo que mapea es filácton no es chema

01:07:40.460 --> 01:07:46.320
pero esperate un momento creo que cogiste es de acá esta meta data creo que mapeaste

01:07:46.320 --> 01:07:49.120
fueste vamos a mapear este señor editar esquema

01:07:58.460 --> 01:08:04.880
vamos a ver vamos nuevamente a leer este archivo aquí editar next y aquí se te

01:08:04.880 --> 01:08:10.060
escapó colocar que tiene encabezado si tú no le colocas encabezado por defecto él va a

01:08:10.060 --> 01:08:14.900
colocar cada columna con estos nombres que están aquí entonces voy a hacerle este señor

01:08:15.760 --> 01:08:20.960
para que tome el encabezado y haz de cuenta que ahora va a tomar estos elementos de

01:08:20.960 --> 01:08:44.880
encabezado y es ok vamos a ver esta herramienta a veces si me cambió el esquema ahora no

01:08:45.620 --> 01:08:54.480
voy a intentar leerlo nuevamente filácton next aquí he leído que tengo encabezado bueno ahora

01:08:55.300 --> 01:09:01.000
sí creo que aquí directamente lo puedo exportar que es este que está aquí y doy clic y lo

01:09:01.000 --> 01:09:06.320
puedo despertar voy a sobre escribir este archivo filácton cuál fue el error que

01:09:08.140 --> 01:09:13.680
tomaste es importante importaste en el esquema este importaste fue otro archivo que es el

01:09:13.680 --> 01:09:23.540
y no era ese entonces voy ahora sí a importar filácton ok y es y voy a intentar leer aquí

01:09:25.220 --> 01:09:30.020
nuevamente efecto el problema era que habías importado un esquema diferente y por eso había

01:09:30.020 --> 01:09:36.260
un error el caso tuyo brenda voy a ver para ver por qué no te que te pasa ahí se bloqueó

01:09:36.260 --> 01:09:50.960
fue bueno momento momento momento creo que hay un problema en la conexión está intentando conectarse

01:09:53.140 --> 01:10:00.260
al conectarse al al hadut y parece que no está consiguiendo la conexión asumo que

01:10:00.260 --> 01:10:05.640
puede haber un error en la en la dirección entonces espérate un momento y voy a bajar

01:10:05.640 --> 01:10:12.960
este señor y voy a volver a subir entonces los temas por favor me esperan un momento

01:10:12.960 --> 01:10:17.320
no te que esté un poco más complicado porque acá hay que acasar de más errores

01:10:24.120 --> 01:10:28.440
bueno como diciendo todavía no estamos no hemos usado big data hemos

01:10:28.440 --> 01:10:33.120
algunas funciones de componentes pero ahí no está siendo big data todavía

01:10:33.880 --> 01:10:40.180
no está siendo ni mac review ni spark entonces ahí lo que está haciendo simplemente es

01:10:40.180 --> 01:10:45.140
almacenamiento sobre hdfs todavía no hemos usado mac reviews pero voy a verificar la

01:10:45.140 --> 01:10:49.840
variable de contexto un momento a ver si está apuntando bien brenda a ver ok aquí

01:10:51.520 --> 01:10:52.760
el contexto

01:10:59.900 --> 01:11:03.080
si está bien 16 está bien

01:11:04.720 --> 01:11:14.080
hoy entonces al job que es el que se llama aquí en hadut subir ficheros perfecto voy aquí

01:11:14.080 --> 01:11:15.360
este de aquí

01:11:21.980 --> 01:11:29.220
el problema es que marcantes a producción y en producción yo le colocó le cambiamos la edición

01:11:29.220 --> 01:11:38.120
a 17 entonces ese 17 no no está entonces este está en cuba ahora sí marcando aquí a 16

01:11:38.760 --> 01:11:49.240
y vamos a intentar entonces acá abajo para ver y si porque lo vamos a buscar acá será que si

01:11:49.240 --> 01:11:56.720
se habrá tomado el cambio porque debió tomar el cambio a cuba porque pareciese que estuviese

01:11:56.720 --> 01:12:03.580
buscando todavía la 17 si parece que estuviese buscando todavía 17 será que el cambio no lo

01:12:03.580 --> 01:12:11.380
podemos ver en el contexto no ahí pudiamos haber colocado de forma manual pero para que

01:12:11.380 --> 01:12:14.140
era más fácil aquí quería ver

01:12:15.100 --> 01:12:21.080
este momento a ver aquí me va a tocar cancelar porque aquí va a demorar un tiempo

01:12:21.080 --> 01:12:23.300
permíteme lo cancelo nuevamente porque

01:12:24.260 --> 01:12:26.460
queremos un momento

01:12:30.660 --> 01:12:37.700
y por acá le hizo axa basado leer archivos

01:12:47.540 --> 01:12:49.060
así se está cargando

01:12:53.040 --> 01:12:58.080
perfecto voy a cambiar entonces la forma de ejecución voy a colocar de forma manual

01:12:58.080 --> 01:13:10.220
el archivo sería entonces el archivo sería está ubicado en es las axa es las fil yo acto

01:13:10.940 --> 01:13:16.460
puntos eso ve cuando lo voy a ejecutar que aquí todavía está marcando a producción me parece

01:13:16.460 --> 01:13:21.820
que fue que no tomó el cambio voy a guardar por si las dudas voy a ejecutar ahora

01:13:25.580 --> 01:13:30.380
listo ok creo que aquí hubo un problema

01:13:31.020 --> 01:13:37.300
aquí el tipo no sé por qué se tomó aquí este text file no sé en qué momento se

01:13:37.300 --> 01:13:38.820
cambió eso le hizo voy a volver a ejecutar

01:13:41.160 --> 01:13:49.940
ese secuencia lo veo cuando vayamos a ver hay se explica que es ese sequence listo

01:13:51.740 --> 01:13:57.360
aquí es porque no le coloqué que tiene encabezados entonces intentó hay una fila

01:13:57.360 --> 01:14:02.220
que está tipo entero pero como el encabezado es un string intenta convertir un string a entero

01:14:03.140 --> 01:14:06.640
y ahora sí debería funcionar perfecto ahí está listo

01:14:08.500 --> 01:14:12.180
ahí el problema que teníamos es que estábamos marcando allá producción y eso causó ahí un

01:14:12.180 --> 01:14:18.720
pequeño problema y seguimos entonces se cuenta que hasta el momento lo que estoy

01:14:18.720 --> 01:14:24.780
haciendo son conexiones a nivel de especificando la url ya sea en los

01:14:24.780 --> 01:14:30.620
componentes o en el contexto si ustedes en algunos casos puede hacer lo siguiente puede

01:14:30.620 --> 01:14:35.720
hacer una configuración desde la metadata en la metadata aquí le aparece algo que se llama

01:14:35.720 --> 01:14:41.440
hadu cluster terminamos con esta configuración para la marzo no sé

01:14:41.440 --> 01:14:46.220
dele clic derecho aquí y dígale que va a hacer una conexión a un clúster de

01:14:46.220 --> 01:14:49.220
hadu number la va a llamar hadu donde es coraxa

01:14:54.140 --> 01:15:00.020
aquí le pide escoja universal la distribución

01:15:03.500 --> 01:15:08.980
nuevamente cambia aquí a universal universal

01:15:12.460 --> 01:15:17.300
por favor ahora en este universal que está aquí escoja entonces

01:15:17.300 --> 01:15:24.660
cambie donde dice localhost por favor cambie a la dirección ip que tiene de

01:15:24.660 --> 01:15:32.500
la máquina que sería 10.0.3.16 si quiere mejor la copia y la

01:15:32.940 --> 01:15:34.480
donde diga localhost

01:15:42.240 --> 01:15:47.880
el directorio lo cambia si ya va a un momento listo

01:15:47.880 --> 01:15:51.580
esperemos que confirma aquí algo

01:15:53.340 --> 01:15:53.980
a

01:15:58.220 --> 01:16:01.480
pero un momento que aquí me salió

01:16:02.860 --> 01:16:04.140
creo que

01:16:08.100 --> 01:16:13.900
si ahí es 9 mil muchas gracias si la 3.1 momento ya recuerdo

01:16:13.900 --> 01:16:21.000
aquí esta conversión que se me escapó que no me deja aquí sería

01:16:22.640 --> 01:16:28.340
10 un momento por favor ya 10.0.3.16 si efectivamente aquí sería 9 mil

01:16:28.340 --> 01:16:34.140
muchas gracias sería 9 mil y las demás nada más cambio la ip

01:16:35.100 --> 01:16:39.600
no me acuerdo ese error que sale ahí porque no me deja pasar

01:16:42.700 --> 01:16:46.760
no este par no tiene nada que ver

01:16:54.500 --> 01:17:00.840
momento por favor que aquí me sale un error de conexión usar name no vamos

01:17:00.840 --> 01:17:04.000
a hacerlo nuevamente para ver qué pasó aquí me preguntó voy aquí a

01:17:04.000 --> 01:17:10.900
que me sale un error ahora aquí en el metadata aquí hay un clóster

01:17:10.900 --> 01:17:13.120
aquí le coloco el nombre la conexión que había dicho

01:17:17.280 --> 01:17:23.260
un momento por favor y confirmo ya acá acá voy a coger universal

01:17:25.480 --> 01:17:30.340
aquí acá nuevamente allá ya me acordé ya me acordé permítame y le hago la

01:17:30.340 --> 01:17:33.260
prueba yo inicialmente para que usted no tenga que ser aquí

01:17:33.260 --> 01:17:39.940
aquí tengo que colocar el user de del clóster que sería h2

01:17:39.940 --> 01:17:44.920
h2 con h mayúscula y cambio local a su momento

01:17:44.920 --> 01:17:50.200
porque creo que si la no estoy más y esa versión 3.1 me va a funcionar con

01:17:50.200 --> 01:17:55.220
la clóster de ya un momento por favor 10.0.3.16

01:17:57.720 --> 01:18:05.120
cambio aquí a este número cambio aquí y listo voy a darle aquí

01:18:05.120 --> 01:18:10.960
chequear servicios no creo que el problema es que aquí me toca versión

01:18:10.960 --> 01:18:14.800
3.0 porque no es compatible y cada vez que cambio de versión me toca

01:18:14.800 --> 01:18:19.420
cambiar nuevamente la skip no creo que fue que no creo que fue no que no

01:18:19.420 --> 01:18:21.600
aquí no en el

01:18:25.840 --> 01:18:28.240
un momentito a ver

01:18:30.360 --> 01:18:35.000
si lo voy a hacer nuevamente creo que permítame que venga confirmo con 3.1

01:18:35.000 --> 01:18:40.360
creo que con 3.1 el error que era es que no cambié el puerto es para

01:18:40.360 --> 01:18:44.320
confirmarle ya iba a volver a hacer el ejemplo creo que fue que no

01:18:44.320 --> 01:18:45.920
cambié el puerto aquí a 9 mil

01:18:49.420 --> 01:18:53.580
aquí le colocó listo

01:18:55.820 --> 01:19:01.380
no es 3.0 listo ahora sí vamos a hacer ejemplo nuevamente de 0 se conecta se

01:19:01.380 --> 01:19:06.540
ubica en la metadata va donde dice hadu clóster y le da

01:19:06.540 --> 01:19:12.940
crear host de hadu clóster el nombre lo vamos a llamar hadu

01:19:12.940 --> 01:19:22.040
on the record axa next aquí escoge universal aunque creo

01:19:22.040 --> 01:19:27.020
que aquí no hay mucho problema con esta parte aquí vamos a coger ahora sí en

01:19:27.020 --> 01:19:31.020
distribución vamos a coger universal pero aseguré que sea 3.0

01:19:32.320 --> 01:19:37.860
3.0 x y vamos a cambiar en la primera en el name no uri vamos a

01:19:38.070 --> 01:19:45.330
cambiar el localhost por 10.0.3.16 y cambiamos el puerto 9 mil

01:19:45.330 --> 01:19:49.650
o sea en la primera línea cambio tanto la ip como el puerto 2 con los dos

01:19:49.650 --> 01:19:54.410
puntos que están ahí y después continuo y cambio en todos

01:19:54.410 --> 01:19:58.690
los demás que haya localhost cambio y por último coloque en username

01:19:58.690 --> 01:20:03.390
coloca hadu con h mayúsculo cuando haya hecho la configuración le da en

01:20:03.390 --> 01:20:09.250
service y debería aparecer entonces en verdecitos y todo está bien está

01:20:09.250 --> 01:20:12.990
correctamente configurado si está correctamente configurado le dan

01:20:12.990 --> 01:20:17.390
finis por favor la quien me habló disculpe no no se preocupe yo yo le

01:20:17.390 --> 01:20:21.570
digo ahora yo lo yo a su pantalla y algunos seguían porque hay algunos

01:20:21.570 --> 01:20:28.610
que han terminado ahí coloque 10.0 punto ahí punto siga con punto 16

01:20:28.610 --> 01:20:36.130
dos puntos 9 mil ahora donde está los localhost cambielo por 10.0.3.16

01:20:36.130 --> 01:20:41.030
dos puntos ahí sería dos puntos ahí se me escapó el puerto el puerto creo que

01:20:41.030 --> 01:20:45.510
es 80 20 y un momento ya le confirmo cuál es el puerto ahí porque se me

01:20:46.310 --> 01:20:49.450
escapó espera un momento por favor

01:20:49.450 --> 01:20:58.070
allí 80 32 32 22 y en el de abajo no borre no borre el bueno si quiere

01:20:58.070 --> 01:21:04.810
sobre escribir sería 80 30 dele por el username coloque hachedu con h

01:21:05.930 --> 01:21:14.090
mayúscula hachedu sex service ok listo dejamos finis o close finis

01:21:14.090 --> 01:21:18.570
bueno y dejamos aquí nos vamos entonces al break del almuerzo venimos

01:21:18.570 --> 01:21:23.950
entonces en una hora o sea 13 en punto entonces regresamos

01:21:23.950 --> 01:21:25.190
buen provecho entonces

01:21:28.070 --> 01:21:38.190
muy buenas tardes nuevamente espero que haya sido de buen provecho su

01:21:38.190 --> 01:21:43.050
almuerzo necesitamos conectados ya nos queda una hora nada más para

01:21:43.050 --> 01:21:47.690
terminar este día si me confirman por favor si tenemos audios y me

01:21:47.690 --> 01:21:52.610
están escuchando perfecto aquí muchísimas gracias alejandro perfecto

01:21:52.610 --> 01:21:57.290
entonces vamos a revisar un poco que es los ejemplos que hemos venido

01:21:57.290 --> 01:22:00.550
haciendo hasta el momento primero iniciamos con unos ejemplos básicos para

01:22:00.550 --> 01:22:04.730
entender el funcionamiento de la herramienta que es el tal en como tal

01:22:04.730 --> 01:22:11.730
como forma general y estamos en la parte de hacer ejemplos con jadut el

01:22:11.730 --> 01:22:15.670
primer ejemplo con jadu que fue subir archivos note algo en particular de

01:22:15.670 --> 01:22:21.650
la forma en que lo hice creé una conexión a jadu que con tipo hdfs

01:22:22.390 --> 01:22:26.710
conectio mientras que el otro lo que hice fue que la conexión la hice

01:22:26.710 --> 01:22:31.170
directamente en el componente entonces como buena práctica que deberíamos

01:22:31.170 --> 01:22:35.910
hacer si tienes un joque en el cual vas a utilizar muchos componentes sobre

01:22:35.910 --> 01:22:41.310
hdfs para leer muchos archivos escribir o colocar muchos archivos en el

01:22:41.310 --> 01:22:44.870
sistema de ficheros lo más recomendable es que hagas lo

01:22:44.870 --> 01:22:49.510
siguiente que cree solamente una conexión con hdfs conector y los

01:22:49.510 --> 01:22:53.510
demás componentes tomen la configuración de esa conexión es lo

01:22:53.510 --> 01:22:58.330
más conveniente si el caso particular es solamente un solo componente pues la

01:22:58.330 --> 01:23:01.430
puede hacer directamente en el componente como tal

01:23:02.210 --> 01:23:06.090
la otra buena práctica es el no posible utilizar variables de contexto

01:23:06.090 --> 01:23:10.590
en el cual pues la configuración de conexión la tengas mantenidas ahí de

01:23:10.590 --> 01:23:14.810
tal manera en que si hay algún cambio en la configuración o en la

01:23:14.810 --> 01:23:19.590
dirección la url que apunta entonces simplemente la cambias directamente en

01:23:19.590 --> 01:23:22.590
la variable de contexto y automáticamente todos los joque dependen

01:23:22.590 --> 01:23:27.430
de ello cambiarán entonces esa variable de contexto ahora estamos en

01:23:27.430 --> 01:23:33.250
otra forma de conexión a hadut que es a través de una metadata entonces

01:23:33.250 --> 01:23:36.170
habíamos quedado inicialmente con esta