5 videos 📅 2024-10-09 09:00:00 America/Bahia_Banderas
1:04:11
2024-10-09 10:47:18
1:29:40
2024-10-09 12:28:28
25:55
2024-10-10 09:26:29
2:38:45
2024-10-10 09:59:31
46:32
2024-10-10 15:02:46

Visit the Big Data course recordings page

United Arab Emirates - Big Data Hadoop Analyst Training

                WEBVTT

00:00:02.860 --> 00:00:19.720
Sí, accede por favor. Sí, vamos a ver. Mientras va abriendo, abre el browser por For Average,

00:00:20.560 --> 00:00:28.360
tienes allá abajo y ahí vamos a confirmar si se copió todo. Dale 10.3, dale creo que

00:00:28.620 --> 00:00:34.420
está en el ya está ya está en el historial de directa 10 y creo que te aparece una dirección

00:00:34.420 --> 00:00:40.540
ahí que es 10 puntos ese dale entre por favor se copió la máquina vete a la misma vete a

00:00:41.320 --> 00:00:47.760
utilities la en la en el menú de arriba está overview utilities browse the file browse la

00:00:47.760 --> 00:00:55.640
primera opción la primera y ahí está la carpeta un inputs dale clic en inputs y eso ahí está

00:00:55.640 --> 00:00:58.960
vete ahora y a ver si ya subió el tal envidata

00:01:03.760 --> 00:01:09.220
dale ok a ese dale dale ok ese tendrá que conectarse a un repositorio no existe

00:01:09.940 --> 00:01:19.280
expande los yo design y mira es el yo que se llama yo descargar archivos a dos

00:01:19.280 --> 00:01:26.720
listo bueno por ahí vamos entonces listo retomamos entonces en un minuto listo perfecto

00:01:30.220 --> 00:01:35.340
entonces estamos en la configuración de este if que este es un condicionador que

00:01:35.340 --> 00:01:40.460
ejecutaría el componente siguiente siempre y cuando la condición se cumpla ahora vamos

00:01:40.460 --> 00:01:47.440
a configurar sencillamente el temes a voz coloquen el mensaje nada más error al

00:01:47.440 --> 00:02:00.480
cargar archivo al descargar archivo y proceda alto siguiente a conectar nuevamente el hfg

00:02:00.480 --> 00:02:08.420
con el disparador rumif con el otro mesa voz disparador con rumif y conéctelo aquí

00:02:08.420 --> 00:02:15.840
dele doble clic a la línea delif doble clic a la línea y le aparece la condición

00:02:18.640 --> 00:02:25.420
justamente a la línea delif a ver muestra a ver eva creo que la línea no extraer a la

00:02:25.420 --> 00:02:32.340
línea creo que usaste es no eva lo que hace que colectaste con mail quítate quita borra

00:02:32.340 --> 00:02:36.540
esa línea que tienes ahí por favor borra la línea de conexión selecciona la idea a

00:02:36.540 --> 00:02:43.740
suprimir ahora suprimir listo ahora nuevamente clic derecho sobre el hdf hdf que clic derecho

00:02:43.740 --> 00:02:49.400
vete al disparador disparado no sensión disparador la que viene después de fila

00:02:49.400 --> 00:02:57.680
ese y hay una opción que dice rumif la tercera rum y listo conecta la cuelte mesa voz 2

00:02:58.800 --> 00:03:03.300
ahora dale doble clic a la línea y te va a aparecer una opción en la parte de abajo

00:03:03.300 --> 00:03:08.680
condición espera listo ahí vamos en la parte de abajo del centro te aparece ahora

00:03:08.680 --> 00:03:17.320
en la perspectiva online abrimos nuevamente hdfsg del lado izquierdo y tomamos una variable

00:03:17.320 --> 00:03:23.720
nuevamente la misma y la soltamos de este lado la selecciono clic sostenido y aquí

00:03:23.720 --> 00:03:29.200
si esto es igual a 1 significa que subió de forma correcta

00:03:31.800 --> 00:03:34.960
subió no descargó que es más descargando

00:03:37.640 --> 00:03:41.160
si todo está ok por favor ejecuta el job

00:03:43.900 --> 00:03:45.680
y veamos qué pasa

00:03:47.960 --> 00:03:53.880
excelento vamos a subirlo ahora más tarde memoria generando apenas listo

00:03:53.880 --> 00:03:59.120
hay algunos que tienen errores vamos a ver ahora verifico para ver voy contigo

00:03:59.120 --> 00:04:01.520
bernardo deja que ejecuta el mismo momento

00:04:03.780 --> 00:04:09.080
terminé de ejecutar para confirmar si es mismo error listo hello world se me olvidó configurar

00:04:09.080 --> 00:04:13.980
este hello world cuál es de todo está correctamente mire entro por aquí donde

00:04:13.980 --> 00:04:21.000
aquí dice true entro por aquí se lo olvidó configurar ok si por favor y le funcionó

00:04:22.480 --> 00:04:27.880
coloque un nombre al archivo que no esté allá en hd y lo vuelve a ejecutar debería salir el

00:04:27.880 --> 00:04:35.740
mensaje de error a colocar producción uno y lo vuelvo a ejecutar y debería salirme ahora

00:04:35.740 --> 00:04:39.720
si error fue que se volvió configurar el mensaje ya voy contigo un momento bernardo a ver

00:04:41.420 --> 00:04:42.960
el caso tuyo vamos a ver

00:04:46.320 --> 00:04:53.240
a porque tu carpeta es input pero la tienes con el contexto verdad vete al contexto de

00:04:53.240 --> 00:04:57.620
un día creo que se hicieron con vete a tu contexto del proyecto del lado izquierdo en

00:04:59.000 --> 00:05:04.240
repositorio abre el contexto que se llama maxa no pero cambia la no pero cambia la mejor

00:05:04.240 --> 00:05:07.780
en el en el no no lo cambia y porque nada más me funcionaría nada más ahí después

00:05:07.780 --> 00:05:16.580
vamos a ir usando entra ahí perfecto para que doble clic listo next y cambia y hay inputs

00:05:18.000 --> 00:05:26.980
si finis a ley es ok para que cambie en los listo finis ejecuta nuevamente para ver

00:05:30.190 --> 00:05:38.750
listo avise listo ve aquí error a descargar archivo martina no no o eva eva vamos a ver eva

00:05:38.750 --> 00:05:47.290
que error tienes vete al design en un momento a listo vete al design ahí porque eso está

00:05:47.290 --> 00:05:56.190
entre comillas doble entra temesas vos temesas vos ese que está ahí doble clic y ese mensaje

00:05:56.190 --> 00:06:01.030
colocado entre comillas doble ejecuta nuevamente para ver hernesto tienes un error también noto

00:06:01.030 --> 00:06:09.770
que lo tienes vamos a ver qué te pasó a ti muestrame por favor tu hf get hello world

00:06:09.770 --> 00:06:13.950
entró al segundo de mesa vos significa que lo descargó por favor busca la carpeta descarga

00:06:14.930 --> 00:06:20.930
los que terminaron busquen su carpeta descarga y debería estar en su temporal

00:06:20.930 --> 00:06:27.690
descarga el archivo descargado vamos a ver el caso tuyo listo inputs muestrame tu browser un momento

00:06:31.050 --> 00:06:37.670
tu browser en esto si le están a mal este muestro a tu pantalla listo vete a ahí está inputs

00:06:37.670 --> 00:06:47.330
perfecto muestren nuevamente ahora sí él tienes y si te un contexto para descarga así lo tiene

00:06:47.330 --> 00:06:54.470
vete a tu rumo un momento a tu perdón a tu hd figuete nuevamente que ven a tu a tu hd figuete

00:06:54.470 --> 00:06:59.930
sube muestrame esa dirección servidor jadud un momento dirección servidor jadud

00:07:02.170 --> 00:07:07.770
vamos a ver si está bien faltó dos puntos y después de la ese faltó dos puntos

00:07:09.450 --> 00:07:13.810
si mis cálculos no me falla te faltó dos puntos ahí te confirmo

00:07:16.710 --> 00:07:25.390
hd fs ya te confirmo dos puntos y exactamente dos puntos las las dirección listo finis para ver

00:07:26.110 --> 00:07:32.170
yes vuelve a ejecutar nuevamente todo correcto listo debería estar en la carpeta vete a tu

00:07:32.170 --> 00:07:35.470
carpeta que no la descargaste creo que la descarga creo que la viste por allá me parece

00:07:37.610 --> 00:07:44.470
que más no le funcionó a mí es ya sí mismo vamos contigo ya es bien yo te dije que ya

00:07:44.470 --> 00:07:50.990
mía casi escribí con s2 tienes conceptos ya acá normalmente bueno vamos a ver que es meter rum a

00:07:50.990 --> 00:07:59.230
ver la pestaña rum en esa perspectiva que está rum yo sube para ver para ver el error en el

00:07:59.230 --> 00:08:07.850
exactamente vamos a ver que dice ahí está tomando la ruta user vete al get momento

00:08:07.850 --> 00:08:14.470
hd fs hd fs muestrame la configuración dale doble clic doble clic un momento a ver baja para ver

00:08:17.990 --> 00:08:23.610
ese directorio ray como es una variable de contexto no debería ir entre comillas doble en

00:08:23.610 --> 00:08:28.330
el en la variable esa de context no va entre comillas porque es una variable de context

00:08:29.530 --> 00:08:36.850
intenta ejecutar ahora nuevamente a ver si el problema era ese hello world entro por el true ok

00:08:37.450 --> 00:08:42.670
dale creo que ese dale click ok no se no lo configure el no vete a tu descarga donde

00:08:42.670 --> 00:08:47.270
lo mandaste a descargar viera que entró por la línea no está el true entró por ahí debió

00:08:47.270 --> 00:08:51.090
descargar bien vete a tu programa de archivo no porque es lo estamos descargando desde

00:08:51.090 --> 00:08:55.290
sistema de fichero entra descargas y ahí tienes cópic

00:08:58.490 --> 00:09:04.410
perfecto no sé si alguien más listo no sé si alguien más bueno continuamos pues

00:09:05.910 --> 00:09:13.050
quien yo quien dios yo disculpe julio eso julio vamos a ver qué error salió

00:09:14.190 --> 00:09:19.910
oye es un error de compatibilidad dele ok beta code beta el co para que nos muestre

00:09:19.910 --> 00:09:25.110
dale ok por favor si está mal beta el co del aladito del designer en el punto rojo dice

00:09:25.110 --> 00:09:29.550
que esa variable no existe entonces vete a tu a tu contexto de no hay una perspectiva en la

00:09:29.550 --> 00:09:35.130
parte de abajo en el contexto exactamente ahí donde está el clientes a la clínica

00:09:35.130 --> 00:09:40.650
beta contexto ese que está ahí y está diciendo que esa variable parece que no existe

00:09:40.650 --> 00:09:45.990
dale doble clic en el en el hd feget no es la confesión del hd fe el t hd feget

00:09:45.990 --> 00:09:53.910
ahí en el canvas la doble clic beta el canvas hd fse que si las dudas a lo siguiente vete a

00:09:53.910 --> 00:10:01.650
la variable de contexto que tiene context borra la hasta el con ahí sube sube sube sube borra

00:10:01.650 --> 00:10:07.650
la hasta el co pero manda la manda la pero no te complique la vida borra la desde la p

00:10:07.890 --> 00:10:14.090
desde la p borra la mesa borrar hasta la s y dale control espacio dale control espacio

00:10:14.090 --> 00:10:19.730
ahí ya dale control espacio para que salga la ayuda ahí estás listo ahora sí doble

00:10:19.730 --> 00:10:25.410
seleccionada y ahora vuelve la ejecutar para ver sube para ver nos vamos a ver sube para

00:10:25.410 --> 00:10:31.270
ver sube para ver el error inputs la carpeta se llama inputs con s vete a tu contexto por

00:10:31.270 --> 00:10:35.610
favor pero del repositor del proyecto o sea de buscate el contexto del repositorio

00:10:35.610 --> 00:10:41.130
para que la corríes allá no ese contexto busca el de repositorio que lo tienes al lado de

00:10:42.170 --> 00:10:48.430
desde el proyecto perdón vete a la ascensión del repositorio del lado izquierdo eso dale

00:10:48.430 --> 00:10:52.290
doble clic ahí pasa que si la cambio aquí cambiaría en todos los yo que lo tienen

00:10:52.290 --> 00:11:00.050
dale next y colóquelo ahí la s inputs en ruta raíz inputs dale finish ahí por favor

00:11:01.490 --> 00:11:09.690
y es ok y dale ahora sí nuevamente ejecutar lo que pasa es que si la cambiaba directamente en

00:11:09.690 --> 00:11:14.850
el yo te hacía el cambio ahí pero no me cambiaba si volvía a re-usar esa variable en otro yo

00:11:15.850 --> 00:11:20.470
entonces mejor la cambiamos el contexto nivel del proyecto y me cambia actualiza todos los que

00:11:20.470 --> 00:11:26.330
dependen del hello world exactamente eso tuvo que haber descargado vete a la carpeta

00:11:26.390 --> 00:11:30.790
tuya en temporal descargas entre la carpeta descarga y va a estar ahí

00:11:32.870 --> 00:11:36.730
bueno listo no sé si a todos ya les funcionó o todavía hay errores

00:11:41.410 --> 00:11:43.710
ya se entendía vamos a ver

00:11:46.650 --> 00:11:47.830
para este momento

00:11:50.810 --> 00:11:58.490
sí como hizo sí como hizo como hizo ahora no recuerdo que es decir yo pude haber hecho

00:11:58.490 --> 00:12:04.510
la variable de contexto de esto si quieres te lo haga la prueba aquí en vez de hacer eso

00:12:04.510 --> 00:12:13.450
debía ser lo mejor así veo y me quedaba mucho más fácil de configurar notepad es decir me

00:12:13.450 --> 00:12:18.410
daba esto sin estas comillas doble y aquí le colocaba

00:12:21.670 --> 00:12:32.610
dentro era 10.0.3.250 quitaba esto texto mira en este contexto de acá le decía

00:12:32.610 --> 00:12:37.810
oye ven acá para no está complicándome la vida con esas comillas simple comillas doble

00:12:38.910 --> 00:12:40.490
le colocaba todo esto aquí

00:12:42.590 --> 00:12:47.090
y ahora cuando de cuando lo fuera a usar que era aquí en la parte esta de

00:12:49.930 --> 00:12:54.850
este hdfguet lo que hacía era que colocaba como tengo dirección completa ya colocada más

00:12:54.850 --> 00:12:59.230
context dirección servidor y en realidad me quedaba mucho más fácil que la forma en que

00:12:59.230 --> 00:13:04.470
lo hice inicialmente pero ya déjenlo así porque no vamos a configurar eso

00:13:06.310 --> 00:13:10.430
a liso porque se agrega el más y más perfecto una pregunta creo que no era

00:13:10.430 --> 00:13:16.690
lo que es exactamente lo que no era porque este señor estaba esperando un stream verdad

00:13:16.690 --> 00:13:23.790
y a este stream le iba a agregar una variable imagínate esto como si yo tuviese lo siguiente

00:13:23.790 --> 00:13:31.170
así lo colocar un poco más grande aquí imagínate como si yo hubiese definido aquí bar x igual

00:13:31.170 --> 00:13:40.070
aquí a esto que está aquí entre comillas doble como esto es un stream para yaba entonces

00:13:40.070 --> 00:13:46.690
qué pasaba me tocaba cerrar aquí este stream con cateno esta variable más x y

00:13:46.690 --> 00:13:51.690
después con cateno con esta parte de acá por eso crear a los más porque

00:13:51.690 --> 00:13:54.730
yaba lo y como es yaba permitir así

00:13:57.570 --> 00:14:07.150
listo bueno bien vamos eso sigamos entonces vamos a lo siguiente ahora vamos a conectarnos de

00:14:07.150 --> 00:14:11.930
una manera diferente para que tú escojas a ver cuál es la que más te gusta hemos hecho

00:14:11.930 --> 00:14:16.250
unas conexiones en cada uno de los componentes de diferente forma vamos a hacer lo del

00:14:17.250 --> 00:14:25.450
ok vamos aquí en metadata y aquí hay una opción que dice haduk cluster la que dice hay

00:14:27.070 --> 00:14:36.950
haduk cluster no se le da clic derecho aquí y le dice crear haduk cluster bueno el

00:14:36.950 --> 00:14:44.650
nombre lo voy a llamar haduk onderexcoraxa el nombre que le voy a dar haduk onderexcoraxa

00:14:47.550 --> 00:14:55.530
next aquí te piden espera un momento que tuve que cerrar haduk conexión se me perdieron los

00:14:57.990 --> 00:15:04.810
momentos se me perdió la ventana donde tengo todos gracias aquí la distribución ya te he

00:15:04.810 --> 00:15:08.290
explicado que hay diferentes distribuciones toma el open source y cada uno le colocó una

00:15:08.290 --> 00:15:13.390
capita diferente me interesa universal que ya la que estoy trabajando y por cuestiones aquí

00:15:13.390 --> 00:15:24.390
debe ser versión 3.0 3.0 si no creo que causa error 3.0 y le das finish aquí

00:15:26.610 --> 00:15:30.670
aquí estos manes tienen un error aquí un box que me toca reconfigurar nuevamente eso

00:15:31.330 --> 00:15:38.330
es que pena aquí tiene que volver a configurar nuevamente universal y 3.0 listo ahí está

00:15:38.330 --> 00:15:44.590
esto es muy parecido a cuando definía una conexión estática base datos aquí no puedo

00:15:44.590 --> 00:15:51.650
usar la llave de contexto reemplace todos los localhost por la dirección del servidor

00:15:52.710 --> 00:16:01.630
en el primero hay una pequeña diferencia el primero va a ser 10.0.3.250 y por favor cambia

00:16:01.630 --> 00:16:12.670
el puerto S8020 que acá en esta versión es 9.000 lo demás si copias cambias el localhost

00:16:12.670 --> 00:16:15.270
por la dirección IP nada más y los puertos siguen fijo

00:16:19.890 --> 00:16:24.990
bien fijo los puertos perfecto dígame quién me habló por ahí qué pena que no estoy viendo el

00:16:25.130 --> 00:16:26.370
el chap

00:16:28.590 --> 00:16:32.030
julio vamos a ver julio vamos a ver listo vamos a ver voy a tu pantalla y de pronto

00:16:32.030 --> 00:16:37.430
hay algunos que dale cáncer ahí por favor dale cáncer cáncer ahí estamos ahí en distribución

00:16:37.430 --> 00:16:44.110
por favor o dice en la parte de la distribución escoge universal click universal baja un poco

00:16:44.110 --> 00:16:49.050
más y es universal en la versión que tienes del lado derecho escoge 3.0 por favor y ahora

00:16:49.050 --> 00:17:01.950
vas a cambiar en la primera name uri vas a cambiar el localhost por 10.0.3.250 y cambia

00:17:01.950 --> 00:17:07.290
el puerto ese que dice 80 20 por 9000 listo ahora los demás localhost lo cambia por

00:17:07.290 --> 00:17:17.530
10.0.350 todos los localhost que tienes por debajo lo vas a cambiar por 10.0.350 que es

00:17:17.530 --> 00:17:23.530
con los puntos que te quede el punto porque el punto va a indicar el puerto creo que

00:17:23.530 --> 00:17:30.530
cogiste la t ahí te quedó a ti perfecto ya no cierren pero un momento ahora donde dice

00:17:30.530 --> 00:17:39.650
user name listo dice user name baja colocar a chedub el usuario que tengo a chedub vamos

00:17:39.650 --> 00:17:48.230
a chequear los servicios chequear servicios check service y esperamos que no haya bueno

00:17:48.230 --> 00:18:01.650
aquí me pide descargar algunos drivers de conexión vamos a descargarlo bueno está

00:18:01.650 --> 00:18:04.530
todavía verificando el estatus

00:18:13.510 --> 00:18:18.210
el caso del mío está un poquito lento y el tengo error yo

00:18:19.810 --> 00:18:27.410
ah mire yo me equivoqué puse 900 y era 9000 pequeño error check service listo ahora sí

00:18:28.700 --> 00:18:32.960
con los si está en verde el estatus le da finish por favor

00:18:34.920 --> 00:18:41.000
si te salió el estatus en verde dale finish por último te tuvo que haber abierto aquí la

00:18:41.000 --> 00:18:46.540
conexión en esa conexión le da clic derecho y le voy a decir que va a crear una conexión

00:18:46.540 --> 00:18:52.000
hdfs al sistema de ficheros de jadu porque recuerda que se divide en 12 más reduce y

00:18:52.000 --> 00:19:02.360
en hdfs vamos entonces a crear hdfs y colócalo hdfs nombre la conexión axa under core axa

00:19:07.560 --> 00:19:11.360
next y aquí no hay que hacer más nada aquí nada más que darle cheque creo que aquí si

00:19:11.360 --> 00:19:17.440
le das cheque listo si nada más cheque para confirmar y ha creado de forma correcta la

00:19:17.440 --> 00:19:27.380
conexión al sistema de ficheros de jadu aquí le das finish perfecto y ya puede rehusar esa

00:19:27.380 --> 00:19:28.960
conexión vamos a ver cómo la rehusamos

00:19:36.680 --> 00:19:43.440
perfecto no te preocupes no te preocupes claro vamos a ver ya listo voy para allá

00:19:43.440 --> 00:19:50.160
pero en un momento ya llego ya bueno el primer el puerto en el name uri donde el

00:19:50.160 --> 00:19:55.400
primer name uri que tiene no uri cambia el puerto 80 20 a 9000 es 80 20 lo cambia a 9000

00:19:57.200 --> 00:20:02.480
ese era para versiones anteriores de jadu y acá en el user name sigue bajando después

00:20:02.480 --> 00:20:12.080
donde dice user name baja listo colócale hdud hdud ahí colócale hdud perfecto y se

00:20:12.080 --> 00:20:17.220
activó el cheque service lo viste acá donde dice cheque service en la los botones que están

00:20:17.220 --> 00:20:25.040
en la parte de abajo dale clic en cheque service por favor descarga dale el descargar todo un

00:20:25.040 --> 00:20:33.480
momento y esperamos para ver y verificamos a ver si todo está ok listo le das ok close

00:20:33.480 --> 00:20:44.040
finish finish y vete a repositorio y expande jadu cluster ahora en ese jadu cluster recordará

00:20:44.040 --> 00:20:49.960
que está divido en mac reduce y en hdfs crea una conexión hdfs hacia ese jadu le da clic

00:20:49.960 --> 00:20:57.800
derecho clic derecho no en jadu que el otro en jadu alza clic derecho ahí y crea hdfs

00:20:59.860 --> 00:21:06.200
hdfs listo llámalo hdfs donde es colaxa dale next next

00:21:08.160 --> 00:21:14.240
y dale cheque por favor para verificar que todo esté bien cheque ok finish perfecto listo

00:21:15.660 --> 00:21:23.440
vamos a crear un nuevo job por favor un nuevo job un nuevo job en jadu que lo voy a llamar

00:21:25.020 --> 00:21:33.760
entonces job listar ficheros con the record jadu

00:21:36.180 --> 00:21:38.980
finish aquí

00:21:38.980 --> 00:21:47.680
listar ficheros perfecto listo entonces vamos a hacer lo siguiente para listar

00:21:47.680 --> 00:21:52.880
vamos a usar el componente que se llama t hdfs list

00:21:58.780 --> 00:21:59.460
list

00:22:14.240 --> 00:22:22.520
hdfs list y vamos a usar un componente que ya hemos usado que se llama t java

00:22:23.160 --> 00:22:28.460
el t java hemos usado dos a todo momento como se llama t java y uno se llama t java robo

00:22:28.460 --> 00:22:36.240
el t java no tiene ni entrada ni salida permite ejecutar código java y tengo el t java flow que

00:22:36.240 --> 00:22:40.660
también me permite ejecutar código java pero ese señor tiene entradas y ni salidas

00:22:42.780 --> 00:22:58.440
listo ahora haga lo siguiente vamos a conectar vamos a configurar t hdfs list por favor

00:22:58.440 --> 00:23:04.960
que la tengo de repositorio vamos a conectarlo de forma diferente donde dice property tie

00:23:07.400 --> 00:23:16.320
vayase aquí a donde dice repositorio property tie del hdfs repositorio y aquí sale un

00:23:16.320 --> 00:23:24.440
pequeño botón dale clic en el botón por favor y aquí te aparecen las conexiones

00:23:24.440 --> 00:23:34.400
definida repositorio entonces escoges el hdfs axa este que está aquí el hdfs axa y le das ok

00:23:36.880 --> 00:23:44.720
y él configura lo que tengas allá en ese hdfs axa otra forma en la cual

00:23:44.720 --> 00:23:54.040
tú te conectas una está estática una la hace directamente en el job como tal nuevamente le

00:23:54.040 --> 00:23:58.760
da clic aquí en el repositorio y a y escoge la opción hdfs axa que es la última

00:24:02.720 --> 00:24:03.760
la última opción

00:24:11.240 --> 00:24:15.100
ok ok vamos a ver un momento bernardo vamos a ver qué pasó

00:24:15.100 --> 00:24:24.540
vamos a ver no esa no es por aquí talé quítale el chulito de usar conexión

00:24:24.540 --> 00:24:30.440
existente en el check listo quítale el chulito ese vete al esto de ver al botón que está al

00:24:30.440 --> 00:24:36.380
final ese que está ahí exactamente clic ahí pero un momento que ese se muera listo entonces

00:24:36.380 --> 00:24:41.700
expande ahí hasta que cuentes el hdfs expande sigue expandiendo sigue expandiendo

00:24:43.640 --> 00:24:51.900
y ahí está ok listo perfecto ahí toma la configuración entonces por último vamos a configurar

00:24:53.800 --> 00:25:00.700
el hdfs directorio pero entonces vamos a importar los contextos importamos los contextos del

00:25:01.050 --> 00:25:11.450
del contexto de el proyecto y ahora ahí vamos a colocar en ese hdfs list donde dice

00:25:12.210 --> 00:25:21.850
hdfs directorio context control espacio y colocamos contexto ruta raíz julio

00:25:21.850 --> 00:25:25.410
listo julio vamos a ver un momento

00:25:29.070 --> 00:25:33.970
ah porque seguro vete al contexto vete al contexto del joke ahí donde estás vete a la

00:25:33.970 --> 00:25:39.910
sección de context ahí en la perspectiva que estás en la pestaña al lado de component está

00:25:39.910 --> 00:25:47.770
context context jolly start ficheros adult esa dale clic ahí dale a importar en el en

00:25:47.770 --> 00:25:59.490
el botoncito el otro el final es selecciona ahí por favor selecciona todo ok ahora si

00:25:59.490 --> 00:26:08.210
vete nuevamente al hdfs list doble clic listo dale control espacio y debe aparecer ruta raíz ok

00:26:08.210 --> 00:26:20.050
bueno ahora o lo siguiente vamos a hacer algo diferente entonces recordarás que lo voy a

00:26:20.050 --> 00:26:27.230
mostrar acá véanlo acá por favor note lo siguiente que hay unos componentes que tienen

00:26:27.230 --> 00:26:34.030
en la opción fila main e iterate ya la vio no pero véanlo acá del lado mío véanlo en mi

00:26:34.030 --> 00:26:40.790
pantalla y esto te pasaba en muchos componentes que estabas en el data integration había

00:26:40.790 --> 00:26:51.010
me y había iterate para qué sirve ese iterate ese iterate deberías usarlo cuando el componente

00:26:51.010 --> 00:26:57.650
de entrada es una colección una colección tipo array entonces tú quieres recorrer esa

00:26:57.650 --> 00:27:03.850
colección entonces qué va a pasar así voy a irme este fichero de acá este hdfs lo

00:27:03.850 --> 00:27:08.650
que va a hacer es que devuelve un array o sea en java o lo guarda como si fuera un vector

00:27:09.550 --> 00:27:15.790
entonces para recorrer un vector o una colección en java en este caso en la herramienta se

00:27:15.790 --> 00:27:22.010
hace iterando como él sabe que devuelve nada más ya un array dele clic derecho y

00:27:22.010 --> 00:27:30.670
aparece nada más iterate entonces manda aquí y lo conecta te da un color un poco subestivo

00:27:30.670 --> 00:27:39.090
y ahora vayamos a la configuración del te llave le doble clic al te llave el te llave

00:27:39.090 --> 00:27:44.990
perfecto doble clic al te llave después que iterate ese iterate es para recorrer una

00:27:44.990 --> 00:27:56.570
colección claro colección para java es un array puede ser un set un map no mentira

00:27:56.570 --> 00:28:03.650
este diccionario es set array list vector son los con los arrays para los colisiones para java

00:28:05.050 --> 00:28:10.470
borra por favor ese ese código que tienes ahí y agrega lo siguiente vas a escribir la

00:28:10.470 --> 00:28:17.030
palabra system con s mayúscula vamos a escribir hasta sys s mayúscula y s control espacio

00:28:17.030 --> 00:28:22.230
sale error si a todo le salió error no sé a mí fue nada más que me salió error

00:28:23.190 --> 00:28:27.990
si le aparece lo mismo listo entonces es un problema de configuración aquí por defecto

00:28:28.630 --> 00:28:33.270
dele clic al enlace que dice con ten asis con ten asis

00:28:36.450 --> 00:28:42.470
y aquí hay una opción que dice basic proposal la deschulea basic proposal esa que está aquí

00:28:43.590 --> 00:28:46.470
la deschulea la aplica y cierra al final

00:28:48.970 --> 00:28:57.710
ok intenta nuevamente control espacio y si aparece la palabra system ahora vamos a ver

00:28:57.710 --> 00:29:03.490
vamos a ver si no la parece estamos bien a quien dijo no parece así a eva

00:29:05.390 --> 00:29:13.770
así vamos eva listo dele control espacio a ver ahí control sostenido espacio dele

00:29:13.770 --> 00:29:18.750
listo de listo dele aplicar y cerrar dele aplicar y cerrar la ultima opción

00:29:18.750 --> 00:29:24.930
dice cierre esa ventana y dele nuevamente control espacio escoge asisten que es lo

00:29:24.930 --> 00:29:35.030
que estoy buscando ahí sisten el sistema escoge aquí le doy punto escojo la opción

00:29:35.030 --> 00:29:44.110
que es la tercera punto por inc y escoge la opción pring ln creo que está bien lejos

00:29:44.110 --> 00:29:50.310
creo que me queda más fácil escribir la pring ln y me aparece en paréntesis ahí fórmela

00:29:50.310 --> 00:29:57.770
ahí la idea es que autocomplete perfecto ahora mire lo siguiente la perspectiva cuando yo

00:29:57.770 --> 00:30:03.510
quiero utilizar algunas variables todos los componentes de talent que ofrecen unas

00:30:03.510 --> 00:30:09.670
variables de que puedas usar que fue lo que hicimos ahorita como aquí al teyaba le entra

00:30:09.670 --> 00:30:16.770
el thd feliz voy a buscar que variables me llegan aquí al teyaba vayas en la perspectiva online

00:30:16.770 --> 00:30:26.230
y expande el hd feliz y aquí hay varias variables tome current filename y pégelo

00:30:26.230 --> 00:30:31.810
inténtelo pegarlo dentro de las paréntesis que quede dentro de paréntesis creo que no va

00:30:31.810 --> 00:30:41.010
a quedar no me quedó así pero al final me debería quedar así te lo voy a mostrar mejor a lo hago

00:30:43.190 --> 00:30:45.650
así para que lo veas mejor cómo te quedaría

00:30:48.850 --> 00:30:54.970
debería quedar más o menos así o sea la variable que solté debía quedar entre los paréntesis

00:31:03.310 --> 00:31:09.550
listo te voy a quedar de esa forma si quiere toma esa al otros de que termine en punto y coma

00:31:09.550 --> 00:31:14.890
si quieres al otro system punto no prigale me voy a copiar este de aquí voy a dejarlo así abierto

00:31:14.890 --> 00:31:23.490
así así con el paréntesis y suelto aquí el que hice current file directory y lo suelto

00:31:23.490 --> 00:31:28.410
aquí en el medio hay que me quede no el señor no senta ahí no es donde yo quiera es donde

00:31:28.410 --> 00:31:30.650
aquí en el medio me quedaría

00:31:34.530 --> 00:31:38.290
voy a intentar ejecutar mientras usted va haciendo ya para decir no hay ningún error

00:31:49.810 --> 00:31:52.690
bueno voy a ver para ver si hay alguno que tiene error por ahí

00:32:08.410 --> 00:32:15.450
está cargando cargando cargando menos hoy ya está demorando un poquito

00:32:17.550 --> 00:32:22.690
debería devolverme los dos ficheros que son producción y

00:32:26.670 --> 00:32:33.250
listo ahí está ejecutando si está ejecutando el show correcto así está ahí me devolvió

00:32:33.250 --> 00:32:40.150
producción y me dice la ruta donde está que es hdfs 10.0.3 50 es las imputas

00:32:44.830 --> 00:32:50.330
o sea el berto tiene es un error muestra para ver dale ok si quieres vete mejor

00:32:50.330 --> 00:32:54.810
al co si eres tan amable al co

00:32:57.710 --> 00:33:03.590
y vemos exactamente donde tiene ese error punto rojo contes ruta rey a no importaste

00:33:03.590 --> 00:33:07.290
seguramente vete al diseer vete a al diseño nuevamente el designer

00:33:09.110 --> 00:33:13.650
dale en el contexto de la perspectiva de configuración que es la que está en el medio

00:33:13.650 --> 00:33:22.010
ahí contextos click ahí creo que no se llamaba entonces doble clic al al tdf a la

00:33:22.010 --> 00:33:28.210
confesión del t hdfs que tiene ahí doble clic baja por favor pero la confesión del

00:33:28.210 --> 00:33:37.190
hdfs dale doble clic por favor a darle doble clic que se perdió baja a listo ahí hay un

00:33:37.190 --> 00:33:47.010
problema ahí borra hasta hasta borra de raíz hasta la t le faltó un punto ahí borra de raíz

00:33:47.010 --> 00:33:54.690
ahí borra borra hasta la t sigue borrando hasta la t dale control espacio ahí y escoge

00:33:54.690 --> 00:33:59.650
ruta raíz es que le habías colocado un guión ahí y no sentaba ejecuta ahora nuevamente

00:33:59.650 --> 00:34:03.670
para ver también es un error allá para ver vamos a ver qué tienes ahí

00:34:06.310 --> 00:34:15.310
sube para ver yo sube para ver yo a ver la ruta de lo que también vete al hdfs la ruta

00:34:15.310 --> 00:34:22.590
está mal dale vete a bueno a vete al contexto antes perdón vete al contexto del diseño

00:34:22.590 --> 00:34:32.350
ahí en la perspectiva central dice ahí bueno ahí está bien vete al hdfs doble clic por favor

00:34:32.350 --> 00:34:37.890
porque la colocaste entre comillas doble como es una variable de referencia no va entre comillas

00:34:37.890 --> 00:34:42.490
doble porque intenta colocar eso de manera fija quítale la doble la comilla que inicie

00:34:42.490 --> 00:34:48.270
comillas que finaliza al hdfs directory porque es una variable de contexto entonces

00:34:48.270 --> 00:34:57.090
no necesita comillas doble dale ejecutar ahora sí perfecto ahí está listo y asmin tienes un

00:34:57.090 --> 00:35:04.170
error muestra para ver porque colocaste en primer lugar existe con y muestrame ahora el

00:35:04.170 --> 00:35:10.270
designer un momento el designer dale doble clic al ya va listo en primer lugar existe con y

00:35:10.270 --> 00:35:16.290
cambias es y latina por y griega ahora el paréntesis que abre en esa línea que está

00:35:16.290 --> 00:35:24.590
ahí el ln ahí es ln y es y ln en minúscula en minúscula porque si no le hizo ahora ese

00:35:24.590 --> 00:35:31.450
paréntesis que abre siérralo en la línea 3 la que está vacía línea 3 está vacía esa que está

00:35:31.450 --> 00:35:38.670
ahí cierra paréntesis y punto y coma punto y coma dale entre ahí enter nuevamente ahí enter

00:35:38.670 --> 00:35:43.050
y cópiate la primera línea del código y la pegas ahí o tiene el espacio ahora está

00:35:43.050 --> 00:35:50.010
ubicado lo mismo porque si no y pégale ahí dale guardar y veamos el co un momento

00:35:51.350 --> 00:35:58.450
para ver qué pasa perfecto ahí tienes las producción y la carpeta donde está

00:36:00.530 --> 00:36:05.390
bueno hagamos un pequeño break de 10 minutitos para tomar algo frío y volvemos entonces a las

00:36:05.390 --> 00:36:08.130
2 y 30 en 10 minutitos bueno a 1 y 30 justo allá ya volvemos

00:36:14.570 --> 00:36:16.050
bueno continuamos entonces

00:36:18.610 --> 00:36:27.410
bien hagamos el último ejemplo de este job de hadut que es ahora es leer el contenido o

00:36:27.410 --> 00:36:34.530
utilizar un archivo que está en el sistema hadut eso entonces vamos a lo siguiente no estoy

00:36:34.530 --> 00:36:40.090
en la máquina que no es la mía esto no es la mía ahora está poco la mía esta si es la mía

00:36:41.390 --> 00:36:47.210
creemos un nuevo job ahora crear job

00:36:49.950 --> 00:36:53.530
job lo vamos a llamar job leer

00:36:57.130 --> 00:37:00.810
fichero y luego a colocar la palabra desde hadut

00:37:02.990 --> 00:37:04.570
perdón el anterior

00:37:06.850 --> 00:37:16.350
cuál el anterior o ese sí perdón yo estaba hablando aquí no que es

00:37:16.350 --> 00:37:20.690
pero tiene el micrófono para me decía que entienden error

00:37:22.390 --> 00:37:24.810
eva cuando lo ejecutó se le un error maestra para ver

00:37:32.190 --> 00:37:32.87000:37:37.090 --> 00:37:38.450
ok muestrame

00:37:38.450 --> 00:37:43.770
exactamente muestrame para ver el cambio es de cambio y cambia eso que es ahí cámbialo

00:37:45.130 --> 00:37:49.530
pero quítale no pero si las comidas doble porque la variable de contexto no

00:37:49.530 --> 00:37:57.890
está comidas doble listo quítele con otro espacio y busque ahí el segundo

00:37:57.890 --> 00:38:04.370
opción si de ruta raíz y ahora ejecute por favor si está amable

00:38:18.690 --> 00:38:24.070
y lo que más es que cuando es variable de contexto no necesita comillas doble para

00:38:24.070 --> 00:38:24.830
referenciar

00:38:29.630 --> 00:38:34.230
pues cierro aquí bueno para nuevamente que fue la pregunta bueno para

00:38:34.230 --> 00:38:38.930
reforzar la pregunta que me hicieron ahora si yo tengo una variable en java

00:38:38.930 --> 00:38:46.870
por ejemplo es string string x igual a hola

00:38:47.390 --> 00:38:51.710
no es lo mismo yo voy aquí si uso la variable por ejemplo usarla aquí

00:38:51.710 --> 00:38:55.650
sumamos que esto es una función de java aquí si yo mando a escribir x de esta

00:38:55.650 --> 00:39:00.830
forma lo que hace que busca la variable x se escribiría hola pero si la

00:39:00.830 --> 00:39:05.850
colocó entre comillas doble lo que coloca el valor estático es x

00:39:05.850 --> 00:39:12.050
entiendo ahora si yo coloco x más x lo que hace que coloca de manera

00:39:12.050 --> 00:39:15.990
estática esta x y le coloca irreferencia la variable x entonces

00:39:15.990 --> 00:39:18.990
cuando es contexto no hay que colocar entre comillas doble porque si

00:39:19.090 --> 00:39:23.230
le colocó entre comillas doble está tomando el valor de la variable estática el

00:39:24.490 --> 00:39:29.970
contexto bueno comentaba que se había perdido la comunicación el micrófono

00:39:29.970 --> 00:39:34.050
apagado vamos a crear un nuevo job que va a ser el último en la familia de

00:39:34.050 --> 00:39:39.530
javuz que lo vamos a llamar job leer fichero desde javuz

00:39:41.370 --> 00:39:44.350
y esperamos que nos cree el canvas

00:39:47.190 --> 00:39:52.950
perfecto aquí vamos a hacer un par de cositas ahora entonces vamos a agregar

00:39:52.950 --> 00:39:56.950
este va a ser el último job de javuz de las familias de javuz vamos a

00:39:56.950 --> 00:40:02.210
agregar un componente que se llama ht hdfs

00:40:06.130 --> 00:40:11.390
hdfs vamos a llamarlo es se llama inputs hdfs

00:40:11.390 --> 00:40:12.590
inputs

00:40:14.430 --> 00:40:21.430
hdfs inputs y vamos a colocar aquí sencillamente un telok row

00:40:22.590 --> 00:40:27.550
nada del otro mundo nada complicado un telok row

00:40:29.510 --> 00:40:40.010
y conecte por favor el hdfs inputs al telok row vamos a configurar este hdfs

00:40:40.010 --> 00:40:44.770
doble clic y voy a usar la conexión estática que tengo de repositorio

00:40:44.770 --> 00:40:50.490
entonces como hay property tie voy a repositorio aquí cojo repositorio me

00:40:50.490 --> 00:40:57.850
aparece una casilla de texto con un botón y procedo a buscar la conexión

00:40:57.850 --> 00:41:01.370
que había configurado anteriormente

00:41:04.930 --> 00:41:06.290
hdfs hizo

00:41:06.290 --> 00:41:09.450
y esa axa

00:41:10.370 --> 00:41:14.370
perfecto listo y toma la configuración

00:41:21.390 --> 00:41:29.370
me pide ahora leer el nombre del archivo entonces en ese nombre de

00:41:30.550 --> 00:41:36.430
voy a hacer lo siguiente voy a darle aunque yo creo que si

00:41:36.430 --> 00:41:40.870
doy aquí debería conectarme a javuz si aquí es saber

00:41:40.870 --> 00:41:48.510
si aquí está doy clic clic y me conecta a la máquina virtual

00:41:50.150 --> 00:41:55.350
es cualquier que usted quiera y de producción vamos a tomar todo producción

00:41:57.210 --> 00:41:57.730
ok

00:41:58.510 --> 00:42:00.430
a ver si este más no creo que este más

00:42:03.270 --> 00:42:07.950
no lo ejecuyo todavía porque ahora hay que resolver un problema ahora este

00:42:07.950 --> 00:42:11.890
tipo de archivos que es text file y sequence file lo voy a explicar más

00:42:11.890 --> 00:42:17.270
adelante ahí vamos a tomar el caso de los archivos en formato parquet

00:42:18.030 --> 00:42:25.370
pero bueno ahora lo hacemos un momento ok tomamos producción punto ccv

00:42:25.370 --> 00:42:30.130
listo y prestación siguiente recordará que todos estos archivos que

00:42:30.130 --> 00:42:37.410
son jason xml ccv tienen un esquema de la metadata es decir de las

00:42:37.410 --> 00:42:41.450
columnas no tanto está en el nombre la columna porque la columna puede

00:42:41.450 --> 00:42:46.010
llamarse como usted quiera está más en el tipo de columna y el orden en

00:42:46.010 --> 00:42:52.710
la va a sacar entonces si vemos aquí este input editar esquema no tiene

00:42:53.670 --> 00:42:57.490
esquema el esquema hay que definirlo

00:42:57.490 --> 00:43:01.450
vayas a editar esquema que está al principio ese esquema hay que definirlo

00:43:02.090 --> 00:43:08.330
si el archivo es muy grande sale muy tedioso aclaro no complicado muy

00:43:08.330 --> 00:43:13.230
tedioso ir uno por uno y ir agregando aquí componentes aquí sale

00:43:13.230 --> 00:43:19.830
muy tedioso entonces cuál es el truco el truco es el siguiente

00:43:20.290 --> 00:43:24.970
quiero el esquema del archivo producción listo entonces tú puedes

00:43:24.970 --> 00:43:27.790
hacer lo siguiente si el archivo muy grande le pide a la persona que te

00:43:27.790 --> 00:43:32.650
mande el archivo con por lo menos dos dos tres filas para ver la

00:43:32.650 --> 00:43:35.910
estructura del archivo como el archivo tenemos a nivel local mira

00:43:35.910 --> 00:43:41.170
lo que vamos a hacer aquí vayas al fight delimited y vamos a crear una

00:43:41.170 --> 00:43:45.470
conexión a ese archivo en el mundo real tú vas a pedir una copia

00:43:45.470 --> 00:43:50.830
previamente con tres filas dos filitas para ver la estructura click derecho

00:43:50.830 --> 00:43:56.350
vamos a crear un archivo delimitado y lo vamos a llamar producción

00:43:57.050 --> 00:44:03.590
producto está en inglés producción vamos a darle aquí next por favor busque el

00:44:03.590 --> 00:44:05.730
fichero producción lo tenemos en temporal

00:44:06.730 --> 00:44:11.370
entén tenemos producción este que está aquí a abrir

00:44:11.890 --> 00:44:15.670
está separado por coma entonces vamos a darle aquí next

00:44:15.670 --> 00:44:18.810
en la parte de codificación no lo va a tener en cuenta recuerde que la

00:44:18.810 --> 00:44:22.010
codificación es interesante cuando estén en el idioma español portugués que

00:44:22.010 --> 00:44:25.910
tiene símbolos especiales en este caso el aquí debería funcionarme bien a

00:44:25.910 --> 00:44:28.990
bueno a menos que haya caracteres especiales

00:44:28.990 --> 00:44:33.710
vayamos a lo seguro cosas ustedes f8 mejor pero tampoco me da lo mismo lo

00:44:33.710 --> 00:44:39.830
que quiero hacer el separador es coma y dígale que

00:44:39.830 --> 00:44:44.650
tiene encabezado la el archivo y le da refresh

00:44:45.870 --> 00:44:50.050
listo aquí ya no hay más nada no hay que hacer nada me interesa es la

00:44:50.050 --> 00:44:54.110
metadata el nombre las columnas y el orden en que está el nombre no tanto

00:44:54.110 --> 00:44:57.930
pero sería interesante que vamos a ver aquí next bueno ya le da finish al

00:44:57.930 --> 00:45:01.770
final bueno en ese punto nos vamos quedando en este punto mejor

00:45:02.850 --> 00:45:07.190
aquí lo hacemos facilito notará entonces que cuando yo tengo una

00:45:07.190 --> 00:45:13.010
metadata hay dos botoncitos que le aparecen en la parte de abajo

00:45:13.010 --> 00:45:17.950
bueno varios botones pero en realidad estos botones son para agregar

00:45:17.950 --> 00:45:22.570
eliminar cambiar el orden pero me interesan los dos últimos el penúltimo

00:45:22.570 --> 00:45:28.010
es para exportar el esquema o sea la estructura como la tengo

00:45:29.270 --> 00:45:35.230
y no sé vamos a escoger el penúltimo botón

00:45:35.230 --> 00:45:41.130
y vamos a vamos a llamar a este señor esquema

00:45:41.130 --> 00:45:46.050
donde el score producción productión en realidad y no se le olvide el punto

00:45:46.050 --> 00:45:54.890
c sv puntos perdón punto xml no se sube punto xml formado también xml le

00:45:54.890 --> 00:46:04.250
da guardar por favor guardar y le da finish aquí perfecto ese archivo lo

00:46:04.250 --> 00:46:09.650
hice para sacar y exportar la estructura de la metadata pocas palabras

00:46:09.650 --> 00:46:16.670
las columnas ahora váyase a nuevamente al h al t hdfs input

00:46:16.670 --> 00:46:23.210
vayamos a editar esquema y aparece por defecto un botón que está en la

00:46:23.210 --> 00:46:28.890
posición del otro de les por ver test import vayamos import y vamos a buscar el

00:46:28.890 --> 00:46:32.170
esquema producción que es el esquema que saqué

00:46:32.170 --> 00:46:39.730
voy a abrir y debería retornar el esquema que saqué exporte le vamos a

00:46:39.730 --> 00:46:45.130
dar aquí ok y es que propagar los cambios si

00:46:45.130 --> 00:46:48.330
terminó por favor asegúrese que el yo que vaya a ejecutar es el

00:46:48.330 --> 00:46:59.270
recto del rum y debería retornar los datos del archivo producción que está

00:46:59.270 --> 00:47:03.010
allá adentro en hdfs dejado

00:47:10.310 --> 00:47:11.370
perfecto

00:47:11.370 --> 00:47:14.290
espero para ver si le salió algunos

00:47:18.330 --> 00:47:23.670
hasta el momento lo que hemos hecho son funciones de almacenar de

00:47:23.670 --> 00:47:30.350
almacenamiento sobre hdfs todavía no hemos hecho ningún procesamiento con

00:47:30.350 --> 00:47:34.530
big data solamente almacenamiento no hemos hecho

00:47:34.530 --> 00:47:38.810
procesamiento todavía bueno listo parece que ese archivo

00:47:39.710 --> 00:47:44.930
grandecito tanto pues espero para ver si a todos nos funcionó

00:47:44.930 --> 00:47:49.570
si creo que a todos nos funcionó perfectamente

00:47:53.170 --> 00:47:59.010
hernesto está ejecutando creo que bueno seguimos terminamos el ciclo de

00:47:59.010 --> 00:48:04.890
adud y ahora vamos a hacer un ejemplo que seguramente te va a tocar porque yo

00:48:04.890 --> 00:48:08.430
creo que tú tienes montado ustedes tienen montado muchas cosas sobre

00:48:09.630 --> 00:48:13.590
asho entonces en este caso no tengo cuenta de asho tengo cuenta de a dos

00:48:13.590 --> 00:48:20.070
pero va a ser muy parecido voy entonces a hacer ejercicios que mezclen adud y

00:48:20.070 --> 00:48:27.090
s3 que sería en asur como se llama que se me escapa como es se me escapa

00:48:27.090 --> 00:48:31.190
como es el s3 el nombre s3 en asur como se llama el sistema

00:48:31.830 --> 00:48:34.610
bueno ahora lo busco

00:48:34.610 --> 00:48:37.550
ese es como se llama disculpe ese log stories

00:48:37.550 --> 00:48:41.890
es bueno vamos entonces lo siguiente

00:48:43.710 --> 00:48:46.970
yo tengo un amigo que es fanático a

00:48:46.970 --> 00:48:51.790
a dos a dos es el trabajo en a dos luces no pero trabaja con a dos luces no

00:48:51.790 --> 00:48:55.870
trabaja en acción trabaja con a dos luces pero entonces él es muy fanático

00:48:55.870 --> 00:49:00.270
y él entonces para él a dos luces es lo mejor que existe o sea lo demás no

00:49:00.910 --> 00:49:04.570
sirve no sé yo le lo molesto yo digo pero si es s3

00:49:04.570 --> 00:49:09.390
ese 3 es como si fuera una carpeta es como decir un google drive entonces se

00:49:09.910 --> 00:49:14.650
molesta que cuede rabia y vea busca un libro gente que es fanática pero si

00:49:14.650 --> 00:49:18.370
usted analiza el s3 al final tenía siendo un parecido google drive lo que

00:49:18.370 --> 00:49:21.470
es que con el cloud front y muchas cosas pues tú tienes algunas cosas

00:49:21.470 --> 00:49:26.250
interesantes de replicación pero es un google try al final pero se

00:49:26.250 --> 00:49:27.930
molesta que le diga eso

00:49:27.930 --> 00:49:30.030
en estos momentos parece que tiene error

00:49:30.970 --> 00:49:35.150
listo vaya por favor creando un folder llamado s3

00:49:37.510 --> 00:49:38.130
s3

00:49:38.810 --> 00:49:43.330
voy a tu ventana un momentico hernesto ver que este noto que tiene es un

00:49:43.330 --> 00:49:46.690
error dice

00:49:48.870 --> 00:49:49.490
ops

00:49:49.490 --> 00:49:56.490
muéstrame tu tu archivo input muéstrame el esquema de input

00:49:56.490 --> 00:50:00.210
el esquema de input editar esquema ok

00:50:01.630 --> 00:50:05.270
él dice muéstrame nuevamente el error nuevamente el error por favor muéstrame

00:50:06.410 --> 00:50:10.550
nuevamente a es que ese archivos a listo ahí fue

00:50:10.550 --> 00:50:14.350
error mío en realidad no tuvo en cuenta vete a tu hdf input por favor

00:50:14.350 --> 00:50:17.510
nuevamente que pena si mis cálculos no me fallan

00:50:17.510 --> 00:50:22.210
ese señor está separado por coma baja por favor baja por favor baja no

00:50:22.370 --> 00:50:28.870
dile que carácter ahí colocaste coma también entonces ahí para

00:50:28.870 --> 00:50:32.030
descomplicarnos la vida y ver que te funcione no sé por qué no te funciona

00:50:32.030 --> 00:50:34.970
pero vamos a ver el problema es el siguiente vete nuevamente el esquema

00:50:35.650 --> 00:50:40.550
ve nuevamente el esquema si está amable y ahí la variable esa y croc

00:50:40.550 --> 00:50:44.450
giard ya coloca la string que hay algo que no está está convirtiendo

00:50:44.450 --> 00:50:48.710
mal colocale tipo string dale ok y vuelve a ejecutar para ver

00:50:48.710 --> 00:50:52.490
ahora tienes un error con aria cambiarte también aria string

00:50:53.510 --> 00:51:00.350
que claro que bueno el error técnico es que intenta convertir un una a una

00:51:00.350 --> 00:51:04.290
vez lo que encontró por ahí en flot o en integer y bien tienes al error

00:51:04.290 --> 00:51:08.370
ejecutas y ya debe funcionarte pero claro que no sé por qué a ti no te

00:51:08.890 --> 00:51:12.590
funcionó ahí hay que ver para ver perfecto déjela así entonces perfecto

00:51:12.590 --> 00:51:21.490
sigamos entonces vamos aquí a s3 y vamos a hacer entonces algo muy

00:51:21.490 --> 00:51:26.370
parecido aquí con jadot clic derecho en s3 y vamos a crear un nuevo

00:51:27.910 --> 00:51:34.890
este job lo vamos a llamar job subir fichero

00:51:38.190 --> 00:51:47.930
on the record s3 nada más parecido pero a jadot la diferencia que voy a subirlo ahora sobre

00:51:47.930 --> 00:51:54.650
s3 le damos aquí finish voy a cerrar los demás

00:51:57.310 --> 00:52:01.250
no lo voy a usar por ahora los

00:52:04.390 --> 00:52:11.750
deje de ser que es ahí agreguemos los componentes aclaro que esta conexión

00:52:11.750 --> 00:52:15.130
al s3 no está como metadata está como componente es decir no puedo

00:52:15.130 --> 00:52:20.470
colocar una conexión fija al igual que con jadot o bases de datos no aquí este

00:52:20.470 --> 00:52:25.310
señor no lo permite entonces agregamos los siguientes componentes primero voy a

00:52:25.310 --> 00:52:34.530
tener un componente de tipo s3 connectio s3 conectio voy a tener un

00:52:34.530 --> 00:52:43.430
componente de tipo s3 put y por último un componente de tipo s3

00:52:43.430 --> 00:52:47.430
close de s3 close

00:52:49.770 --> 00:52:53.950
voy a hacer esto distinto a lo que he venido trabajando anteriormente voy a

00:52:53.950 --> 00:53:00.830
agregar dos componentes presta atención para que no se le olvide lo siguiente ahí tengo

00:53:00.830 --> 00:53:07.010
como esos componentes no están unidos tengo tres sus yo no están unidos entre sí entonces

00:53:07.010 --> 00:53:12.630
yo podía definir un orden es decir yo podía integrar a estos señores con un disparador

00:53:12.630 --> 00:53:18.790
colocarle un suyo que aquí y un suyo que acá no la gusta ya por favor es para recordar

00:53:18.790 --> 00:53:24.830
esto con suyo que acá y me quedaría exactamente los tres sus yo pero aquí estoy definiendo

00:53:24.830 --> 00:53:29.750
un orden primero ejecuta este después ejecuta ese y por último ejecuta ese esa es una forma

00:53:29.750 --> 00:53:35.890
cierto la segunda forma que le había mostrado es unir estos componentes con un componente

00:53:36.970 --> 00:53:45.310
ok significa lo siguiente que ahora no tengo tres suyos sino un solo suyo con la diferencia ahora

00:53:45.310 --> 00:53:51.550
es que el componente siguiente se gusta siempre y cuando no haya habido error en el componente

00:53:51.550 --> 00:53:58.690
anterior eso es lo que es el componente ahora voy a agregar dos elementos diferentes

00:54:00.090 --> 00:54:07.390
estos elementos hacen prácticamente lo mismo del un suyo que hay siendo que ahora en teoría

00:54:07.390 --> 00:54:14.090
alguno dice que te vuelve el yo más elegante o en otro que te lo es más fácil de leer busque

00:54:14.090 --> 00:54:20.010
dos componentes uno que se llama te para ello pere de antes pre yo

00:54:24.390 --> 00:54:26.790
y coloque un te pos yo

00:54:32.690 --> 00:54:39.810
bueno explico ese te pre yo que está ahí

00:54:39.810 --> 00:54:49.990
se ejecuta antes del primer suyo que tengas y el te pos yo se ejecuta después del último

00:54:49.990 --> 00:54:57.570
suyo que tengas normalmente el te pre yo lo utilizamos para labores de conexión o de

00:54:57.570 --> 00:55:05.250
iniciación de elementos en el suyo y después define lo suyo que tenga el orden que tú quieras y

00:55:05.250 --> 00:55:12.270
el te pos yo lo que hace es normalmente cerrar conexiones aclaro que esto es simplemente darle

00:55:12.270 --> 00:55:19.170
un poco más de elegancia pero vamos a lo siguiente conecte el te pre yo con el te s3 conectio

00:55:21.810 --> 00:55:25.090
con un component ok ese que está aquí

00:55:28.090 --> 00:55:31.170
conecte el te pos yo con el te s3 close

00:55:34.750 --> 00:55:41.070
ahí te quedan tres suyos al final el primer yo que se ejecuta es todo lo que está en el

00:55:41.070 --> 00:55:45.830
te pre yo que se ejecuta antes del primer suyo el suyo es todo lo que no está conectado ni

00:55:45.830 --> 00:55:51.690
al te pos yo ni al te pre yo o sea que nada más tengo un solo componente como suyo que

00:55:53.610 --> 00:55:59.650
después que se termine la ejecución de todos los suyos se ejecuta al final el te pos yo

00:55:59.650 --> 00:56:04.690
algunos dicen que esto documenta mejor que sea más elegante pero es simplemente pues

00:56:05.850 --> 00:56:11.750
diferentes formas de hacer lo mismo esto mismo al conectarlo con un suyo ok me da

00:56:11.750 --> 00:56:18.910
exactamente lo mismo pero bueno son formas de hacerlo bueno este vamos a tomarnos entonces

00:56:18.910 --> 00:56:28.790
el descanso para el break y volvemos en en una horita ok en una eso bueno igualmente buen provecho

00:56:38.270 --> 00:56:42.110
bueno nuevamente buenas tardes continuamos

00:56:44.010 --> 00:56:55.430
aquí me escribieron algo de el caso estudio de ayer si tiene hoy a qué preguntas tenía con

00:56:55.430 --> 00:57:03.330
respecto al de ayer acabo de leer el clases siendo sincero acabo de leer solamente ahora

00:57:03.330 --> 00:57:08.690
que me acuerdo esa máquina virtual la borraron verdad o todavía puede hacer esa máquina

00:57:10.010 --> 00:57:17.050
pero ahí fue que error mío pero no se preocupen mándeme como lo tenga y le corríos acá después

00:57:18.970 --> 00:57:23.170
porque va a haber problemas con algunos que no puedan acceder a la máquina más de lo que

00:57:23.170 --> 00:57:28.110
tenga no preocupa y yo le resuelvo los puntos que hagan falta porque se me escapó que esa

00:57:28.110 --> 00:57:37.750
máquina la borraba sí sí sí sí sí sí fue error mándeme lo que tenga no se preocupe no

00:57:37.750 --> 00:57:42.250
colocarle mala nota yo le los puntos que falten ahí los corridos fueron míos que a mí se me

00:57:42.250 --> 00:57:45.690
olvidó que esa máquina la cerraba pero lo que tenga mándeme el correo por su favor

00:57:45.690 --> 00:57:51.350
yo se preocupo por lo demás yo le agrego ahí lo demás y si fue claro no vamos a batir

00:57:52.190 --> 00:57:55.790
seguida más de lo que tenga yo le agrego lo demás ahí porque es que se me escapó que

00:57:55.790 --> 00:58:00.830
verdad que esas máquinas las borraba y lo que decía verdad que sí que después de 15 minutos

00:58:00.830 --> 00:58:09.210
ya usted no puede hacer más nada entonces va aquí ahí lo mande eso mande ahí para tener

00:58:09.210 --> 00:58:15.990
la evidencia de que mandó el correo nada más y lo que tenga y bueno continuemos entonces con

00:58:15.990 --> 00:58:25.070
respecto a estos ejemplos que tenemos aquí y listo vamos había dicho esa forma un poco

00:58:25.070 --> 00:58:32.410
digamos elegante de hacer un job en este caso usar el teprayop que es el primer subyok que

00:58:32.410 --> 00:58:37.290
se ejecute quiere decir entonces que a ese señor todos los componentes que estén agregados

00:58:37.290 --> 00:58:43.670
al teprayok se ejecutan antes del primer subyok que se encuentren y el teprayok se ejecuta

00:58:43.670 --> 00:58:48.510
después del último subyok que se encuentra en este caso nada más y un subyok que es el

00:58:48.510 --> 00:58:53.430
intermedio entonces se ejecutaría primero la conexión después el put y por último el

00:58:54.850 --> 00:59:02.670
listo vamos a configurar entonces este tc3 connection por favor vamos a la carpeta compartida

00:59:04.330 --> 00:59:06.270
a la carpeta compartida

00:59:16.410 --> 00:59:23.230
no es la otra forma es quitar este suyo este preyot de aquí este preyot de aquí y lo que

00:59:23.230 --> 00:59:30.470
es que conecto con su subyok quedaría así entonces digo que es elegante porque puede ver que

00:59:31.310 --> 00:59:36.810
con el con el anterior lo que puedo evidenciar que se ejecuta de primero y que se ejecuta de

00:59:37.850 --> 00:59:45.690
último digamos algunos lo llaman elegante pero a mí casi bueno yo sí lo uso bastante en el

00:59:45.690 --> 00:59:49.990
sentido de poder organizar que es lo que inicio que es lo que ejecuta y que es lo

00:59:49.990 --> 00:59:56.230
que finalizo nada más es eso son diferentes formas de hacerlo no le veo si tampoco tanta

00:59:56.230 --> 01:00:01.890
mucha o sea diferencia en la forma de conectarlo con un subyok no hay ninguno ok por si las

01:00:02.910 --> 01:00:10.510
dudas bueno vamos a configurar este tc3 connection vamos a la carpeta compartida el one drive

01:00:10.510 --> 01:00:14.950
colocamos aquí one drive ya ya lo habíamos aquí está db3 dbd

01:00:18.650 --> 01:00:26.390
y hay una opción que dice búsqueda que dice credenciales s3 credenciales s3

01:00:27.770 --> 01:00:31.830
no descargue vamos a copiar directamente de aquí a abrir el archivo tequitec está ahí

01:00:33.710 --> 01:00:40.250
por favor nada más abre el archivo tequistec y tiene ahí no lo vamos a copiar primero el

01:00:40.250 --> 01:00:49.830
access key listo lo voy a copiar y me voy a la configuración del tc3 connection aquí le

01:00:49.830 --> 01:01:00.790
digo que instale el componente que no lo tengo instalado eva creo que está en credenciales

01:01:00.790 --> 01:01:08.370
pero estabas más través de estas sí te crece al s3 la segunda credenciales s3 ahí está

01:01:08.690 --> 01:01:16.210
esa es una creencia del correo devuélvete que usted es el clic antes devuélvete sube de nivel

01:01:17.710 --> 01:01:28.150
cierra y nos cierra y me forciera del lado derecho su listo sube de nivel a tbt ahí a tbd

01:01:28.150 --> 01:01:33.250
tbd credenciales s3 la segunda credenciales dele clic por favor en credenciales ahí y

01:01:33.490 --> 01:01:41.670
copia ahora la que dice access key access key no solamente la el valor que empieza desde a

01:01:41.670 --> 01:01:46.950
el valor nada más le queda más fácil dándole doble clic a la palabra dale doble clic a la

01:01:46.950 --> 01:01:52.230
palabra que se asesiona completa ya está ahí ahora cópiela y la vamos a colocar en

01:01:52.230 --> 01:01:57.250
el tc3 connection vayamos a la confesión del tc3 connection

01:01:59.210 --> 01:02:03.930
y la colocamos en la sección del access key dentro de comillas doble dentro de las

01:02:03.930 --> 01:02:09.290
comillas doble colocamos el access key alejandro al instalar por favor igual eva dale instalar

01:02:09.290 --> 01:02:16.750
al componente que no está instalado perfecto bajamos a instalar listo listo si ya terminó

01:02:16.750 --> 01:02:25.050
copia ahora el secret key desde el más aquí sí me toca seleccionar todo porque ahí con

01:02:25.050 --> 01:02:30.470
doble clima se ha hecho una parte entonces y lo colocas en el secret key dentro de las

01:02:30.470 --> 01:02:41.010
comillas dobles listo ok perfecto ahí tengo vamos ahora al tc3 put y vamos ese es parecido

01:02:41.010 --> 01:02:48.710
vamos a usar una conexión existente y use conexión existente y listo le aparece por

01:02:48.710 --> 01:02:56.470
efecto la que está conectada que es tc3 connection bien el bokeh el bokeh prácticamente es una

01:02:56.470 --> 01:03:04.550
carpeta el bokeh vamos a colocar donde dice bokeh prácticamente una carpeta vamos a llamarlo se

01:03:04.550 --> 01:03:09.910
se llama noble prog de como de programación hasta la g noble prog lo voy a mandar aquí

01:03:10.970 --> 01:03:17.950
o lo voy a colocar acá mejor entre comillas doble quedaría noble prog entre comillas doble

01:03:17.950 --> 01:03:26.670
queda noble prog sería el bokeh la carpeta pero se quieren refinar con la palabra bokeh

01:03:42.930 --> 01:03:49.870
y ahora en noble prog vamos entonces a hacer lo siguiente noble prog y ahora

01:03:49.870 --> 01:03:58.610
continuó con la configuración del put y ahora el key el key va a ser el nombre con que tú

01:03:58.610 --> 01:04:04.390
quieres que subamos el nombre del archivo en este caso entonces voy a llamarlo vamos a

01:04:04.390 --> 01:04:19.850
colocarle el prefijo su nombre para que cree una carpeta allá en el bokeh o sea en este

01:04:19.850 --> 01:04:27.350
que sería el nombre la carpeta que crearía en ese bokeh y la otra es el archivo aquí dese

01:04:27.350 --> 01:04:33.710
cuenta que este señor put si me tocaría hacer varios me tocaría colocar subir varios me

01:04:33.710 --> 01:04:38.650
tocaría colocar varios put porque este put nada más permite subir uno al tiempo entonces

01:04:38.650 --> 01:04:49.830
vamos a escoger aquí en el menú escoja producto que es el que quiero subir en la

01:04:49.830 --> 01:04:58.310
s3 close el que cierra y ya por defecto tiene configurado la conexión que va a cerrar bueno

01:04:58.310 --> 01:05:03.850
mientras tanto mientras revisa para ver voy accediendo a mi bokeh noble prog que

01:05:03.850 --> 01:05:12.250
es el que usted va a subir para verificar si le funcionó el archivo entonces listo

01:05:12.250 --> 01:05:19.530
voy a ejecutar para ver verifique que vaya a ejecutar el yo correcto voy a ejecutar aquí

01:05:22.450 --> 01:05:28.350
y voy a verificar entonces si funciona o no funciona de eso bien está ejecutando

01:05:31.330 --> 01:05:38.750
y quién me habló y dar el ronin background un momento con en background

01:05:41.090 --> 01:05:46.890
y que tiene ejecutando falló de nuevamente rum para ver

01:05:46.890 --> 01:05:51.250
el dar el detail y darles detail para ver muy detail darles detail ahí un momento

01:05:53.050 --> 01:06:00.290
dale en el punto rojo ahí en los puntos rojos para cancelar y en el de abajo también eran

01:06:00.290 --> 01:06:07.050
dos dale para ver no no porque eso queda a lo siguiente mejor no sé qué está pasando ahí

01:06:08.630 --> 01:06:12.550
por si la duda le hizo de la casa momento y vuelve a ejecutar para ver no

01:06:12.550 --> 01:06:20.410
y restaura restaura la el archivo por restaura por favor la aplicación del

01:06:20.410 --> 01:06:26.270
archivo restaurar porque no sé que en qué se queda está colgado al restar y esperamos

01:06:26.270 --> 01:06:30.870
un momento y vuelve a ejecutar ese dale salvar por si acaso ahí se le da tu error dale ok

01:06:32.690 --> 01:06:38.950
y dale ok para que él reinicie no sé si va a reiniciar porque salió un error antes

01:06:38.950 --> 01:06:46.610
cierra de todo modo el aplicativo y lo vuelve a abrir a ver qué pasó dale no salvar porque

01:06:46.610 --> 01:06:55.370
sale un error dale no salvar mejor no salvar y vuelve a abrir para ver un momento bueno

01:06:55.370 --> 01:06:59.350
voy a ver quién le subió mientras a hernesto le está probando ahí a ver

01:07:01.530 --> 01:07:09.170
bueno acá tengo lo siguiente tengo a jonathan subió el archivo aquí estoy mostrando en la

01:07:09.170 --> 01:07:23.150
pantalla martina también le subió y le subió a alguno me subió pero sin la carpeta me lo

01:07:23.150 --> 01:07:28.370
subió directamente producto un punto se sube no sé quién sería y aquí tengo también a jazz

01:07:28.370 --> 01:07:33.710
min que lo subió los demás no sé si tienen problema para ejecutarlo buena sesión de

01:07:33.710 --> 01:07:42.230
arnesto no sé quién alejano muestrame tu yo para ver si tú viste que subiste sin sin

01:07:42.230 --> 01:07:51.710
el nombre carpeta oye muéstrame ya voy a tocar a tu alejano quizá muéstrame tu putt

01:07:51.710 --> 01:08:00.190
por favor en el ts3 putt a cambiar el nombre carpeta jon alejandro para saber que eres tú

01:08:00.190 --> 01:08:05.490
dale cambiale a jon porque si no se describía sobre la mía alejandro y lo ejecutas por

01:08:05.490 --> 01:08:10.850
favor en esto vamos a ver si te guardó el yo porque yo burra algo raro ahí buscar yo para

01:08:10.850 --> 01:08:21.870
ver bueno acá tengo entonces adal ver catalina eva hector jonathan y ahora

01:08:21.870 --> 01:08:32.850
hernesto alejandro no sé si lo subiste ok ahora sí alejandro listo vamos a ver

01:08:32.850 --> 01:08:41.930
en esto lo va a ejecutar ahora así que se te arnesto es la producción punto se sube noble

01:08:41.930 --> 01:08:48.470
pro que exactamente y en el file stream por favor producción ejecuta lo para ver

01:08:48.470 --> 01:08:59.990
está efectivamente listo bueno terminemos esto de esta forma vamos a descargar este

01:08:59.990 --> 01:09:08.490
archivo del s3 y lo vamos a subir a hadut y terminamos la parte s3 aquí y seguimos con

01:09:08.490 --> 01:09:13.150
la parte de progresamiento porque al final estamos haciendo una más almacenamiento vamos

01:09:13.150 --> 01:09:19.070
a descargar este archivo que se llama demográfico punto ccv y lo que vamos a hacer entonces es que

01:09:19.650 --> 01:09:27.490
vamos y lo montamos en hadut para esta parte vamos a crear un nuevo yo que va a ser el

01:09:27.490 --> 01:09:33.230
último la familia de s3 entonces voy por acá no ese no porque ya tengo poco en ese

01:09:33.230 --> 01:09:38.190
boque poco archivo en ese boque entonces no cobra eso cura cuando tienen no recuerdo

01:09:38.190 --> 01:09:44.250
cuando el límite pero en ese límite no me cobran nada pero si sigo subiendo ahí pero

01:09:44.250 --> 01:09:48.630
ya archivo mucho ahí nada más no llega ni a ni a dos megas llega ahí esa cantidad

01:09:48.630 --> 01:09:54.730
de archivos que están ahí bueno vamos a ver listo entonces vamos a lo siguiente

01:09:55.530 --> 01:10:00.930
vamos a crear el último yo que de esa familia tengo donde tengo acá

01:10:02.290 --> 01:10:12.250
y vamos entonces s3 a crear crear yo vamos a llamarlo yo descargar

01:10:12.250 --> 01:10:20.690
con el escor archivo s3 con el escor subirlo con el escor

01:10:22.550 --> 01:10:25.770
yo descargar archivo s3 subirlo a adulto

01:10:34.210 --> 01:10:39.930
y listo voy a aprovechar lo que tengo en este yo voy a copiar este te preyok y el

01:10:39.930 --> 01:10:43.450
sd connection los selecciono los copio y los pego acá

01:10:46.510 --> 01:10:48.730
y me copio también el te postyok

01:10:53.030 --> 01:10:56.770
listo control c y los pego aquí

01:11:00.290 --> 01:11:03.170
ya de este yo no necesito más nada los cierro aquí entonces

01:11:09.070 --> 01:11:12.530
copié del anterior el te preyok y el te postyok

01:11:15.130 --> 01:11:21.290
busque un hadu que te funcione yo voy a coger cualquiera y me voy a copiar el

01:11:22.430 --> 01:11:24.130
el connection de ese hadu

01:11:30.490 --> 01:11:35.050
voy a copiarme el connection que el primero que hicimos fue subir archivo

01:11:35.050 --> 01:11:40.990
en hadu un te un te connection si me voy a subir me voy a copiar este en

01:11:40.990 --> 01:11:45.890
subir archivo hadu hay un te s3 connection perdón hay un t hdfs

01:11:45.890 --> 01:11:48.290
connection y me lo voy a copiar

01:11:58.730 --> 01:12:07.570
un momento que se me es este t hdfs connection lo voy a copiar y lo voy a

01:12:07.570 --> 01:12:16.450
pegar en el yo que tengo aquí perfecto y lo conecto al t s3 connection

01:12:17.610 --> 01:12:22.290
significa que el te preyok su labor fundamental con un component ok

01:12:24.490 --> 01:12:30.410
aquí todo significa que todos quedarían en el subyok del te el te preyok las

01:12:30.410 --> 01:12:38.510
conexiones los otros seguido como voy a descargar un archivo del s3 y lo voy a

01:12:38.510 --> 01:12:45.750
subir al hadu de nada me sirve tenerlo en la máquina local entonces voy a

01:12:45.750 --> 01:12:52.090
colocar aquí un te file deleted para que me borre el archivo porque tengo

01:12:52.090 --> 01:12:55.570
que descargarlo en la máquina que estoy para después subirlo a hadu

01:12:56.790 --> 01:13:03.270
entonces voy a conectar este señor un component ok y después lo configuro

01:13:07.010 --> 01:13:12.590
agreguemos los componentes para descargar necesito un te s3

01:13:14.930 --> 01:13:17.890
te s3 get

01:13:19.730 --> 01:13:25.730
para subir a hadu necesito un t hdfs put

01:13:31.690 --> 01:13:36.990
perfecto vamos entonces al t s3 get y vamos a configurarlo

01:13:36.990 --> 01:13:42.130
dígale que vamos a usar una conexión existente y este componente por defecto

01:13:42.130 --> 01:13:46.230
seguidnos a la conexión tomo la que está por defecto listo entonces vamos

01:13:46.230 --> 01:13:54.070
aquí en el bucket boke donde voy a descargar archivos se llama noble pro

01:13:54.630 --> 01:14:00.810
que es el mismo que teníamos ahora y el archivo se llama así ya lo voy a

01:14:00.810 --> 01:14:06.110
colocar acá como este s3 está montada en linux tiene que estar exactamente

01:14:06.850 --> 01:14:10.570
igual en mayúsculas y minúsculas ya le digo cómo quedaría

01:14:10.570 --> 01:14:16.570
el archivo se llama te quedaría de esta forma demográficos

01:14:23.090 --> 01:14:29.890
demográficos puntos sv confirmo para ver demográficos y con la d mayúscula

01:14:29.890 --> 01:14:35.850
porque s3 está montada sobre el sistema de ficheros de linux entonces es en sigla

01:14:35.850 --> 01:14:37.130
mayúscula y minúscula

01:15:11.810 --> 01:15:16.610
control c y me queda el ki de esa forma demográficos

01:15:18.370 --> 01:15:19.490
puntos sv

01:15:22.730 --> 01:15:23.850
ahora lo voy a mandar

01:15:26.290 --> 01:15:30.170
no me coge no sé por qué no me coge demográficos

01:15:30.770 --> 01:15:36.610
puntos sv lo voy a mandar entonces a la carpeta que tenemos del root path

01:15:36.830 --> 01:15:43.210
voy a quitar y voy a referenciar el context como el context es una variable

01:15:43.210 --> 01:15:48.110
de configuración no necesita comilla doble entonces borro todo este y voy a

01:15:48.110 --> 01:15:52.810
llamar aquí context que venga antes de esto tiene que importar el contexto si

01:15:52.810 --> 01:15:56.910
no no me da voy a hacer contexto y dele importar

01:15:59.030 --> 01:16:03.310
los contextos que están a nivel de proyectos se importan a nivel del job

01:16:05.410 --> 01:16:10.910
ahora sí le voy a dar context en el tc3

01:16:14.730 --> 01:16:15.210
context

01:16:17.230 --> 01:16:21.170
no necesita comilla doble porque lo que va a tomar el valor de la variable de

01:16:21.170 --> 01:16:25.430
ruta raíz si le colocar entre comillas doble es lo que va a buscar es

01:16:25.430 --> 01:16:28.430
contexto punta ruta raíz decir no ahora no el valor si no va a colocar

01:16:28.430 --> 01:16:35.190
más ahora sí porque le voy a agregar ahora un eslas y le voy a colocar el

01:16:35.190 --> 01:16:41.390
nombre demográficos bueno voy a copiarlo de aquí mismo y

01:16:41.390 --> 01:16:44.370
entre comillas doble lo hago

01:16:44.370 --> 01:16:50.910
se haría de esta manera así te muestro acá en él

01:16:53.470 --> 01:16:58.930
ahí está esta es la variable de ruta raíz más la adición o le concaten o

01:16:58.930 --> 01:17:03.850
este valor aquí perdón perdón que sí se la dejó gracias se la dejado

01:17:03.850 --> 01:17:09.150
pensé que esa la habíamos definido no sólo definimos eso verdad entonces

01:17:09.150 --> 01:17:13.950
quedaría de esta manera gracias pensé que era la de esa la dejado

01:17:13.950 --> 01:17:21.290
muchísimas gracias en realidad quedaría se dos puntos en las ten así

01:17:21.290 --> 01:17:25.130
que pena muchas gracias sino no no no no hubiese dado nunca nunca lo hubiese

01:17:25.130 --> 01:17:31.250
encontrado quedaría así algunos tienen la temporal se llama

01:17:32.030 --> 01:17:32.730
temporal

01:17:34.830 --> 01:17:38.510
si tiene toda razón verdad que sí muchas gracias

01:18:04.170 --> 01:18:12.130
perfecto y aquí tenemos esta parte ahora voy a conectar este señor aquí

01:18:12.130 --> 01:18:18.270
con este de acá con un component ok significaría que estaríamos en el mismo

01:18:19.230 --> 01:18:22.570
suyo significa que terminado este descargar

01:18:22.570 --> 01:18:29.930
pasa al siguiente señor al fiente hdf puto vamos a configurar el puto

01:18:30.930 --> 01:18:34.470
usar conexión existente ésta me la deja en blanco me toca seleccionar la

01:18:34.470 --> 01:18:35.43001:18:37.810 --> 01:18:42.230
voy a escoger como directorio local temporal que es donde me va a quedar el

01:18:42.230 --> 01:18:51.510
archivo cuando lo descargue entén y coloco ahora sí context ahora sí ruta

01:18:51.510 --> 01:18:56.610
raíz ese sí va y aquí está ticamente bueno que podíamos hacerlo

01:18:56.610 --> 01:19:00.030
con variantes globales para guardar o con variantes de contexto pero aquí para

01:19:00.030 --> 01:19:03.750
rapidez vamos a hacerlo vamos a colocarlo fijo el archivo que va a

01:19:03.750 --> 01:19:07.810
descargar ahí es demográficos

01:19:07.810 --> 01:19:14.210
puntos sv y lo voy a llamar exactamente igual en

01:19:14.210 --> 01:19:16.750
cuando lo copias a dos

01:19:18.230 --> 01:19:23.790
pero creo que el componente está listo nos falta el te file delete

01:19:24.570 --> 01:19:29.990
vamos a ir al ht s3 get y vamos a copiar la ruta que nos da ahí donde

01:19:29.990 --> 01:19:37.030
copiamos el archivo sse dos puntos ten vamos al de file delete y pegamos la

01:19:37.030 --> 01:19:43.970
ruta es quítele la opción que falle si hay error error cuando puede ser

01:19:43.970 --> 01:19:48.630
cuando de pronto no borre el archivo pero bueno voy a quitarle eso que está

01:19:48.630 --> 01:19:51.810
ahí y vamos a darle guardar aquí si acaso

01:19:55.950 --> 01:20:02.190
sí y ejecutaría primero el tse 3 porque lo agregué primero es recuerde

01:20:02.190 --> 01:20:07.170
bueno es una pregunta es decir lo ejecutaría de forma secuencial porque

01:20:07.170 --> 01:20:12.770
para ejecutarlo al tiempo me tocaría ir a caestra y colocarle multitrea ok

01:20:12.770 --> 01:20:17.850
vamos bien ahí entonces ahora ejecutaría primero el tse 3 porque

01:20:17.850 --> 01:20:23.970
fue el primer componente que agregué pero si hubiese que nunca me haya puesto

01:20:23.970 --> 01:20:27.330
pensar eso exactamente entiendo

01:20:30.810 --> 01:20:35.110
me tocó ir al código pero hagamos algo porque la respuesta no la tengo

01:20:35.110 --> 01:20:39.170
clara de esta noche investigo esa pregunta que usted me ha hecho nunca

01:20:39.170 --> 01:20:42.670
lo había pensado si tiene razón porque es que sin tan

01:20:42.670 --> 01:20:46.150
desconectados como sé yo cuál fue el componente que quedó primero

01:20:47.070 --> 01:20:52.210
permítame esta noche averiguar para ver si si me da la encuentro la forma

01:20:53.550 --> 01:20:58.470
pero es claro que si hubiese cogitado el ths put iba que usar un error porque

01:20:58.470 --> 01:21:03.270
no iba a contar el archivo tengo que descansarlo pero si tiene razón

01:21:03.270 --> 01:21:08.570
bueno vamos a probar aquí quedó con esa pregunta para resolverla

01:21:08.570 --> 01:21:13.110
mañana resuelvo la del te agrega y test bueno aquí creo que todo está

01:21:13.110 --> 01:21:18.590
bien vamos a ejecutar para ver

01:21:22.890 --> 01:21:30.130
listo ya marcó ok en el tse 3 que y subió supuestamente el archivo veamos

01:21:30.890 --> 01:21:36.590
revisemos el sistema de fichero dejado a ver si me agregó un archivo

01:21:36.620 --> 01:21:43.660
nuevo en input ahí lo tengo y no debería estar este archivo en esta

01:21:43.660 --> 01:21:47.280
máquina local porque lo mandé a borrar voy a temporal

01:21:48.600 --> 01:21:52.820
definitivamente no está verifique para ver que todo esté correcto y si no se

01:21:52.820 --> 01:21:57.500
le puede agregar permiso desde acá desde tal nunca lo he visto creería

01:21:57.500 --> 01:22:02.620
con una altísima probabilidad que no pero déjeme y lo busco para ver pero

01:22:04.100 --> 01:22:09.380
no pero interesante la pregunta yo investigo esta noche también pero creería

01:22:09.380 --> 01:22:13.580
que no porque a ver la carpeta yo la coloqué con todos los permisos que fue

01:22:15.440 --> 01:22:19.820
777 esa carpeta se copia con los permisos que está ahí no creería que

01:22:19.820 --> 01:22:24.840
no pero déjeme investigar para ver creía que no eso es si les funcionó a

01:22:24.840 --> 01:22:29.100
todos revisen por favor el sistema de ficheros tiene su error jose

01:22:29.120 --> 01:22:32.860
para ver voy a acceder a tu máquina un momento

01:22:38.240 --> 01:22:45.400
ok lo que es en ese caso vete a tu t hd fd put si tiene razón pero fíjate

01:22:45.400 --> 01:22:49.520
vamos voy a volver a ejecutar el mío nuevamente

01:22:50.860 --> 01:22:55.800
y veamos y cómo solucionamos el error que más va a marcar

01:22:57.080 --> 01:23:04.360
listo ahí está listo aquí marca por qué porque aquí en este t h s put

01:23:05.040 --> 01:23:11.120
en el acto en un file yo le digo create entonces al crear solamente lo

01:23:11.120 --> 01:23:15.740
intenta crear nada más si está creado marca error entonces aquí la

01:23:15.740 --> 01:23:19.800
mejor opción es over white este que está aquí que si no está creado lo

01:23:19.800 --> 01:23:24.180
crea si no lo sobre escribe y aquí seguramente si yo vuelvo a ejecutar

01:23:24.180 --> 01:23:26.920
pues no habría ningún problema

01:23:33.180 --> 01:23:37.940
ahí está ahí el problema era la configuración del acto en un file

01:23:37.940 --> 01:23:45.760
listo perfecto hágame un pequeño favor mandeme inmediatamente mandeme lo

01:23:45.760 --> 01:23:51.720
del lo que tenga ahí que me quede registrado aquí el correo suyo del

01:23:52.600 --> 01:23:57.520
del caso de estudio de ayer porque me toca mandar más de lo que tenga no se

01:23:57.520 --> 01:24:01.940
preocupe yo lo después le agrego ahí pero la idea es que tenga aquí la

01:24:01.940 --> 01:24:05.440
evidencia de que me envió el correo

01:24:05.900 --> 01:24:09.500
si mándenmelo todo por favor lo que hace falta porque nada más tengo el

01:24:09.500 --> 01:24:13.800
de hector y el de catalina los demás no los tenga al momento y buscar

01:24:13.800 --> 01:24:17.180
algo de agua que hace calor bastante acá ya ven un momento

01:24:23.480 --> 01:24:29.820
bueno volví aquí a ver quién me mandó a ver bueno tengo los siguientes tengo

01:24:29.820 --> 01:24:36.920
a villegas villanueva tengo a navarro rorríguez tengo hernández hernández

01:24:36.920 --> 01:24:42.840
catalina y esto ya habían mandado faltarían algunos por favor antes

01:24:42.840 --> 01:24:49.000
hagamos lo siguiente en la máquina virtual por favor porque es importante

01:24:49.000 --> 01:24:57.080
eso váyase y conéctase nuevamente al hyper pi aquí en el escritorio

01:24:57.080 --> 01:25:00.000
hay pervi

01:25:01.300 --> 01:25:06.780
que creía que esa máquina bueno pero por si las dudas

01:25:06.780 --> 01:25:11.160
váyase a la máquina que dice que está ejecutando le da clic aquí

01:25:11.160 --> 01:25:18.060
clic derecho y le dice guardar eso debería guardar la máquina en ese

01:25:18.060 --> 01:25:23.660
lado el derecho guardar

01:25:23.660 --> 01:25:29.100
y debería dejar la máquina justamente en ese estado en que está

01:25:29.100 --> 01:25:34.240
por favor acá me llegó cano martínez

01:25:34.940 --> 01:25:43.100
y rodríguez villalobos es decir tengo 1 2 3 4 5 6 7 me faltan 4

01:25:45.380 --> 01:25:49.820
y tu apellido que estoy viendo aquí lo apellido es albares bueno tengo huerta

01:25:49.820 --> 01:25:55.960
tengo villegas tengo chávez tengo navarro hernández cano no de pronto

01:25:55.960 --> 01:25:59.300
está un poco más lejos acá te mandaron pues que demoró me llegaron

01:25:59.300 --> 01:26:03.380
dos aves que después me llegaron dos es como que demora para llegar y

01:26:03.380 --> 01:26:06.300
como que demora para llegar el caso estudio ayer y lo mandaste no sé

01:26:06.300 --> 01:26:09.520
quién me habló si lo mandaste bueno manda lo que tenga acá me llegó

01:26:09.520 --> 01:26:15.100
albares ahora sí ya me llegó albares ramírez bernardo demoraron como un

01:26:15.100 --> 01:26:20.600
tiempo para llegar y me faltarían cuánto me faltaría acá me llegó

01:26:21.500 --> 01:26:22.300
medina

01:26:24.840 --> 01:26:28.060
y me faltaría quien creo que me falta

01:26:30.200 --> 01:26:31.000
ok

01:26:32.940 --> 01:26:39.500
bueno el día de mañana para concluir esta parte de hoy entonces el

01:26:39.500 --> 01:26:46.580
día de mañana vamos con la parte de procesamiento porque hoy en día o el

01:26:46.580 --> 01:26:51.080
día de hoy nos dedicamos más que todo almacenamiento sobre el sistema hdfs de

01:26:51.080 --> 01:26:56.120
jadu aclaro que los ejemplos que tengo preparados pues se sirvan en el

01:26:56.120 --> 01:27:01.200
contexto de lo que hace normalmente uno sobre sobre archivos sobre

01:27:01.200 --> 01:27:06.520
digamos sobre el procedimiento en bit data pero la cantidad de filas no es

01:27:06.520 --> 01:27:09.420
tan grande porque tiene que tener en cuenta en que el closet de jadu lo

01:27:09.420 --> 01:27:14.060
tengo montado sobre una máquina virtual que tiene dos gigas entonces tiene que

01:27:14.060 --> 01:27:18.860
ser un archivo bastante pequeño en un ambiente real pues tiene muchísimas

01:27:18.860 --> 01:27:23.080
más máquinas para ejecutar y tiene más infraestructura pero al final el

01:27:23.080 --> 01:27:27.340
ejercicio que vamos a hacer es lo que usted hace típicamente con con

01:27:27.340 --> 01:27:32.100
ejercicios típico bit data lo único que noto y podía hacer una crítica

01:27:32.100 --> 01:27:38.460
con la herramienta es que la herramienta está más pensada para

01:27:38.460 --> 01:27:45.340
el procesamiento de bit data sobre archivos estructurales

01:27:45.340 --> 01:27:51.400
si me tocaría procesar algo no estructurado tipo un audio tipo vídeo me

01:27:51.400 --> 01:27:57.460
tocaría agregar un pequeño script para poder tokenizar algo que tenga ese

01:27:57.460 --> 01:28:01.820
audio o hacer algo que tenga el texto es para decir los limitantes de la

01:28:01.820 --> 01:28:04.480
herramienta de todos modos no sé si en la última versión del señor

01:28:05.240 --> 01:28:10.180
se habrá agregado algo con respecto a no estructurados

01:28:10.180 --> 01:28:15.360
pero listo entonces aquí eva tu apellido cuál es para confirmar que me

01:28:15.360 --> 01:28:18.940
llegó si es la que me habló

01:28:20.860 --> 01:28:24.500
bueno mendoza no me ha llegado todavía tengo medina alvarez rodríguez

01:28:24.500 --> 01:28:27.740
cano en andec navarro en mendoza no me llega hace cuánto enviaste que es

01:28:27.740 --> 01:28:33.180
raro bueno es por si las dudas aunque con bernardo a veces también se

01:28:33.180 --> 01:28:39.300
me queda y se demora un rato bueno dejamos el día de hoy hasta aquí y

01:28:39.300 --> 01:28:44.600
seguimos allá mendoza mendoza verdad si esto sí sí ahí está mendoza

01:28:44.600 --> 01:28:49.780
perfecto ya llego ya llego perfecto bueno nos vemos el día de mañana para la

01:28:49.780 --> 01:28:54.900
parte de procesing entonces listo si dígame si en esto te quedó en

01:28:54.900 --> 01:28:58.480
tu máquina no te preocupes yo esa máquina todavía puedo acceder el día

01:28:58.480 --> 01:29:01.280
de hoy ok yo hasta cuando se que no te cuente que que repete estaba lo

01:29:01.280 --> 01:29:03.460
sí tengo un archivo no pat

01:29:04.060 --> 01:29:07.340
es bueno huérpate ver el huérpal sería huérpal para agregar la imágenes de

01:29:07.340 --> 01:29:10.320
huérpal listo yo debería estar entonces abro huérpal que debería

01:29:10.320 --> 01:29:16.940
aparecerme entonces debería parecerme a el último archivo modificado

01:29:16.940 --> 01:29:20.660
cerremos aquí apaguemos la máquina esa entonces porque esta máquina la

01:29:20.660 --> 01:29:25.960
tengo con 15 gigas y consume bastante paga más uno para esta máquina

01:29:27.100 --> 01:29:28.220
apagar aquí

01:29:30.280 --> 01:29:34.420
listo apaga directamente cierra el talent y la paga

01:29:34.420 --> 01:29:38.240
no te preocupes entonces yo lo saco de ahí porque tú ya tengas de hacer la

01:29:38.240 --> 01:29:38.400
máquina