24:24
2025-01-27 13:13:59
2:06:12
2025-01-27 13:42:41
3:36:29
2025-01-28 09:08:14
4:33
2025-01-28 13:48:42
55:46
2025-01-28 14:06:51
2:02
2025-01-29 10:22:33
1:02:14
2025-01-29 10:25:14
2:10
2025-01-29 11:38:26
2:26
2025-01-29 12:03:00
1:23:37
2025-01-29 12:05:56
35:40
2025-01-29 15:01:26
1:40:43
2025-01-30 09:07:07
1:08:48
2025-01-30 11:20:20
1:10:50
2025-01-30 13:15:56
3:50:03
2025-01-31 07:20:07
Visit the Talend Big Data Integration y Ecosistema de Talend course recordings page
WEBVTT
-->
y lo volvemos a abrir nuevamente y aquí sí está el nombre del job que es
-->
transformaciones básicas versión 2 eso es un pequeño bot que tiene la
-->
herramienta no lo no lo ha corregido todavía
-->
ejecutamos aquí
-->
y ahora sí empieza a ejecutar de se cuenta que está en multi trea y todavía
-->
sigue ejecutando el primer sub job aún estando en multi trea porque hay una
-->
jerarquía de job entonces tú puedes jerarquitar su job de esta manera y
-->
sería mejor práctica si tienes varios sub jobs si hay la jerarquía pues
-->
evidentemente que las marque de esta manera porque así cualquier persona que
-->
vaya a leer el job ya entiende que se ejecuta primero que se ejecuta
-->
después y cómo están las dependencias de esos sub jobs
-->
perfecto creo que ya lo hicieron vamos a ver el caso de Beatriz creo que tiene
-->
un error mostré para ver si salió un error ahí extraño vuelva a ejecutar
-->
nuevamente para ver no ahí está ejecutando la versión anterior cierre
-->
ese sub job por favor, cierre el job perdón, cierre el archivo vuelvelo a abrir
-->
para ver el click para si lo tomo de se cuenta que ahí le aparece de
-->
ejecutar ahora ahí le aparece el run y el empertre bar en sí aparece ya la
-->
listo ahí lo que hemos modificado es la jerarquía para que ahora sí
-->
primero se ejecute el primero y después el segundo independiente que
-->
estén multitread por último acá visualicen lo siguiente veanlo a este
-->
lado no lo haga usted allá para ganar más tiempo la otra opción es que yo
-->
coloque no coloque un sub job sino un component ok
-->
significa que es lo siguiente cuando este componente se haya terminado de
-->
ejecutar correctamente se va a ejecutar esto de acá abajo si lo
-->
ejecutar con un component va a dar exactamente lo mismo con un sub job ok
-->
ya le explico por qué mira voy a volver aquí a ejecutar con un component y me
-->
va a dar exactamente lo mismo que un sub job ok vea que está primero
-->
terminando acá y después sigue acá porque un component para este caso
-->
funciona exactamente igual porque resulta que este componente para
-->
verificar que terminó correctamente tuvo que haber recorrido los 25
-->
registros entonces como él se ejecuta registros por registro al final
-->
ejecuta todo el flujo y tendría que terminar de ejecutar los 25 para que
-->
este terminara de la ejecución del componente pero normalmente que hace
-->
lo con un component que es diferente a un sub job quedado un componente en
-->
particular si ese componente se ejecuta de forma correcta pasa entonces al
-->
siguiente sub job esa es la diferencia fundamental que hay por otro lado aquí
-->
puede encontrar si te quiere agreguen un temesas box aquí tmsg
-->
tmsg box ese es para hacer una casilla de texto
-->
tmsg box
-->
y aquí hay una opción que dice el disparador o el sub job error las
-->
conecta acá ahí entenderá lo siguiente que si hay un error en el sub job
-->
manda a ejecutar el mesas box si no hay ningún error pues sigue su flujo
-->
normal en este caso pues no nos va a mostrar error porque la lectura del
-->
componente la está haciendo de forma correcta pero para eso que sirve recuerde
-->
la diferencia del sub job, el sub job termina el sub job completo y un component
-->
solamente ejecuta el siguiente sub job cuando el componente ya terminó de
-->
ejecutar de forma correcta esa es la diferencia que hay
-->
ya unió, Beatriz tiene que unir el primer componente con click derecho
-->
disparador voy a hacer el primer componente del sub job
-->
click derecho ahí sí
-->
disparador y on sub job ok
-->
tiene el tmsg box no ya está conectado está bien está conectado
-->
está bien está en rojo ahí está conectado está bien
-->
ah no perdón usted lo conectó con un regex, ese regex es para cosas diferentes
-->
haga lo siguiente bueno bien sirve para lo siguiente si hay una línea que
-->
está más conectada dele click en la línea roja que es la que queremos
-->
eliminar y dele suprimir selecciona el click creo que no lo ha seleccionado
-->
y ahí está creo que está seleccionado ya ya está seleccionado dele click entonces
-->
en el row 3 donde dice row 3 dele click dele ahora suprimir ahora sí
-->
vayas al primer componente click derecho vamos a disparador y vamos a un sub job
-->
ok perdón era error que pena era error
-->
porque un sub job que debemos hacer, dele escape click derecho disparador
-->
con su job error y lo conecta ahí perfecto ahí está bien
-->
esto solamente se ejecutaría siempre cuando haya cualquier error en el job
-->
eso es piensa lo que pronto tienes un job y quisieras mandarlo a un correo o
-->
a un celular que te manda un mensaje entonces para hacer cualquier
-->
actividad de mantenimiento como tal por último ya para mirar esta parte
-->
básica crees un nuevo job
-->
crear job que lo va a llamar job on the record integrador
-->
job on the record integrador te da finish
-->
entonces ya le mostré la forma en la cual tú puedes definir la jerarquía de
-->
ejecución de varios sub jobs de igual forma puedes definir jerarquía de
-->
cómo lo haces dos formas de hacerlo
-->
primera forma y vas a buscar un un componente que se llama troom de
-->
ejecutar troom job troom job
-->
troom siempre cuando vayas a configurar un componente en talent es lo mismo le
-->
da doble clic y te va a aparecer en la parte de abajo te debe aparecer la
-->
configuración de ese componente entonces aquí hay diferentes elementos
-->
aquí está lo que se llama trabajo dele aquí entonces al laito del text box
-->
hay un botoncito con tres puntos dele clic y va a escoger el job que quiere
-->
ejecutar ese componente espere que ahora que a veces demora un poquito
-->
aquí tengo axa básicos y voy a escoger yo transformaciones básicas 1.0
-->
ok ahí estamos en la configuración del job verdad doble clic
-->
aquí aparece una sección que dice trabajo para ese motivo trabajo
-->
aquí ven aquí sale aquí listo aquí en la configuración trabajo aquí está
-->
un text file y aquí está un botón con tres puntos le da clic para que
-->
escoja a que quiere referenciar ahí escoge el trabajo que fue el primero
-->
perfecto y la otra forma de hacer lo mismo es se va a repositorio y vamos a
-->
seleccionar el job que hicimos 2 que es versión número 2 clic sostenido y
-->
lo suelta de este lado
-->
aquí se aplica lo siguiente que está si está en multitread va a intentar
-->
ejecutar los dos jobs de manera paralela pero para ejecutarlo de
-->
manera jerárquica le da aquí en fila y de aquí hay un main y los conecta aquí
-->
y ahí ejecutaría primero el job 1 y después ejecutaría el job 2
-->
cualquiera de las dos formas bueno déle guardar eso no lo vamos a
-->
ejecutar pero eso es lo que hacen en la primera lo que hace es ejecutar
-->
su job dentro de un job y este ternón job lo que hace es que ejecuta
-->
y puede ejecutar varios yo que en un solo yo listo listo falta jorge falta
-->
te falta unir el los dos componentes en cual lo ejecutó
-->
este warning no aquí dice más que todo es no hay un esquema definido
-->
como si no
-->
aparece en el primero en el segundo no
-->
si pero si está definido no sé si guarden ahí no fundaría porque está
-->
ahora lo reviso para ver bien bueno ahora sí terminamos esta parte básica
-->
y nos vamos entonces a la parte de ahora sí vamos a entrar un poco en la
-->
parte del dato para trabajar con teclas y en la parte de la parte de
-->
entonces vamos a hacer lo siguiente minimiza esta ventana por favor de
-->
gesto abierto y yo tengo una máquina virtual en el cual tengo bueno un
-->
clóster pero ese clóster nada más tiene un solo maestro y un solo
-->
worker que está en una máquina virtual no armé un clóster completo
-->
porque en realidad no te lleva tenía poca máquina
-->
necesitaba necesitaba mucha infraestructura entonces vamos a lo
-->
siguiente en el en el escritorio vayas aquí al ícono que está al final de
-->
la primera línea y aquí hasta que se administró de hay para mí del doble
-->
clic
-->
a todos de aparecerle por defecto una máquina virtual que se llama a
-->
lo que le doble clic a ese jado que está ahí
-->
y él va a intentar entonces le abre una ventana para que inicie la máquina
-->
virtual dele iniciar por favor si aparece un
-->
warning de un punto de control dele continuar no hay ningún problema
-->
continuar
-->
a les de usted aceptar ahí en el caso de brenda no sé qué salió mucho
-->
para ver hoy nuevamente su máquina brenda un momento a ver
-->
voy un momento su máquina brenda por favor y déjeme yo ser
-->
a perdón creo que no creo que hay dos conexiones un momento
-->
no lo que hace que haya dos conexiones
-->
perfecto listo pero hemos que carguen entonces
-->
explico listo explico a mientras va cargando la máquina virtual voy a
-->
explicar lo que vamos a hacer entonces
-->
voy a pintar aquí un diagrama tenemos entonces lo siguiente tengo una
-->
máquina que es la máquina windows en esta máquina windows tengo el tal en
-->
big data como herramienta tal en big data que es la que tenemos montada
-->
ahora mismo en windows tengo el hipervisor de windows que es hay
-->
y en este hay que tengo aquí tengo una
-->
máquina virtual esta máquina virtual de aquí esta máquina virtual tiene montado
-->
un clóster de hadut con lo único es que ese clóster nada más tiene un
-->
worker no agrego más porque en realidad me lleva mucha infraestructura
-->
y al final pues tenemos 15 y que sería un poco más costoso la parte de
-->
la máquina o cada máquina porque entonces por por por hora y por recursos
-->
que consume la máquina entonces qué es lo que vamos a hacer al final este
-->
tal en big data se va a conectar a este clóster dejado y va a hacer
-->
operaciones sobre este clóster dejado listo eso es lo que vamos a
-->
hacer entonces vamos nuevamente a la máquina que ya tuvo que haber cargada
-->
y ahora dele clic en el usuario hdud el password es el mismo hdud pero en h
-->
minúscula hdud le da enter hdud en minúscula por favor
-->
perfecto ya cargo ahora hagamos lo siguiente entonces
-->
abra una terminal como lo hace se va el menú de los puntos que están en
-->
la parte de abajo
-->
y ahí le aparece la terminal aquí mismo que sería en la primera fila última
-->
columna
-->
y vamos a comprobar entonces conectividad para esto vamos a dar el
-->
siguiente comando va a colocar el estado de comandos aquí en un
-->
archivito que vamos a hacer vamos a ver primer comando vamos a darle el
-->
comando ip addr con doble de ip espacio addr
-->
bueno listo yo le voy a dar ip addr acá
-->
ip addr y aquí me salen entonces dos direcciones la
-->
look back que es la 127.0.0.1 pero me interesa la dirección que es 10.0.3.6
-->
en pocas palabras para completar este diagrama esta máquina que está aquí
-->
tiene dirección ip 10.10.0.3.16 esta es la ip de esta
-->
máquina de acá y como sé que la máquina está clonada la máquina
-->
windows debe tener la misma dirección para todas entonces voy a la máquina
-->
windows no sé si me hace el favor alguno que me haga la comprobación
-->
no creo que haya una diferencia voy a la máquina windows está acá
-->
algunos nada más voy a escribir aquí cmd
-->
y voy a dar comando ip config
-->
y todos deberíamos si no estoy mal cada máquina tiene la misma dirección
-->
yo tengo dirección 10.0.3.15
-->
cmd o power power shell la que tú quieras y colocas ip addr
-->
si voy a colocar el comando acá sería el otro comando y pequeño que
-->
ip config y pequeño y creo que
-->
la 10.0.3.15 verdad listo por favor vamos a probar conectividad
-->
tele pin comando pin y coloque 10.0.3.16 y debería responder la máquina virtual
-->
en ahí en el cmd por favor en la en cmd de windows coloque pin 10.0.3.16 y debería devolver
-->
entonces pin 10.0.3.16 perfecto tenemos respuesta listo no hay ningún problema
-->
a nivel de conectividad de redes vayamos nuevamente a esta máquina que está
-->
aquí a la de máquina virtual por favor se sitúa en la terminal le da con el
-->
mouse y ya aquí tengo instalado el cluster de hadut vamos a iniciar
-->
entonces ese cluster de cero entonces vamos a lo siguiente vamos a dar el siguiente comando
-->
si son tan amables por aquí lo tengo y se me perdió eso vamos a dar el comando todo en
-->
menos forma
-->
explico rápidamente entonces que hicimos ahí lo que hicimos ahí voy a buscar la gráfica
-->
recuerden que la arquitectura de claus se basa en master es clavo entonces el master
-->
de hadut lo llama name node o sea el master de hadut se llama name node y el
-->
walker de hadut se llama datanode lo que estamos haciendo es que estamos formateando
-->
el cluster de hadut es decir si ahí había en archivos lo formateamos ya eso es lo que
-->
estamos haciendo listo seguimos entonces vamos a levantar dos servicios vamos a levantar en
-->
la instancia vamos a levantar el servicio para el almacenamiento distribuido con hdfs para eso
-->
va a dar el siguiente comando va a dar start de iniciar en inglés guión de fs punto sh entonces
-->
start guión de fs punto sh e intenta subir unos demonios recuerde que el concepto de lino el
-->
demonio es lo mismo que hablamos en windows como servicio son procesos que se ejecutan en
-->
background siendo que como se cambia el sistema operativo hay veces que se cambian los nombres
-->
no sé fernanda si si te ejecutó bien nuestra parada de fernanda voy a tu máquina
-->
si espacio dale flecha arriba flecha arriba flecha arriba para hacer para recuperar el
-->
vuelve con flecha izquierda y bueno y borras ahí listo perfecto enter perfecto listo cuando
-->
termine de ejecutar va a ejecutar ahora un comando que es un servicio que se llama el
-->
servicio de ya ya el servicio que le va a permitir poder compartir los recursos entonces
-->
aquí está estar ya punto sh ya con g y termina en rn punto sh entonces le damos aquí estar
-->
ya punto sh
-->
esto nada más lo vamos a hacer una sola vez perfecto listo
-->
cuando termine hay un comando que le va a permitir verificar cuáles
-->
servicios de nacionados con con jadu que están arriba el comando es jps
-->
jps
-->
y debería tener 1 2 3 4 5 bueno 6 con el jps servicio arriba bueno 6 demonios arriba
-->
uno que es no resource managers secundaria y no jps de no y no maya no un manager
-->
a betis parece que te veo menos a ti un momento y a tu máquina algo raro en el tuyo no le veo
-->
el no no lo veo permíteme accedo a tu máquina un momento se me hace raro que
-->
voy a intentar bajar los servicios por favor ahora dele el siguiente comando los que terminaron
-->
por favor vamos a verificar el tuvo que haber abierto unos puertos para los servicios
-->
entonces démosle el comando net está menos punta por favor esperan un momento por favor
-->
si aquí lo subió este que no dice no bueno yo voy a dar el comando aquí mientras termina
-->
acá con net está menos punta
-->
ven aquí sigo va a tener que ampliar para poder verlo bien aquí amplié esto para
-->
que se lo vea mejor aquí confirme que tenga abierto el puerto 98 70
-->
necesito dos puertos abiertos a claro a modo informativo el 0 0 0 que está indica ahí
-->
significa que cualquier máquina de la red se puede conectar a este puerto si aparece 127
-->
indica que solamente la máquina local se puede conectar entonces me interesa que
-->
verifique que tenga el 98 70 aquí abierto y el 9000 abierto que son los que necesito
-->
inicialmente para comprobar si quieres no comprueba comprobamos de esta forma
-->
esa windows ahora abre el browser de su preferencia el que usted quiera yo voy a abrir
-->
entonces hech y va a colocar la siguiente dirección va a colocar 10.0.3.16 dos puntos
-->
puerto 98 70 voy a parar a voy a coger jps que raro el caso suyo voy a comprobar
-->
un momento veatriz 10 puntos a comprobar acá el caso mío para ver
-->
listo aquí debería aparecer esa ventana el caso suyo batriz voy a sumar nuevamente que no sé qué está pasando
-->
aquí hay algo que pasó no sé
-->
vamos a intentar hacer un formateo para alguien más tuvo problemas para subir esto no sé de pronto
-->
alguien más voy a verificar aquí las pantallas bueno veo veatriz hizo brenda no sé si probó ya
-->
para ver si le funciona fernanda no sé si coloca la dirección en el blog se para ver 16 no 16
-->
sería estar 16 listo abre el browser que usted quiera desea este hecho ahora cron el que usted
-->
quiera y coloca esa dirección que está ahí perfecto entonces en la barra direcciones coloque
-->
10.0.3.16 dos puntos 98 70 perfecto
-->
este fue el pequeño problemita que faltó un menos parece a mí que ese fue el error
-->
me esperan un momentico por favor los demás mientras solucionan que un problemito
-->
bien esto lo hacemos nada más una sola vez perfecto listo
-->
perfecto bien vamos todos entonces ahora estamos aquí en esta ventana listo bueno
-->
esta es una ventana de la información de clósteres a dos si usted quiere vayas aquí
-->
donde dice data nodos un nuevo de datos note que nada más hay uno entonces prácticamente
-->
lo que tenemos en la arquitectura montada tomando esta gráfica es como si tuviese
-->
este clóster pero nada más estos workers no están aquí nada más hay un solo worker tengo
-->
una y no y tengo un solo worker casualidad que están en la misma máquina por buena práctica
-->
pues no debería estar en la misma máquina pero listo esto es lo que tengo configurado
-->
actualmente vayamos entonces no voy a meterme en detalle con esta parte vayamos lo que me
-->
interesa en la última opción que dice utilities hay una opción que dice bros de
-->
system que me queda ahí por favor utilities la última en el menú horizontal que está en la barra
-->
utilities le da click ahí y le da un browser listo ahí debe aparecer que está vacío ok
-->
por último ya para finalizar la configuración en la máquina virtual vayas nuevamente en la
-->
máquina virtual y va a dar los siguientes comandos se me tocó volverme a loguiar a
-->
todo el minúsculo
-->
va al siguiente comando entonces va a escribir hdfs hdfs de sistema de ficheros dfs o con el
-->
menos este que puede estar ese no sale directamente es las vamos a crear una carpeta que se llama
-->
así y por último después de esto le da este mismo comando hdfs para darle permisos
-->
vamos a crear una carpeta para poder organizar los archivos que vamos a trabajar con el
-->
tal en big data fernando voy a ver que creo que le salió algo raro está
-->
si hay un espacio exactamente de flecha arriba por favor para ver el comando
-->
si hay un espacio exactamente por eso es que los que estudiamos esta carrera nos volvemos
-->
cuadriculados sin el espacio no funciona sin el menos no funciona de lente por favor perdón
-->
aquí aquí hay un comando está raro este comando aquí que pena si es ese
-->
ahí corregí el comando porque es ch mod 77 de flecha arriba y cambia el ch dir y le
-->
equivoqué 777 entra hoy el f5 ahora al browser en el edge el que tiene abierto en windows
-->
el f5 momento debería apreciar la carpeta perfecto la carpeta no no voy a proceder
-->
entonces a hacer esto acá en mi máquina sería ch mod dfs menos m cadir es las axas
-->
minúsculas perdón aquí dfs hdfs
-->
y después le hago un ch mod con 777 ch mod 777
-->
listo perfecto entonces cuando termine de hacer esto le da f5 acá en el windows
-->
y debería aparecer entonces la carpeta que creo allá falta todavía alejando que es el
-->
último comando que hace falta y continuamos entonces te pongo el comando del sachet
-->
aquí te lo colocó alejando nuevamente la pantalla sería lo mismo pero cambia el m cadir por ch mod
-->
y le agrega el 777 bueno continuamos entonces ahora sí vamos a utilizar el talent big data
-->
váyase ahora sí a herramienta el talent big data
-->
cierre por favor los chocs que tenga por ahí que pronto le van a causar confusión
-->
y ahora voy a hacer lo siguiente entonces vamos a crear en la carpeta kiaxa vamos a
-->
crear una subcarpeta y esta voy a colocarla como jadut el talent big data entonces creamos
-->
una carpeta listo jadut talent big data sobre la carpeta jadut vamos a crear un job
-->
y lo vamos a llamar job on the record subir
-->
on the record archivo on the record jadut no voy a agregarle propósito de descripción
-->
porque me desgasta mucho entonces es como buena práctica ya tenerlo en cuenta pero
-->
por cuestión de tiempo nada vamos a colocarle job on the record subir on the record archivo
-->
on the record jadut le damos aquí finish para que nos cree listo en el dado finish
-->
bien hay diferentes formas de hacer esto voy a tratar de dar varias no puedo dar todas
-->
porque se me quedan después los los ejemplos vamos a buscar los siguientes componentes vamos
-->
a buscar un componente que se llama thdfs si usted quiere se va acá a la paleta va
-->
donde dice hdfs y va a encontrar los mismos componentes que voy a escribir yo acá como
-->
ustedes se hacerlo o los busca de este lado o los consulta acá ahí me gusta más buscarlo
-->
de este lado pero si usted quiere pues puede ser de varias formas vamos a buscar uno que
-->
se llama thdfs thdfs connection ese thdfs connection lo que hace es que hace una conexión
-->
a un sistema de ficheros hdfs hdfs connection vamos a agregar ahora lo siguiente vamos a agregar
-->
otro componente que se llama thdfs put aquí un tema esa voz que ya lo veíamos pero vamos
-->
a configurarlo cuando lo configuramos por si acaso hay algún error evidentemente el mesa
-->
vos carece de sentido porque tendría más sentido que mande un error ya sea un correo
-->
o a un sistema de issues que disidencia que maneje pero bueno para verlo aquí gráficamente
-->
vamos a agregar aquí un tmsg vos continuamos entonces ahora vamos a unir los diferentes
-->
componentes y después los configuramos entonces lo que hace este hdfs connection lo que va
-->
a hacer es conectarse a un sistema de ficheros después que me conecte voy a intentar subir
-->
un fichero para esto entonces voy ya como sería ya todos los componentes va a ser
-->
igual es cual la forma en que lo quiere conectar a mí me gusta más el componente
-->
clic derecho voy disparador y vamos a escoger un component ok y une el tema esa voz con
-->
el t-connection con un t o un component error disparador t o un component error
-->
procedamos entonces a configurar los diferentes componentes primero vamos a configurar el thdfs
-->
connection dele doble clic Beatriz tiene que seleccionar la mitad en toda la mitad
-->
del componente o sea de clic exactamente en el icono ahora si clic derecho disparador y ahí
-->
escoge un component error y ahora si lo conecta perfecto dele ahora después que termina y le
-->
da doble clic al thdfs connection para configurarlo recuerde para darle con para
-->
configurar siempre damos doble clic y vamos a configurar el componente listo cada configuración
-->
de los componentes en tal en es claro que varía dependiendo de lo que tú quieres hacer
-->
entonces ahí la configuración pues no es única para todos vamos entonces aquí nos pregunta
-->
el en la parte en la perspectiva de abajo nos pregunta la distribución resulta que hay
-->
diferentes distribuciones de jadut así como hay diferentes distribuciones de gene ulinus
-->
tofedora existen diferentes distribuciones para jadut entre esas las más importantes
-->
tenemos claudera y horton pero claudera compró a horton y dentro del esquema del señor
-->
aws tenemos a amazon emr como esta es una distribución particular no es una distribución
-->
ya de estos señores de ya sea de emr de horton vamos a hacer lo siguiente donde dice
-->
distribución dele clic por favor y va a escoger la que dice universal ahí aparece
-->
también la de ashur pero me interesa la que dice universal lo deja por favor en versión 3
-->
y note que automáticamente le define un esquema c hdfs listo vamos a configurar ahora el
-->
no el no es el no do maestro de una arquitectura de un clóster de jadut hay lo único que hay
-->
que hacer es cambiar la dirección ip donde se encuentra este clóster si ese clóster tú lo
-->
tienes a nivel de la nube ahí colocarás la url donde se encuentra ese clóster sea en ashur o
-->
sean aws o en horton el que tú quieras entonces voy a colocar aquí en grande algo muy particular
-->
porque esto viene de java entonces voy a colocar este señor aquí en uno para que entienda
-->
lo siguiente resulta en que la cuando vas a definir un texto en algún componente de
-->
talent la mayor parte de las veces nada te va a decir una sola vez en el cual no se aplica
-->
esto ahora te la digo cual en la mayor parte cuando es textual lo que vas a configurar tienes
-->
que meterlo entre comillas dobles porque entre comillas doble porque él al final transforma
-->
en java y java un string es comilla doble entonces de esto que está aquí vas a quitar
-->
la palabra localhost esta que está aquí y vas a colocar la dirección ip donde está el
-->
clóster que sería 10.0.3.16 te quedaría así como estoy mostrándolo aquí voy a quitar
-->
este señor de acá entonces perdón voy a copiarlo y lo voy a sobre escribir aquí
-->
sigo acá perfecto 316
-->
aquí vienen dos elementos que es la parte de autenticación la parte de autenticación
-->
hay unos sistemas autenticación tipo carveros que son muy buenos definen un token para en este
-->
caso de ese cuenta que yo cree la carpeta y le cree un chemos 777 de tal forma que
-->
tenga cualquiera permiso de acceder pero si tiene esta autenticación tendría que
-->
especificar las credenciales en la parte de abajo este no es el caso porque lo dejé abierto
-->
la configuración para que no pidiera ninguna credencial entonces carece de sentido la
-->
configuración que está ahí pero ahí colocaría lo de las credenciales correspondiente listo ahí
-->
no hay ningún problema ahí termina la configuración de la conexión ahí eso es lo que entabla es una
-->
conexión hacia el clóster vamos a configurar ahora el componente para subir ficheros dentro
-->
de lo que es el clóster date cuenta que ya yo me sé los componentes te los colocas y
-->
no sé es a mí me ha fusionado las dos prácticas una práctica que cuando tengo tiempo libre estudio
-->
digamos en detalle los componentes y me acuerdo de un componente y lo otro me da la práctica
-->
pero vuelvo repito a nivel de metodología carecía sentido en que yo me pusiera tres horas
-->
a describir componente por componente entonces voy directo los componentes mejor vayamos
-->
entonces al put que como su nombre dice pone un archivo en el sistema de ficheros
-->
vamos a darle doble clic
-->
y ahora aquí tú tienes una opción de volver a configurar la conexión pero como ya yo ya yo
-->
la configuré vamos a usar una conexión existente entonces notarás que aquí debajo
-->
del property type hay un chulito de una opción que dice usar conexión existente chuléala
-->
por favor es importante que es cojas en el combo voz de la lista de componentes dale
-->
clic ahí y te debería aparecer todas las conexiones existentes en el job que sería esta
-->
perfecto listo está dele doble clic a la conexión del hdfs putos no sé si le
-->
hay ya de que me dijo veatriz puede ver que no me habló brenda a brenda que pena no me
-->
conozco hoy a las dos a un momento dele doble clic está en la si se da cuenta
-->
está donde dice hdfs con está en el componente hdfs conécteo tiene que ir la configuración
-->
del componente hdfs está bien está bien a mi pantalla si mira mi pantalla un momento
-->
note que cuando yo doy doble clic aquí en la parte de arriba me aparece en que componente
-->
estoy dele doble clic aquí al hdfs puto para cambiar la configuración doble clic en el centro
-->
y ese cuenta que está y le parece ahí usar conexión existente o el property type listo ahí
-->
aparecer entonces hay escuas y están amables component list ahí dele clic ahí hdfs conexión
-->
perfecto listo permítame comprobó aquí algo de permítame comprobó algo aquí del sistema
-->
de ficheros momento para que sea más fácil hagamos lo siguiente pero no tenía que escribir
-->
vayas a la carpeta de recursos que está en el escritorio recursos en tbd data sets ccv
-->
escoa todos los archivos que están ahí menos el genre
-->
copie pegue en temporal aquí en esta carpeta ten
-->
esos tres que están ahí en re está en escritorio recursos los todos se sube data set ccv
-->
se sube y escoja todos menos el genre y los coloca en la carpeta tengo que yo creo que
-->
esto me funcionaba bueno para que hice eso bueno al final ya sé para qué lo hice
-->
bueno aquí el local director y darey por favor aquí en el en los botones que están
-->
acá el último botón que aparece para los tres puntitos para escoger una carpeta escoja la
-->
carpeta ten seleccionar carpeta quería demostrar algo pero al final creo que no no era necesario
-->
lo muestro ahora ten una cosa particular y esto ya va en ese caso de ese cuenta que la
-->
ubicación está de esta forma c2 punto es la ten el separador es a veces me pierdo si
-->
este es la inverso en las buenas entonces creo que es inverso no sé en caso este
-->
el separador típico de linux o de sistemas unix de unix y linux pero entonces en windows
-->
normalmente recuerde que windows lo tiene de esta manera c2 puntos así perdón se me así
-->
sería en windows en este caso en particular cuando es las de esa forma ahí le marcaría
-->
un error porque para yaba cuando ese es la esta forma hay que colocarlo doble porque
-->
este carácter de el carácter especial de yaba entonces las dos formas si es
-->
tiene que ser dos porque si no sale un error de compilación bueno continúo entonces váyase
-->
ahora al hdfs directory dele clic ahí en los tres puntos y debería conectarse vamos a ver
-->
aquí me pide que me instale unos componentes esperamos que no haya ningún tipo de error
-->
acepto listo lo y finis
-->
va a intentar conectarse y debería mostrarme el sistema de fichero que tengo en la máquina
-->
virtual que es con hadut en este caso lo voy a mandar a axa escoja entonces el folder de
-->
axa aquí ok perfecto escoja axa ahí está en axa es que coger axa y debería aparecer acá
-->
espera un momento que algunos le termine de configurar algunos componentes dele clic
-->
veatriz en su caso bajar a instalar el download a incisal abajo el de abajo el de abajo ese que
-->
está ahí dale acepte todo por favor y ahí escoja por favor si están amable axa exactamente
-->
ok continuamos entonces ahora he definido la carpeta de entrada y la carpeta de salida
-->
ahora por favor vamos a agregar los archivos que quiero subir en la parte de abajo dele por favor
-->
si están amable en el más y vamos a subir los siguientes archivos vamos a subir el archivo que
-->
se llama producción pero antiguo que se me escapó el nombre se llama production.csv esta
-->
en inglés production production.csv y te pregunta ese el de entrada cómo quiere
-->
llamarlo en el de salida en este caso en particular pues puede llamarlo exactamente igual
-->
listo voy a agregar otro archivito aquí que sería el que se llama fill actor fill
-->
recuerde que en el caso particular de windows no hay problema no es sencilla los nombres de
-->
archivos pero en el caso del señor linux y unis hizo sensibles fill actor.csv
-->
y voy a hacerlo exactamente acá y el último sería super market on the record sales
-->
hubiera sido mejor copiar el nombre del fichero verdad super market on the record sales.csv
-->
te quedaría la configuración de esa manera revisa por favor que los nombres coincidan
-->
exactamente porque si no va a salir un error entonces al ejecutar perfecto termina entonces
-->
de configurar el tema es a vos entonces te pregunta el título que quieres que aparezca
-->
en la casilla de texto voy a colocar aquí error error hadut como título el título tiene que
-->
estar entre comillas doble porque va a ser un stream encierra entre comillas doble porque
-->
si no encierra sale un error entonces entre comillas doble es el mensaje voy a decir error
-->
de conexión al cluster hadut
-->
vamos a proceder a ejecutar dese cuenta que acá en este run de acá aparezca el nombre del job
-->
voy a ejecutarlo de forma diferente me voy acá a la pestaña de la perspectiva de acá abajo
-->
de run y aquí me aparece un botón que se llama run verifica que el nombre del job coincida
-->
con el nombre del que quieres ejecutar vamos a darle aquí run
-->
ahí lo que está haciendo es que genera el código java para poder ejecutar listo empieza
-->
la ejecución para algunos y termina sin ningún tipo error para confirmar que todo
-->
esté bien se van al browser entran a la carpeta axa y deberían estar los archivos
-->
migrados al sistema de ficheros entre la carpeta axa entonces de aquí puedes migrar lo que tú
-->
quieras como hablamos de variedad aquí estamos hablando de almacenamiento tú podrías mandar
-->
una imagen un audio al sistema de ficheros ya automáticamente el maestro se encarga de tomar
-->
el archivo y dividirlo en varias partes noté por ejemplo que ahí tengo una replicación de
-->
3 y tengo un tamaño de bloque de 128 en pocas palabras el archivo se divide en bloques
-->
128 y se reparten los diferentes nodos como solamente hay un solo nodo pues ahí no hay
-->
problema replicaciones que ese archivo se guarda tres veces por si acaso hay algún error perdón
-->
el bloque de se guarda tres veces por si acaso hay un bloque que causa errores no se pueda
-->
recuperar en un momento determinado perfecto listo lo sé si acudo es el error no sé si
-->
si funcionó vamos a esperar para ver creo que a todos me parece que ya le funcionó voy
-->
el caso suyo fernanda que tiene un error allá voy a ver para ver pero
-->
ah listo pasa lo siguiente fernanda se me escapó esto todos acá que lo entiendo que
-->
dice fernanda aquí en el put yo coloqué en el put noté cuenta que yo creo que el
-->
action file en create significa que si yo vuelvo a ejecutar este job si lo vuelvo a
-->
ejecutar este yo voy a tener un error porque va a intentar crear un archivo que ya está allá
-->
entonces qué me tocaría hacer ahí aquí sale está el error que me tocaría hacer aquí si
-->
hay algunos archivos que voy a sobre escribir lo mejor entonces es cambiar el create por
-->
overwrite y ahí los que están ahí los sobre escribe y los nuevos pues los copiará en el
-->
caso suyo fernanda por favor cámbiale a action file y esto lo que haría sería que
-->
volvería a ejecutar sobre escribiría los archivos y los que sean nuevos lo volvería a crear
-->
voy a su voy a su equipo para ver si error tiene ahora sí revisa por favor su carpeta
-->
si está amable el f5 ahí ahí está perfecto ahí está
-->
listo perfecto vamos entonces a lo siguiente ahora vamos a crear aquí un nuevo yo crear yo
-->
y este yo que lo voy a llamar entonces yo leer
-->
archivo jaud listo leer archivo jaud finish
-->
ahora tengo un pequeño si nota un poco la forma de este yo
-->
este yo me queda poco flexible porque porque la conexión está dependiendo netamente de esta
-->
si la url me cambia entonces me tocaría entrar al yo cambiar la url y bueno y ejecutar entonces
-->
entonces para eso es que existen las variables de entorno para flexibilizar entonces la
-->
configuración de los yo así mismo como estemos al desarrollo entonces para esto vamos ahora a
-->
ver a en el repositorio vamos al menú de contextos por favor context ahí está context
-->
debajito de yo design debajito del yo design context seleccionamos aquí vamos a darle clic
-->
derecho y voy a decir que voy a crear un grupo de contexto aquí que está aquí y lo voy a
-->
llamar axa se lo coloqué con a mayúscula vamos a darle aquí entonces next y aquí le
-->
coloca los ambientes que vaya a trabajar usted para confiar los ambientes notará que
-->
aquí está un table en la parte superior del table horizontal aquí la parte derecha hay un
-->
más ese más que está ahí le va a permitir configurar los diferentes ambientes entonces
-->
vale aquí clic vamos a generar un nuevo ambiente este lo voy a llamar producción
-->
ok
-->
y el default lo selecciono y lo voy a editar ahora edit y lo voy a llamar cua
-->
ok y escogemos por defecto que el entorno por defecto va a ser cua es el que está ahí definido
-->
pero tú puedes cambiar la producción en este caso sería cua vamos a darle aquí ok listo
-->
vamos a crear entonces ahora una nueva variable les espero algunos que todavía están listo
-->
ahora vamos al más que está acá bajito este más de acá abajo me permite crear y el de aquí que
-->
está la mitad vamos a darle aquí un más ese que está aquí y me pregunta entonces ahora
-->
lo siguiente el nombre de la variable entorno que quiero manejar en este caso le voy a llamar
-->
entonces url on the record cluster on the record hadith
-->
me pregunta el tipo de datos y los tipos de datos que van a aparecer son específicamente
-->
de java no cambio porque me interesa que sea string el tipo de datos me pregunta si
-->
quiero un comentario y me pregunta ahora para que especifice los valores para cua y para
-->
entonces para no tener que copiar eso vamos a darle aquí un momento finish
-->
se va al job que se llama subir archivo hadith y vamos a copiar la url que está ahí la del
-->
hdfs cópies eso que está aquí por favor copiar va nuevamente a la variable del grupo de
-->
esto que creo él le va a decir que va a editarlo editar next y va a pegar ese valor debajo del
-->
valor de cua y por favor aquí hay algo particular que aunque esto sea string en
-->
esta parte específica no requiere comillas doble y si la colocas a un error porque
-->
está así no sé pero está así entonces quitéle las comillas doble al fin al inicio y al
-->
final listo y si desea copia eso y lo coloca en producción es claro entonces en
-->
producción es claro que en producción vas a colocar un IP diferente pero como no tengo
-->
un cluster adicional pues voy a dejar la misma dirección para hacer la prueba cambie
-->
para hacer una prueba que se me ocurrió ahora cambie la dirección 16 por 17 por favor si
-->
están amables 16 por 17 a ver si sale si mando un error ahora 16 por 17 y le da finish
-->
ok
-->
me voy a ubicar entonces en el en el job a este viejo que tengo aquí voy a concentrarme
-->
en el de leer archivos a dos listo voy a hacer entonces de forma diferente voy a
-->
crear aquí ahora voy a agregar un archivo que se llama thdfs input de fs input el put es
-->
para agregar y el input es para leer thdfs recordará que la conexión en el pasado la
-->
hice en el thdfs connection esta la voy a hacer directamente en el componente como voy a hacer
-->
aquí primero voy a coger como distribución universal y ahora deseo usar la variable de
-->
contexto que tengo como se hace aquí cuando note lo siguiente que aquí tengo un contexto
-->
en el repositorio y tengo un contexto a nivel del job en él en la perspectiva que está abajo
-->
entonces el tale maneja dos tipos de contexto un contexto a nivel del proyecto que esa puede
-->
ser compartido con diferentes job o poder con textos muy particulares de cada job si tú sabes
-->
que los contextos lo vas a utilizar en diferentes elementos de los job lo mejor es
-->
que lo haga de tipo project o sea de este lado si es una variable que es muy particular
-->
del job la puedes crear en los contextos de estos que están acá entonces pasa lo siguiente
-->
en esta perspectiva situate en context por favor aquí lo que dice context al
-->
ladito casi el del componente y qué vamos a hacer vamos a importar los contextos que
-->
tenemos a nivel del proyecto lo tengo que importar al job para eso aquí a donde están
-->
los botones de acá abajo que hay un más un x aparece con una pequeña limita con un
-->
y ahí te debe aparecer todos los contextos que están a nivel de proyecto nada más hay uno
-->
porque fue el que creamos entonces voy aquí cojo ese señor ok selecciono todas las variables
-->
de los entornos y le doy ok y me hace el import para que pueda usar esa variable dentro
-->
de este elemento que está acá perdón alguien me habló pero no sé si la si fue que no lo
-->
escuché bien a ver si me puede hablar un poquito más duro que no sé por qué perdí
-->
no lo escucho muy bien no sé si le escuché por muy bajito que soy yo no usted soy yo
-->
si alguien me puede de pronto alguien puede repetir la pregunta que la escuché muy
-->
bajo verdad no sé si alguien no
-->
lo que pasa es que aquí listo si no la tiene ahí ya estoy viendo sí entonces voy a
-->
ver lo siguiente se le perdió la configuración y esa pesaña donde está ahora hoy entonces aquí
-->
estoy en su máquina ok ventana aquí hay un show y voy a buscar aquí contexto le doy doble clic
-->
aquí está ahora sí es que como que de pronto la cerró aquí y cuando hay una ventana que
-->
se me pierde entonces tengo que ir acá show y busco la ventana en particular que la
-->
de contexto y ya es la hora ahora sí sí ya entendí ahora haga el import que sería en la
-->
desde clic aquí en este botoncito el que está al ladito del más aquí por aquí hay
-->
un botoncito ese que está ahí para que importe el perfecto listo entonces ahora
-->
vamos entonces a la configuración del hsb input borre ahora todo lo que está en el
-->
eso que está ahí y va a colocar la palabra con le da control espacio control espacio y ahí le
-->
va a aparecer todas las variables de contexto que están definidas en ese yo entonces la
-->
variable de contexto que me interesa es la que dice context punto urel cluster y la pego ahí
-->
cuál es la ventada de usar variable de contextos en que ahora si hay un cambio nada más hago en
-->
la variable de contexto y automáticamente afecta la dependencia de esas variables es lo que
-->
mencioné alguna vez que es reutilizar veatriz voy a su venta en un momento que ahí está sí ok
-->
de ley veatriz estoy su venta ok ok seleccione ahí chulé ahí listo ok perfecto vamos a
-->
configurar ahora el componente t hd fe input dele doble clic es el componente t de exactamente
-->
se ubica donde tiene no urión está hd fs localhost y borra todo lo que tenga el borra todo eso
-->
ahora escribe con el edad control espacio con cebo en
-->
faltó la c la c o n control espacio ahora y ahí le aparece en toda la
-->
escuela por favor perfecto entonces como venía diciendo la ventada de la variable de contexto
-->
es que si hay un cambio en la url nada más lo haría en la variable de contexto y automáticamente
-->
afectaría a todos los yo que dependan de esa variable entonces ahí flexibilizo más mi código
-->
listo ahora voy a proceder entonces sí dígame a listo perfecto buena pregunta porque cuando usted
-->
vaya aquí en el rum cuando usted lo vaya a ejecutar en el rum aquí tengo las opciones
-->
que son cua y producción listo entonces tú escoge ahora en un sistema en el caso de ustedes
-->
las ejecuciones no se van a hacer directamente en la máquina sino ustedes van a tener un
-->
sistema que se llama el tmc el manas console que tú subes el job a ese manas console y
-->
te lo ejecuta allá arriba en el clóster o donde tenga montado el tmc pero lo que si es seguro
-->
que la confesión la toma de aquí cuando tú especifica esta parte acá listo sigamos entonces
-->
ahora resulta pasa ya acontece en que lo que va a intentar hacer este yo es leer este
-->
archivo pero este archivo está estructurado por lo tanto necesito definir la estructura del
-->
archivo en pocas palabras voy a leer en este caso en particular voy a leer este filáctor que
-->
está aquí este filáctor voy a mostrarlo aquí directamente aquí este señor que tengo que
-->
definir la estructura de este filáctor por ejemplo que hay una columna aquí que el
-->
nombre coincida va y venga pero sé que tengo que especificar una columna las columnas que
-->
acá lo más posible sería que sea el mismo nombre entonces una forma de hacerlo de hacer
-->
esta parte sería lo siguiente sería lo siguiente aquí vaya la confesión del hdf input que está
-->
aquí y aquellos componentes de talen que de una u otra forma tienen que tener una estructura
-->
para poderlo leer como el caso un ccv un jason una tabla van a encontrar quizás en
-->
diferente ubicación pero siempre vas a encontrar una opción que dice editar esquema
-->
si tú le das aquí clic aquí entonces tú puedes definir el esquema que coincida con el
-->
archivo que tú vas a leer aclaro si le hacemos manual esto es muy engorroso te voy
-->
a decir cuál es la mejor forma la mejor forma es que si aunque el archivo sea muy grande lo
-->
que tú vas a hacer es que vas a tomar solamente la estructura las dos primeras filas la fila de
-->
arriba y la fila de abajo o sea la primera y la segunda aquí como este archivo es muy
-->
pequeño en realidad puedo hacerlo directamente pero te aconsejaría entonces que tengas
-->
una copia a nivel local de la estructura del archivo y hagan lo siguiente crees una
-->
metadata de ese archivo como sería el cuento como el archivo es ccv los archivos ccv se dotan
-->
como archivos delimitados entonces voy aquí al delimite voy a darle clic derecho y voy
-->
a crear una conexión hacia ese archivo de los metadatos que tiene entonces lo voy a llamar
-->
on the record actor se va a file delimited clic derecho crear file delimite le da
-->
entonces next ubica el archivo porque usted va a tener una copia muy pequeña para la estructura
-->
en este caso vayas en la carpeta ten que es tenerlo ahí escoge fila aquí puede visualizar
-->
cuál sería el carácter de separación que tiene y note algo particular que aquí ahora sí
-->
le está apareciendo unos símbolos especiales eso porque el sistema de codificación no lo
-->
ve yo de forma correcta vamos a darle aquí un next
-->
aquí me lo está leyendo pero tiene encabezado me interesa voy a decirles
-->
que encabezado y voy a cambiar no sé cuál en qué idioma está voy a cambiar a windows voy
-->
a crear aquí a windows 12 52 saber si el problema era si el problema era de codificación pero
-->
esto no tiene nada que ver aquí la codificación por qué porque al final le interesaría es para
-->
los nombres de columna recuerde que es lo que va a guardar los metadatas no guarda los datos
-->
del archivo pero aquí me sirvió el ejemplo para para ver para que entendiera este sistema
-->
de codificación acá listo entonces vamos a darle aquí next
-->
perfecto vamos a darle aquí finish y ahora se sitúa en el archivo delimitado
-->
mira lo que va a ser ahora va a archivo delimitado y aquí una opción que dice
-->
metadata le expande el árbol el archivo delimitado que se llama filácto le da click
-->
derecho editar esquema y aquí hay un botoncito que dice que es el penúltimo
-->
que dice exportar en un xml el metadata o sea el penúltimo el penúltimo le da click
-->
importante entonces coge la ubicación vamos a dejarlo ahí en temporal y lo voy a llamar
-->
entonces fil actor y muy importante que le agregué el punto xml porque después no lo
-->
lee bien fil actor punto xml punto xml guardar y listo ahí le da finish ahí ya después
-->
que tiene la metadata entonces se va al input nuevamente hf input se va el esquema
-->
del input y aparece un botón de penúltimo casualmente para importar ahí le va a dar
-->
click y va a buscar su listo es quién me habló a ese Brenda Brenda Brenda Brenda
-->
Brenda ahí en el componente en la parte de abajo suba un momento suba un poquito más
-->
suba y listo dele editar esquema y dele click en editar esquema a la parte de arriba
-->
abajito ahí donde dice property type ya veo property type abajo y esquema y ahí
-->
ahí lo tiene ahí lo tenía ese de aquí no sé si alcanzaba mi mouse dele click un momento
-->
escoja el penúltimo botón busque el sería fil actor dele abrir dele ok
-->
haga por favor una corrección ahí en el net no uri la o está hdfs local borre por
-->
favor esa línea toda la línea borre la toda que quede en blanco escriba con con control
-->
espacio de aleora control espacio y escoja ahí la variedad de contexto que ya definió
-->
que se llama url en la primerita url closer perfecto listo que se bien vamos entonces
-->
como el lo que buscamos era leer entonces vamos a hacer lo siguiente vamos a colocar
-->
aquí un telor row para que me muestre aquí internamente los datos telor row
-->
y conecte el hdf input a este telor row quieren para variar vamos a configurar
-->
telor un poco diferente vaya aquí al telor row aquí hay varias formas en que le va a
-->
mostrar dígale que le muestre los datos en tipo table no básico table
-->
doble clic en el telor row y cambie el modo que estaba en básico a table hay tres
-->
modos básico table y vertical entonces eso puede jugar después es para teníamos tiempo
-->
a veces para ir a cada uno con identidad a configuración ejecutamos aquí y debería
-->
entonces listar perdón aquí me ejecutó pues subir archivo entonces voy a cerrar este señor
-->
aquí salmar y voy a verlo abrir que es el leer aquí está voy a ejecutar aquí
-->
error aliso ya que pena se me escapó algo sirvió el error tengo un error de ejecución este error
-->
de ejecución que está aquí seguramente pasó con lo siguiente el archivo que subimos hay
-->
una particularidad que el archivo que subimos tiene está separado por punto y coma y este
-->
archivo en particular en punto y coma y tiene un encabezado se nos olvidó confiar esa parte
-->
entonces vamos aquí nuevamente al vamos al hf input
-->
y me pregunta el nombre del archivo que pena se me olvidó confiar es confiar esta parte
-->
nombre del archivo entonces vaya aquí al que vamos a leer que no lo habíamos especificado
-->
esta parte dele clic aquí y escoja entonces que se llama filácton
-->
el tipo de archivo es text file ya explico esta parte de sequestras adelante el separador
-->
es punto y coma y como tiene un hider me toca colocarle aquí un uno diciéndole que tiene
-->
encabezado fernanda bueno dale al bajar a instalar ahí por favor dale ahí bajar a
-->
instalar dale a aceptar todo no no dale que no botón aceptar todo ese que está ahí
-->
dale nuevamente ahí bueno ahí escoge expanda y axa y escoge filácton ok
-->
bien el tipo de archivos es text file está bien en separador de filas ya lo viste está
-->
bien el separador de campo es ssv es punto y coma y como tiene un hider tienes que colocarle
-->
que elegir está en la posición número uno o sea que no lo va a leer perfecto vamos entonces
-->
a ejecutar ahora aquí a ver qué pasa voy a ver un momento bueno a ver si termina de cargar
-->
voy a revisar un momentico a fernanda que lo volviste a ejecutar salió error vamos a ver
-->
mientras de pronto se bloqueó dele cancelar y vuelve a ejecutar nuevamente prenda a ver listo
-->
pax vamos a ver qué pasó esto no había configurado el pack fernanda me pareció que
-->
tuviera configurado el pack ya no me pareció a mí permite lo vuelvo a ejecutar aquí aquí
-->
aclaro que todavía no he hecho progresamiento de data estoy simplemente es haciendo ejemplos
-->
para subir archivos hacia adu todavía big data no ha hecho todavía ya explico no sé qué pasó
-->
aquí hay algo en particular a que está aquí a fernanda aquí parece que estuviese ejecutando
-->
el primer yo que teníamos antes fernanda lo que pasa es que cogimos escogiste el archivo
-->
diferente el archivo que mapea es filácton no es chema
-->
pero esperate un momento creo que cogiste es de acá esta meta data creo que mapeaste
-->
fueste vamos a mapear este señor editar esquema
-->
vamos a ver vamos nuevamente a leer este archivo aquí editar next y aquí se te
-->
escapó colocar que tiene encabezado si tú no le colocas encabezado por defecto él va a
-->
colocar cada columna con estos nombres que están aquí entonces voy a hacerle este señor
-->
para que tome el encabezado y haz de cuenta que ahora va a tomar estos elementos de
-->
encabezado y es ok vamos a ver esta herramienta a veces si me cambió el esquema ahora no
-->
voy a intentar leerlo nuevamente filácton next aquí he leído que tengo encabezado bueno ahora
-->
sí creo que aquí directamente lo puedo exportar que es este que está aquí y doy clic y lo
-->
puedo despertar voy a sobre escribir este archivo filácton cuál fue el error que
-->
tomaste es importante importaste en el esquema este importaste fue otro archivo que es el
-->
y no era ese entonces voy ahora sí a importar filácton ok y es y voy a intentar leer aquí
-->
nuevamente efecto el problema era que habías importado un esquema diferente y por eso había
-->
un error el caso tuyo brenda voy a ver para ver por qué no te que te pasa ahí se bloqueó
-->
fue bueno momento momento momento creo que hay un problema en la conexión está intentando conectarse
-->
al conectarse al al hadut y parece que no está consiguiendo la conexión asumo que
-->
puede haber un error en la en la dirección entonces espérate un momento y voy a bajar
-->
este señor y voy a volver a subir entonces los temas por favor me esperan un momento
-->
no te que esté un poco más complicado porque acá hay que acasar de más errores
-->
bueno como diciendo todavía no estamos no hemos usado big data hemos
-->
algunas funciones de componentes pero ahí no está siendo big data todavía
-->
no está siendo ni mac review ni spark entonces ahí lo que está haciendo simplemente es
-->
almacenamiento sobre hdfs todavía no hemos usado mac reviews pero voy a verificar la
-->
variable de contexto un momento a ver si está apuntando bien brenda a ver ok aquí
-->
el contexto
-->
si está bien 16 está bien
-->
hoy entonces al job que es el que se llama aquí en hadut subir ficheros perfecto voy aquí
-->
este de aquí
-->
el problema es que marcantes a producción y en producción yo le colocó le cambiamos la edición
-->
a 17 entonces ese 17 no no está entonces este está en cuba ahora sí marcando aquí a 16
-->
y vamos a intentar entonces acá abajo para ver y si porque lo vamos a buscar acá será que si
-->
se habrá tomado el cambio porque debió tomar el cambio a cuba porque pareciese que estuviese
-->
buscando todavía la 17 si parece que estuviese buscando todavía 17 será que el cambio no lo
-->
podemos ver en el contexto no ahí pudiamos haber colocado de forma manual pero para que
-->
era más fácil aquí quería ver
-->
este momento a ver aquí me va a tocar cancelar porque aquí va a demorar un tiempo
-->
permíteme lo cancelo nuevamente porque
-->
queremos un momento
-->
y por acá le hizo axa basado leer archivos
-->
así se está cargando
-->
perfecto voy a cambiar entonces la forma de ejecución voy a colocar de forma manual
-->
el archivo sería entonces el archivo sería está ubicado en es las axa es las fil yo acto
-->
puntos eso ve cuando lo voy a ejecutar que aquí todavía está marcando a producción me parece
-->
que fue que no tomó el cambio voy a guardar por si las dudas voy a ejecutar ahora
-->
listo ok creo que aquí hubo un problema
-->
aquí el tipo no sé por qué se tomó aquí este text file no sé en qué momento se
-->
cambió eso le hizo voy a volver a ejecutar
-->
ese secuencia lo veo cuando vayamos a ver hay se explica que es ese sequence listo
-->
aquí es porque no le coloqué que tiene encabezados entonces intentó hay una fila
-->
que está tipo entero pero como el encabezado es un string intenta convertir un string a entero
-->
y ahora sí debería funcionar perfecto ahí está listo
-->
ahí el problema que teníamos es que estábamos marcando allá producción y eso causó ahí un
-->
pequeño problema y seguimos entonces se cuenta que hasta el momento lo que estoy
-->
haciendo son conexiones a nivel de especificando la url ya sea en los
-->
componentes o en el contexto si ustedes en algunos casos puede hacer lo siguiente puede
-->
hacer una configuración desde la metadata en la metadata aquí le aparece algo que se llama
-->
hadu cluster terminamos con esta configuración para la marzo no sé
-->
dele clic derecho aquí y dígale que va a hacer una conexión a un clúster de
-->
hadu number la va a llamar hadu donde es coraxa
-->
aquí le pide escoja universal la distribución
-->
nuevamente cambia aquí a universal universal
-->
por favor ahora en este universal que está aquí escoja entonces
-->
cambie donde dice localhost por favor cambie a la dirección ip que tiene de
-->
la máquina que sería 10.0.3.16 si quiere mejor la copia y la
-->
donde diga localhost
-->
el directorio lo cambia si ya va a un momento listo
-->
esperemos que confirma aquí algo
-->
a
-->
pero un momento que aquí me salió
-->
creo que
-->
si ahí es 9 mil muchas gracias si la 3.1 momento ya recuerdo
-->
aquí esta conversión que se me escapó que no me deja aquí sería
-->
10 un momento por favor ya 10.0.3.16 si efectivamente aquí sería 9 mil
-->
muchas gracias sería 9 mil y las demás nada más cambio la ip
-->
no me acuerdo ese error que sale ahí porque no me deja pasar
-->
no este par no tiene nada que ver
-->
momento por favor que aquí me sale un error de conexión usar name no vamos
-->
a hacerlo nuevamente para ver qué pasó aquí me preguntó voy aquí a
-->
que me sale un error ahora aquí en el metadata aquí hay un clóster
-->
aquí le coloco el nombre la conexión que había dicho
-->
un momento por favor y confirmo ya acá acá voy a coger universal
-->
aquí acá nuevamente allá ya me acordé ya me acordé permítame y le hago la
-->
prueba yo inicialmente para que usted no tenga que ser aquí
-->
aquí tengo que colocar el user de del clóster que sería h2
-->
h2 con h mayúscula y cambio local a su momento
-->
porque creo que si la no estoy más y esa versión 3.1 me va a funcionar con
-->
la clóster de ya un momento por favor 10.0.3.16
-->
cambio aquí a este número cambio aquí y listo voy a darle aquí
-->
chequear servicios no creo que el problema es que aquí me toca versión
-->
3.0 porque no es compatible y cada vez que cambio de versión me toca
-->
cambiar nuevamente la skip no creo que fue que no creo que fue no que no
-->
aquí no en el
-->
un momentito a ver
-->
si lo voy a hacer nuevamente creo que permítame que venga confirmo con 3.1
-->
creo que con 3.1 el error que era es que no cambié el puerto es para
-->
confirmarle ya iba a volver a hacer el ejemplo creo que fue que no
-->
cambié el puerto aquí a 9 mil
-->
aquí le colocó listo
-->
no es 3.0 listo ahora sí vamos a hacer ejemplo nuevamente de 0 se conecta se
-->
ubica en la metadata va donde dice hadu clóster y le da
-->
crear host de hadu clóster el nombre lo vamos a llamar hadu
-->
on the record axa next aquí escoge universal aunque creo
-->
que aquí no hay mucho problema con esta parte aquí vamos a coger ahora sí en
-->
distribución vamos a coger universal pero aseguré que sea 3.0
-->
3.0 x y vamos a cambiar en la primera en el name no uri vamos a
-->
cambiar el localhost por 10.0.3.16 y cambiamos el puerto 9 mil
-->
o sea en la primera línea cambio tanto la ip como el puerto 2 con los dos
-->
puntos que están ahí y después continuo y cambio en todos
-->
los demás que haya localhost cambio y por último coloque en username
-->
coloca hadu con h mayúsculo cuando haya hecho la configuración le da en
-->
service y debería aparecer entonces en verdecitos y todo está bien está
-->
correctamente configurado si está correctamente configurado le dan
-->
finis por favor la quien me habló disculpe no no se preocupe yo yo le
-->
digo ahora yo lo yo a su pantalla y algunos seguían porque hay algunos
-->
que han terminado ahí coloque 10.0 punto ahí punto siga con punto 16
-->
dos puntos 9 mil ahora donde está los localhost cambielo por 10.0.3.16
-->
dos puntos ahí sería dos puntos ahí se me escapó el puerto el puerto creo que
-->
es 80 20 y un momento ya le confirmo cuál es el puerto ahí porque se me
-->
escapó espera un momento por favor
-->
allí 80 32 32 22 y en el de abajo no borre no borre el bueno si quiere
-->
sobre escribir sería 80 30 dele por el username coloque hachedu con h
-->
mayúscula hachedu sex service ok listo dejamos finis o close finis
-->
bueno y dejamos aquí nos vamos entonces al break del almuerzo venimos
-->
entonces en una hora o sea 13 en punto entonces regresamos
-->
buen provecho entonces
-->
muy buenas tardes nuevamente espero que haya sido de buen provecho su
-->
almuerzo necesitamos conectados ya nos queda una hora nada más para
-->
terminar este día si me confirman por favor si tenemos audios y me
-->
están escuchando perfecto aquí muchísimas gracias alejandro perfecto
-->
entonces vamos a revisar un poco que es los ejemplos que hemos venido
-->
haciendo hasta el momento primero iniciamos con unos ejemplos básicos para
-->
entender el funcionamiento de la herramienta que es el tal en como tal
-->
como forma general y estamos en la parte de hacer ejemplos con jadut el
-->
primer ejemplo con jadu que fue subir archivos note algo en particular de
-->
la forma en que lo hice creé una conexión a jadu que con tipo hdfs
-->
conectio mientras que el otro lo que hice fue que la conexión la hice
-->
directamente en el componente entonces como buena práctica que deberíamos
-->
hacer si tienes un joque en el cual vas a utilizar muchos componentes sobre
-->
hdfs para leer muchos archivos escribir o colocar muchos archivos en el
-->
sistema de ficheros lo más recomendable es que hagas lo
-->
siguiente que cree solamente una conexión con hdfs conector y los
-->
demás componentes tomen la configuración de esa conexión es lo
-->
más conveniente si el caso particular es solamente un solo componente pues la
-->
puede hacer directamente en el componente como tal
-->
la otra buena práctica es el no posible utilizar variables de contexto
-->
en el cual pues la configuración de conexión la tengas mantenidas ahí de
-->
tal manera en que si hay algún cambio en la configuración o en la
-->
dirección la url que apunta entonces simplemente la cambias directamente en
-->
la variable de contexto y automáticamente todos los joque dependen
-->
de ello cambiarán entonces esa variable de contexto ahora estamos en
-->
otra forma de conexión a hadut que es a través de una metadata entonces
-->
habíamos quedado inicialmente con esta