Talend Big Data Integration y Ecosistema de Talend Videos

                WEBVTT

00:00:01.460 --> 00:00:03.820
perfecto, listo. Bien, eh, para

00:00:03.820 --> 00:00:05.100
iniciar el día de hoy, vamos a

00:00:05.100 --> 00:00:06.060
hacer entonces lo siguiente.

00:00:06.420 --> 00:00:07.860
Primero nos vamos al

00:00:07.860 --> 00:00:11.760
hipervisor de Hyper-V. Eh,

00:00:11.920 --> 00:00:13.860
vamos entonces aquí en el

00:00:13.860 --> 00:00:16.380
escritorio. Accedemos entonces

00:00:16.380 --> 00:00:17.940
al acceso directo que tenemos

00:00:17.940 --> 00:00:20.740
en el mismo escritorio. Y

00:00:20.740 --> 00:00:22.120
debería aparecer la máquina

00:00:22.120 --> 00:00:23.860
virtual como guardada, que fue

00:00:23.860 --> 00:00:24.760
lo que hicimos el día de

00:00:24.760 --> 00:00:26.660
ayer. La idea de esa guardada

00:00:26.660 --> 00:00:28.400
es que quedaba exactamente en

00:00:28.400 --> 00:00:29.960
el estado en que estaba

00:00:29.960 --> 00:00:31.700
anteriormente. Es decir, para

00:00:31.700 --> 00:00:33.120
evitar entonces subir nuevamente

00:00:33.120 --> 00:00:34.840
los servicios, aunque pude haber

00:00:34.840 --> 00:00:35.980
hecho esos servicios de manera

00:00:35.980 --> 00:00:37.940
automática, pero listo, la

00:00:37.940 --> 00:00:39.520
tengo de esa manera. Vamos

00:00:39.520 --> 00:00:40.700
entonces, dale doble clic para

00:00:40.700 --> 00:00:42.940
que inicie. Y le damos

00:00:42.940 --> 00:00:45.120
entonces eh, clic en el botón

00:00:45.120 --> 00:00:47.520
iniciar y debería llevarnos

00:00:47.520 --> 00:00:48.860
al estado en que la dejamos

00:00:48.860 --> 00:00:54.340
el día de ayer. Vamos a

00:00:54.340 --> 00:00:55.400
comprobar ese estado de la

00:00:55.400 --> 00:00:56.980
siguiente forma. Abra el

00:00:56.980 --> 00:00:59.000
browser que utilizó el día de

00:00:59.000 --> 00:01:02.180
ayer para conectarse al al

00:01:02.180 --> 00:01:04.260
clóster de Jadut y mostrar las

00:01:04.260 --> 00:01:05.560
gráficas a nivel de lo que

00:01:05.560 --> 00:01:07.460
contenía ese clóster. Yo si no

00:01:07.460 --> 00:01:10.940
estoy mal usé Edge. Y voy a

00:01:10.940 --> 00:01:13.220
darle a dirección diez punto

00:01:13.220 --> 00:01:14.520
diez punto cero punto tres

00:01:14.520 --> 00:01:15.880
punto dieciséis punto noventa

00:01:15.880 --> 00:01:18.820
ocho setenta. Y debería

00:01:18.820 --> 00:01:22.180
tener entonces los archivos

00:01:22.180 --> 00:01:24.340
que trabajamos el día de ayer.

00:01:24.360 --> 00:01:26.340
El caso de Beatriz eh noto que

00:01:26.340 --> 00:01:27.460
está perfecto. Alejandro

00:01:27.460 --> 00:01:29.900
también lo tiene perfecto.

00:01:30.240 --> 00:01:31.420
Fernanda está iniciando los

00:01:31.420 --> 00:01:33.740
servicios. Brenda lo tiene

00:01:33.740 --> 00:01:35.480
perfecto. Brenda eh si está

00:01:35.480 --> 00:01:37.380
mal le vaya a ser al en ese

00:01:37.380 --> 00:01:40.880
en ese al menú utilities que

00:01:40.880 --> 00:01:43.280
está al final y dele browse

00:01:43.960 --> 00:01:45.320
para comprobar que los

00:01:45.320 --> 00:01:47.100
archivos no hayan sufrido

00:01:47.100 --> 00:01:48.760
dele clic en AXA por favor.

00:01:49.540 --> 00:01:50.280
A ver ¿Por qué hacemos

00:01:50.280 --> 00:01:51.740
esto? El problema que tenemos

00:01:51.740 --> 00:01:54.140
con esta parte es que esta es

00:01:54.140 --> 00:01:55.300
una máquina virtual de una

00:01:55.300 --> 00:01:56.580
máquina virtual entonces puede

00:01:56.580 --> 00:01:58.520
haber algún problema con

00:01:58.520 --> 00:02:00.240
algún dato específico. Eh

00:02:00.240 --> 00:02:01.440
Luis no sé si a ti te está

00:02:01.440 --> 00:02:04.000
fucionando no sé mira para

00:02:04.000 --> 00:02:07.820
ver si. Exactamente dale F5

00:02:07.820 --> 00:02:09.040
ahí para ver. Perfecto está

00:02:09.040 --> 00:02:10.320
bien entonces. Vete a

00:02:10.320 --> 00:02:11.800
utilities por favor browse.

00:02:13.920 --> 00:02:15.040
Mientras vayamos también

00:02:15.040 --> 00:02:16.380
subiendo el talent big data

00:02:16.380 --> 00:02:17.680
se me escapaba que vamos a

00:02:17.680 --> 00:02:19.140
trabajar entonces talent big

00:02:19.140 --> 00:02:20.300
data por favor no lo había

00:02:20.300 --> 00:02:21.480
subido. Brenda anda voy

00:02:21.480 --> 00:02:24.520
contigo entonces eh Liso

00:02:25.800 --> 00:02:28.260
vamos a ver voy a ver voy a

00:02:28.260 --> 00:02:32.760
acceder a tu máquina ¿OK?

00:02:33.780 --> 00:02:35.480
Beatriz ejecute el otro

00:02:35.480 --> 00:02:37.020
exactamente había ejecutado

00:02:37.020 --> 00:02:39.620
el la versión comercial que

00:02:39.620 --> 00:02:41.280
había instalado ahí entonces

00:02:41.280 --> 00:02:44.260
voy a ver un momento aquí

00:02:44.260 --> 00:02:45.880
está ejecutando

00:02:48.120 --> 00:02:50.780
es el el talent eh sí ese que

00:02:50.780 --> 00:02:51.700
abrió usted inicialmente es el

00:02:51.700 --> 00:02:52.860
talent estudio pero necesitado

00:02:52.860 --> 00:02:54.820
que abría ahora por favor el

00:02:54.820 --> 00:02:57.820
talent big data y fue el día

00:02:57.820 --> 00:02:58.960
de ayer vamos a ver un

00:03:00.000 --> 00:03:00.440
momento

00:03:02.840 --> 00:03:05.280
no si todo bien Fernanda lo

00:03:05.280 --> 00:03:06.260
que es que no haya abierto

00:03:06.260 --> 00:03:07.320
el browse pero todo está bien

00:03:08.180 --> 00:03:12.060
aquí ahí está todo perfecto

00:03:12.060 --> 00:03:13.380
eh Fernanda si está amable

00:03:13.380 --> 00:03:15.240
sube el talent big data si

00:03:15.240 --> 00:03:16.560
si está amable lo mismo que

00:03:16.560 --> 00:03:17.720
Luis también para que sube el

00:03:17.720 --> 00:03:19.380
talent big data esa máquina

00:03:19.380 --> 00:03:20.680
virtual la dejamos quieta

00:03:20.680 --> 00:03:22.240
Pavel no sé si tú eh

00:03:23.160 --> 00:03:24.260
configuraste eso ayer no

00:03:26.100 --> 00:03:27.740
recuerdo sube el talent big

00:03:27.740 --> 00:03:29.720
data por favor es es Pavel

00:03:29.720 --> 00:03:31.520
el que subiste el talent

00:03:31.520 --> 00:03:33.620
estudio es el segundo que está

00:03:33.620 --> 00:03:35.800
del ese que está ahí ese que

00:03:35.800 --> 00:03:37.380
está ahí bueno vamos entonces

00:03:37.380 --> 00:03:40.600
a iniciar el día de hoy como

00:03:40.600 --> 00:03:41.660
venía comentando los

00:03:41.660 --> 00:03:43.060
ejemplos del día de ayer

00:03:43.060 --> 00:03:44.660
eh estuvieron más relacionados

00:03:44.660 --> 00:03:45.280
con la parte de

00:03:45.900 --> 00:03:46.980
almacenamiento eh

00:03:46.980 --> 00:03:48.360
específicamente el día de

00:03:48.360 --> 00:03:50.960
ayer nos conectamos a un S3

00:03:50.960 --> 00:03:53.540
y nos conectamos al cluster

00:03:53.540 --> 00:03:55.180
que que está configurado en

00:03:55.180 --> 00:03:57.660
la máquina virtual eh de a

00:03:57.660 --> 00:03:59.880
Hyper VIP hoy en día pues

00:03:59.880 --> 00:04:02.180
normalmente estos clústeres es

00:04:02.180 --> 00:04:03.420
muy raro a nivel de

00:04:03.420 --> 00:04:04.240
infraestructura un problema

00:04:04.240 --> 00:04:05.580
es que alguien los monte

00:04:06.720 --> 00:04:08.400
seguramente te vas a conectar

00:04:08.400 --> 00:04:09.940
alguna solución en la nube

00:04:09.940 --> 00:04:12.440
ya sea un MR un tipo sin

00:04:12.440 --> 00:04:12.740
el tipo de clústeres más que

00:04:12.740 --> 00:04:14.840
de que tengas por ejemplo de

00:04:14.840 --> 00:04:16.840
de Azure para conectarse a

00:04:16.840 --> 00:04:18.580
este tipo de clúster o en su

00:04:18.580 --> 00:04:21.160
defecto eh no utilizas eh

00:04:21.160 --> 00:04:22.980
HDFS para almacenar si no

00:04:22.980 --> 00:04:24.240
utilizas un object store

00:04:24.240 --> 00:04:26.560
C de tipo S3 tipo block el

00:04:26.560 --> 00:04:27.960
que tú quieras entonces ya

00:04:27.960 --> 00:04:28.940
la parte del almacenamiento

00:04:28.940 --> 00:04:30.940
está más diversa con

00:04:30.940 --> 00:04:32.040
respecto a lo que se tenía

00:04:32.040 --> 00:04:33.000
anteriormente anteriormente

00:04:33.000 --> 00:04:34.200
para Big Data me casaba

00:04:34.200 --> 00:04:35.500
mucho con la parte de de

00:04:35.500 --> 00:04:40.440
Hadut eh aunque los verbos

00:04:40.440 --> 00:04:40.520
de almacenamiento para almacenar

00:04:40.520 --> 00:04:43.940
y procesar hoy en día hay un

00:04:43.940 --> 00:04:46.560
algo más eh más conceptual un

00:04:46.560 --> 00:04:48.640
poco en definir Big Data es

00:04:48.640 --> 00:04:50.660
cuando proceso no tanto

00:04:50.660 --> 00:04:51.880
cuando almaceno partiendo

00:04:51.880 --> 00:04:54.100
del hecho en que ya yo tengo

00:04:54.100 --> 00:04:55.400
diferentes opciones para

00:04:55.400 --> 00:04:56.620
almacenar los datos que yo

00:04:56.620 --> 00:04:58.180
quiera procesar entonces hoy

00:04:58.180 --> 00:04:59.120
en día se tiene más en

00:04:59.120 --> 00:05:00.880
cuenta Big Data es a nivel

00:05:00.880 --> 00:05:02.780
de procesamiento no tanto de

00:05:02.780 --> 00:05:05.300
almacenamiento por el

00:05:05.300 --> 00:05:06.180
mismo modo vamos a hacer lo

00:05:06.180 --> 00:05:08.780
siguiente entonces vamos a ir

00:05:08.780 --> 00:05:12.360
a los job design tenemos una

00:05:12.360 --> 00:05:14.400
carpeta que se llama AXA y

00:05:14.400 --> 00:05:15.280
ahora vamos a hacer lo

00:05:15.280 --> 00:05:16.240
siguiente vamos a crear una

00:05:18.860 --> 00:05:20.140
subcarpeta eh perdón una

00:05:20.140 --> 00:05:21.600
subcarpeta aquí un folder

00:05:21.600 --> 00:05:25.140
dentro de AXA para organizarnos

00:05:25.140 --> 00:05:26.800
un poquito más que se llame

00:05:28.880 --> 00:05:32.160
procesamiento Big Data esto

00:05:32.160 --> 00:05:34.100
necesita no no acepta espacio

00:05:34.100 --> 00:05:35.520
en blanco entonces lo separo

00:05:35.520 --> 00:05:38.300
con Underscore eh la carpeta

00:05:38.300 --> 00:05:41.160
la llame Big Data Finish aquí

00:05:44.480 --> 00:05:46.160
perfecto vamos a crear entonces

00:05:46.680 --> 00:05:49.180
eh un job dentro de la carpeta

00:05:49.180 --> 00:05:53.960
Procesamiento Big Data que lo

00:05:53.960 --> 00:05:58.180
vamos a llamar Job Underscore

00:05:58.180 --> 00:06:01.500
Job Película Underscore más

00:06:01.500 --> 00:06:06.940
popular más popular por

00:06:07.800 --> 00:06:10.240
década eh Job Película más

00:06:10.240 --> 00:06:11.600
popular por década recuerde

00:06:11.600 --> 00:06:13.780
que tiene que que usar un

00:06:13.780 --> 00:06:15.600
carácter eh porque no acepta

00:06:15.600 --> 00:06:16.860
el espacio como carácter

00:06:16.860 --> 00:06:19.100
especial entonces sepárelo

00:06:19.100 --> 00:06:20.980
por un Underscore Job

00:06:20.980 --> 00:06:22.560
Película más popular por

00:06:22.560 --> 00:06:23.420
década ahora lo que vamos

00:06:23.420 --> 00:06:24.160
a hacer vamos a hacer

00:06:24.160 --> 00:06:25.880
un progresamiento yo en la

00:06:25.880 --> 00:06:27.160
parte teórica le le dije

00:06:27.160 --> 00:06:28.920
prácticamente lo que tú haces

00:06:28.920 --> 00:06:30.800
con Big Data es prácticamente

00:06:30.800 --> 00:06:32.300
lo que hacías anteriormente

00:06:32.300 --> 00:06:33.380
sin Big Data con

00:06:33.380 --> 00:06:35.040
composición nacional la única

00:06:35.040 --> 00:06:36.120
diferencia es que puede haber

00:06:36.120 --> 00:06:37.940
una variedad en los datos y

00:06:37.940 --> 00:06:40.860
segundo que quizás eh ese gran

00:06:40.860 --> 00:06:41.960
volumen de datos necesita

00:06:41.960 --> 00:06:43.620
entonces que sea progresado

00:06:43.620 --> 00:06:45.680
con Big Data por eh por algo

00:06:45.680 --> 00:06:46.580
relacionado con la parte de

00:06:46.580 --> 00:06:48.020
velocidad entonces vamos a

00:06:48.020 --> 00:06:51.300
darle aquí Finish y para

00:06:51.300 --> 00:06:52.760
rehusar un poco ya lo que

00:06:52.760 --> 00:06:53.800
hemos hecho y no tener que

00:06:53.800 --> 00:06:55.080
volver a configurar en EBS es

00:06:55.080 --> 00:06:57.020
lo mismo váyase a la carpeta

00:06:57.020 --> 00:06:58.780
y busque el último ejemplo

00:06:58.780 --> 00:06:59.940
que hicimos el día de ayer

00:06:59.940 --> 00:07:04.220
que fue eh Jot formatear

00:07:04.220 --> 00:07:05.420
archivo que realidad no lo

00:07:05.420 --> 00:07:06.860
formateamos por tiempo no

00:07:06.860 --> 00:07:07.980
lo alcanzamos a formatear

00:07:07.980 --> 00:07:09.360
Jot formatear archivo por

00:07:09.360 --> 00:07:12.760
favor lo abre y cópiese el

00:07:13.840 --> 00:07:16.220
tepreyop y el HDFC

00:07:16.220 --> 00:07:19.160
Connection lo copia para no

00:07:19.160 --> 00:07:22.660
tener nuevamente que que

00:07:22.660 --> 00:07:25.160
configurar esto y lo pega acá

00:07:30.840 --> 00:07:31.320
listo

00:07:31.320 --> 00:07:33.100
bien la idea es no tener que

00:07:33.100 --> 00:07:34.820
rehusar en EBS es lo mismo

00:07:34.820 --> 00:07:37.200
entonces pegas acá si ya

00:07:37.200 --> 00:07:39.080
cierran el archivo ese que

00:07:39.080 --> 00:07:40.100
hicimos el día de ayer para

00:07:40.100 --> 00:07:42.160
que de pronto no te cause

00:07:42.160 --> 00:07:43.320
algún tipo de confusión

00:07:43.320 --> 00:07:45.260
listo eh qué es lo que voy

00:07:45.260 --> 00:07:47.460
a hacer eh voy a mostrar

00:07:48.760 --> 00:07:50.420
inicialmente eh el archivo

00:07:50.420 --> 00:07:51.920
que lo tengo por aquí creo

00:07:51.920 --> 00:07:53.740
que sí bueno voy a mostrar

00:07:53.740 --> 00:07:54.880
este archivo que lo tengo

00:07:54.880 --> 00:07:58.180
por aquí se llama Phil

00:07:58.180 --> 00:08:01.000
actor que ya está en el en

00:08:01.000 --> 00:08:03.340
el clóster de Hadud en ese

00:08:03.340 --> 00:08:05.020
momento y lo muestro por aquí

00:08:05.020 --> 00:08:07.560
tiene hasta hacer de aquí

00:08:07.560 --> 00:08:09.940
este archivo lo que tiene

00:08:09.940 --> 00:08:12.680
es datos de los actores

00:08:12.680 --> 00:08:15.060
principales de una película

00:08:16.460 --> 00:08:18.660
entonces tiene por ejemplo el

00:08:18.660 --> 00:08:21.240
año el el tiempo de la

00:08:21.240 --> 00:08:22.040
película que está como

00:08:22.040 --> 00:08:23.740
longitud en minutos el título

00:08:23.740 --> 00:08:25.020
de la película el actor

00:08:25.020 --> 00:08:26.740
principal la actriz principal

00:08:26.740 --> 00:08:28.680
director y la popularidad

00:08:29.300 --> 00:08:30.880
entonces aquí tiene en realidad

00:08:30.880 --> 00:08:32.200
que el archivo es muy

00:08:32.200 --> 00:08:34.180
pequeño carecería de sentido

00:08:34.180 --> 00:08:36.220
a nivel pragmático en

00:08:36.220 --> 00:08:37.100
plástico a nivel de

00:08:37.100 --> 00:08:37.920
producción usar nuestro

00:08:37.920 --> 00:08:38.840
archivo para saber data

00:08:38.840 --> 00:08:40.060
porque es demasiado pequeño

00:08:40.060 --> 00:08:41.880
esto lo puedo hacer sin

00:08:41.880 --> 00:08:43.920
necesidad de big data pero

00:08:43.920 --> 00:08:45.220
eh partiendo del hecho en que

00:08:45.220 --> 00:08:47.000
tengo poco recurso pues eh al

00:08:47.000 --> 00:08:48.420
final trate de piense que

00:08:48.420 --> 00:08:49.860
este archivo es inmensamente

00:08:49.860 --> 00:08:51.000
grande o que hay un conjunto

00:08:51.000 --> 00:08:52.540
de archivos en que me toca

00:08:52.540 --> 00:08:53.740
unirlos y la cantidad del

00:08:53.740 --> 00:08:55.360
volumen es grande para la

00:08:55.360 --> 00:08:57.080
velocidad que en el cual yo

00:08:57.080 --> 00:08:58.760
quiero ejecutar o que me

00:08:58.760 --> 00:08:59.720
termine de ejecutar el

00:08:59.720 --> 00:09:02.220
proceso pero bien eh en pocas

00:09:02.220 --> 00:09:03.360
palabras yo tengo el año de

00:09:03.360 --> 00:09:05.180
la película tengo aquí la

00:09:05.180 --> 00:09:06.460
popularidad de la película y

00:09:06.460 --> 00:09:08.380
voy a sacar la película más

00:09:08.380 --> 00:09:12.820
popular por por década ¿OK?

00:09:12.820 --> 00:09:13.900
Ese es lo que voy a hacer

00:09:13.900 --> 00:09:15.900
¿Listo? Asumamos entonces que

00:09:15.900 --> 00:09:17.100
el archivo es elevadamente

00:09:17.100 --> 00:09:18.880
grande por volumen y me toca

00:09:18.880 --> 00:09:19.940
entonces progresarlo con

00:09:19.940 --> 00:09:20.940
big data para obtener

00:09:20.940 --> 00:09:22.240
digamos respuestas en tiempo

00:09:22.240 --> 00:09:24.560
real. Me devuelvo nuevamente

00:09:24.560 --> 00:09:27.760
a la al talent big data

00:09:27.760 --> 00:09:30.680
esta que está aquí. Y lo

00:09:30.680 --> 00:09:31.440
primero que voy a hacer

00:09:31.440 --> 00:09:33.620
entonces es que voy a leer

00:09:33.620 --> 00:09:35.880
el archivo que ya tengo en

00:09:35.880 --> 00:09:36.900
el clóset de jadú que lo

00:09:36.900 --> 00:09:38.580
tuvimos el día de ayer. Para

00:09:38.580 --> 00:09:40.320
leer un archivo directamente del

00:09:40.320 --> 00:09:42.980
clóset de jadú entonces usamos

00:09:42.980 --> 00:09:49.400
a T HDFS input HDFS input

00:09:49.400 --> 00:09:51.640
esto es para leer algo para

00:09:51.640 --> 00:09:52.900
que lo tenga presente

00:09:54.640 --> 00:09:56.380
cualquier componente de

00:09:56.380 --> 00:09:59.260
talent que tenga relación con

00:09:59.260 --> 00:10:01.180
la lectura o escritura de

00:10:02.000 --> 00:10:03.860
algo siempre tiene que tener

00:10:03.860 --> 00:10:04.900
un esquema una estructura

00:10:05.180 --> 00:10:07.180
hay que configurar el esquema

00:10:07.900 --> 00:10:09.460
entonces este input va a

00:10:09.460 --> 00:10:10.720
intentar leer un archivo

00:10:10.720 --> 00:10:11.780
entonces con esos procesos

00:10:11.780 --> 00:10:13.180
de lectura y escritura de

00:10:13.180 --> 00:10:14.860
archivos es necesario que

00:10:14.860 --> 00:10:16.620
tenga una un esquema o sea

00:10:16.620 --> 00:10:18.360
decir cómo es la configuración

00:10:18.360 --> 00:10:20.060
que tiene las columnas para

00:10:20.060 --> 00:10:22.480
talent no le interesa el nombre

00:10:22.480 --> 00:10:23.480
de las columnas tú puedes

00:10:23.480 --> 00:10:25.260
llamarla como tú quieras al

00:10:25.260 --> 00:10:26.760
fin y al cabo la interesa es

00:10:26.760 --> 00:10:28.340
el orden y el tipo de datos

00:10:28.340 --> 00:10:29.540
de las columnas eso es lo que

00:10:29.540 --> 00:10:30.560
le interesa al final pero yo

00:10:30.560 --> 00:10:32.360
puedo hacer un esquema y los

00:10:32.920 --> 00:10:33.900
encabezados no necesariamente

00:10:33.900 --> 00:10:35.160
tienen que coincidir con el

00:10:35.160 --> 00:10:38.040
archivo original para esto ya

00:10:38.040 --> 00:10:38.980
recordamos que para poder

00:10:38.980 --> 00:10:39.880
configurar un componente

00:10:39.880 --> 00:10:41.180
entable tiene que coger la

00:10:41.180 --> 00:10:42.300
gráfica del componente o sea

00:10:42.300 --> 00:10:43.120
el icono del componente le

00:10:43.120 --> 00:10:45.040
da doble clic y nos lleva en

00:10:45.040 --> 00:10:46.540
la perspectiva de abajo para

00:10:46.540 --> 00:10:47.160
hacer la configuración

00:10:50.000 --> 00:10:51.660
como ya tenemos una conexión

00:10:51.660 --> 00:10:53.260
existente y el día ayer te

00:10:53.260 --> 00:10:54.760
recomendé cuando deberías

00:10:54.760 --> 00:10:57.140
usar un HDFS connection cuando

00:10:57.140 --> 00:10:59.600
sepas en que en el mismo

00:10:59.600 --> 00:11:01.620
yod vas a tener varios

00:11:01.620 --> 00:11:03.160
componentes de tipo HDFS

00:11:03.160 --> 00:11:05.040
entonces lo más recomendable

00:11:05.040 --> 00:11:06.000
porque es más sencillo

00:11:06.000 --> 00:11:07.580
configurarlo es tener nada más

00:11:07.580 --> 00:11:09.300
una conexión y esa conexión la

00:11:09.300 --> 00:11:11.460
reuso n veces en el mismo yodo

00:11:11.460 --> 00:11:13.300
sería la condición ideal o

00:11:13.300 --> 00:11:14.620
digamos el caso de estudio

00:11:14.620 --> 00:11:16.240
ideal en el cual deberías

00:11:16.240 --> 00:11:18.160
usar el HDFS connection

00:11:18.160 --> 00:11:20.560
vamos a decirle entonces en la

00:11:20.560 --> 00:11:21.640
confesión del input en que

00:11:21.640 --> 00:11:22.680
vamos a usar una conexión

00:11:23.960 --> 00:11:24.560
existente

00:11:24.560 --> 00:11:27.260
y expando entonces la lista de

00:11:27.260 --> 00:11:28.320
conexiones y debería

00:11:28.320 --> 00:11:29.620
aparecer la conexión como

00:11:29.620 --> 00:11:31.260
tal acto seguido entonces

00:11:31.260 --> 00:11:33.660
voy a definir lo siguiente voy

00:11:33.660 --> 00:11:35.240
a escoger el archivo como lo

00:11:35.240 --> 00:11:36.820
con nombre el archivo tengo al

00:11:36.820 --> 00:11:37.260
final un botón

00:11:38.120 --> 00:11:39.260
que me va a permitir conectarme

00:11:41.180 --> 00:11:41.700
al

00:11:41.700 --> 00:11:43.520
al closer de hadut y voy a

00:11:43.520 --> 00:11:45.460
escoger el que se llama fil

00:11:45.460 --> 00:11:46.620
actor que ya lo habíamos

00:11:46.620 --> 00:11:48.260
definido el día de ayer

00:11:48.260 --> 00:11:49.260
fil actor

00:11:52.700 --> 00:11:54.320
perfecto ahora vamos a hacer

00:11:54.320 --> 00:11:55.260
la configuración del archivo

00:11:57.300 --> 00:11:59.000
note algo muy particular de

00:11:59.000 --> 00:12:01.100
la herramienta es que la

00:12:01.100 --> 00:12:01.960
configurando con los

00:12:01.960 --> 00:12:04.420
componentes de tipo HDFS es

00:12:04.420 --> 00:12:07.020
que la lectura específica

00:12:07.020 --> 00:12:08.980
sean archivos delimitados

00:12:08.980 --> 00:12:10.700
te preguntarás si los archivos

00:12:10.700 --> 00:12:11.680
no están delimitados

00:12:11.680 --> 00:12:13.940
entonces te tocaría hacer un

00:12:13.940 --> 00:12:16.000
formateo de esos datos para

00:12:16.000 --> 00:12:16.780
que se han leído

00:12:16.780 --> 00:12:18.540
directamente con los componentes

00:12:18.540 --> 00:12:20.820
de HDFS ya con la versión

00:12:20.820 --> 00:12:21.740
comercial tienes otros

00:12:21.740 --> 00:12:22.800
componentes que pudieras

00:12:23.780 --> 00:12:24.500
agregar

00:12:24.500 --> 00:12:26.780
listo entonces el tipo de

00:12:26.780 --> 00:12:28.220
archivo es tipo textual

00:12:28.780 --> 00:12:30.380
esta parte aquí hay un tipo

00:12:30.380 --> 00:12:31.660
que se llama sequence files

00:12:31.660 --> 00:12:32.700
ese sequence file lo voy a

00:12:32.700 --> 00:12:34.120
explicar mejor con hype

00:12:34.120 --> 00:12:35.780
pero voy a dejarlo aquí con

00:12:35.780 --> 00:12:36.460
text

00:12:37.160 --> 00:12:39.040
el separador de fila es

00:12:39.040 --> 00:12:40.680
slash n

00:12:40.680 --> 00:12:41.820
separador de campo es

00:12:41.820 --> 00:12:42.680
punto y coma así entonces

00:12:42.680 --> 00:12:43.580
tiene que coincidir estos

00:12:43.580 --> 00:12:44.100
elementos

00:12:44.700 --> 00:12:46.580
y al final el header

00:12:48.060 --> 00:12:50.040
hay un header en ese archivo

00:12:50.040 --> 00:12:51.740
entonces le coloco uno

00:12:51.740 --> 00:12:53.580
diciéndole que la primera

00:12:53.580 --> 00:12:55.560
fila son los encabezados

00:12:55.560 --> 00:12:56.220
del archivo

00:12:56.960 --> 00:12:58.600
en pocas palabras en que no la

00:12:58.600 --> 00:13:00.680
lea como les decía y debe

00:13:00.680 --> 00:13:01.740
tener estos memorias y va a

00:13:01.740 --> 00:13:03.180
trabajar con esta herramienta

00:13:03.180 --> 00:13:04.200
todas las herramientas que

00:13:04.200 --> 00:13:05.540
tienen lectura y escritura de

00:13:05.540 --> 00:13:07.060
archivo tengo que con tengo

00:13:07.060 --> 00:13:08.220
que especificar un esquema

00:13:09.360 --> 00:13:11.260
entonces puede que varíe la

00:13:11.260 --> 00:13:12.440
posición en los componentes

00:13:12.440 --> 00:13:13.820
de talent lo que sí es

00:13:13.820 --> 00:13:15.040
seguro es que vas a encontrar

00:13:15.040 --> 00:13:16.740
esto en alguna parte de esta

00:13:16.740 --> 00:13:17.740
configuración de los

00:13:17.740 --> 00:13:19.320
componentes en este caso está

00:13:19.320 --> 00:13:20.260
en la parte de arriba y

00:13:20.260 --> 00:13:21.220
veces que está en la parte del

00:13:21.220 --> 00:13:22.040
medio y otro está en la

00:13:22.040 --> 00:13:22.980
parte de abajo

00:13:22.980 --> 00:13:24.080
entonces dele clic en

00:13:24.080 --> 00:13:26.060
editar esquema y este esquema

00:13:26.060 --> 00:13:28.020
de aquí yo puedo hacerlo de

00:13:28.020 --> 00:13:29.440
forma manual

00:13:30.060 --> 00:13:32.120
creo que podía ser bueno

00:13:32.120 --> 00:13:33.060
cuando la cantidad de

00:13:33.580 --> 00:13:34.620
columnas es muy pequeña

00:13:34.620 --> 00:13:36.040
quizás dos máximo cinco

00:13:36.040 --> 00:13:37.860
pero si la cantidad de filas

00:13:37.860 --> 00:13:40.100
es muy elevada lo mejor es que

00:13:40.100 --> 00:13:41.180
haga como hicimos el día de

00:13:41.180 --> 00:13:42.880
ayer creamos una metadata

00:13:43.460 --> 00:13:45.000
con el tipo de archivo

00:13:45.000 --> 00:13:47.040
recuperamos los datos en las

00:13:47.040 --> 00:13:48.200
columnas en el orden en que

00:13:48.200 --> 00:13:49.940
está y los tipos de datos que

00:13:49.940 --> 00:13:51.420
asumió la herramienta y

00:13:51.420 --> 00:13:52.540
mejor la importo esa es la

00:13:52.540 --> 00:13:53.780
mejor forma de hacerlo

00:13:53.780 --> 00:13:54.780
entonces aquí le damos

00:13:56.340 --> 00:13:58.040
importar y el día de ayer

00:13:59.540 --> 00:14:00.100
hicimos

00:14:00.700 --> 00:14:02.120
un esquema que se llama

00:14:02.120 --> 00:14:03.780
filactor.xml

00:14:04.500 --> 00:14:05.780
dele abrir por favor

00:14:06.540 --> 00:14:07.780
y dele aquí ok

00:14:10.540 --> 00:14:11.920
se cuenta que hasta el momento

00:14:11.920 --> 00:14:13.180
lo que hemos hecho es

00:14:13.180 --> 00:14:14.340
prácticamente lo del día de

00:14:14.340 --> 00:14:15.600
ayer en el cual nos estamos

00:14:15.600 --> 00:14:18.240
conectando a un archivo

00:14:18.240 --> 00:14:19.780
ahora pasa lo siguiente

00:14:21.460 --> 00:14:22.780
voy a resolver esto

00:14:22.960 --> 00:14:24.640
cómo voy a resolver esto

00:14:24.640 --> 00:14:26.020
bueno la idea va a ser la

00:14:26.720 --> 00:14:27.280
siguiente

00:14:27.840 --> 00:14:29.300
voy a intentar

00:14:29.300 --> 00:14:31.520
voy a decirle un poco la

00:14:31.520 --> 00:14:32.180
metodología que voy a

00:14:32.180 --> 00:14:33.160
trabajar el día de hoy el día

00:14:33.160 --> 00:14:34.260
del día de mañana

00:14:35.680 --> 00:14:37.260
quizás el yoke lo voy a

00:14:37.260 --> 00:14:38.960
resolver en algunos casos de

00:14:38.960 --> 00:14:40.380
forma ineficiente

00:14:40.380 --> 00:14:42.220
porque la idea que voy a

00:14:42.220 --> 00:14:43.620
buscar es que usted pueda

00:14:43.620 --> 00:14:45.160
ver la mayor cantidad de

00:14:45.160 --> 00:14:46.960
componentes en este curso

00:14:46.960 --> 00:14:49.340
o sea entonces podamos

00:14:49.340 --> 00:14:50.660
hacer los yoke con

00:14:50.660 --> 00:14:51.820
diferentes componentes y

00:14:51.820 --> 00:14:52.940
pueda ya tener digamos

00:14:52.940 --> 00:14:54.320
un background mucho más

00:14:54.320 --> 00:14:55.760
grande de que hace cada

00:14:56.780 --> 00:14:58.660
componente en el caso del

00:14:58.660 --> 00:14:59.960
talent big data

00:14:59.960 --> 00:15:01.440
entonces miren la cual va a

00:15:01.440 --> 00:15:02.900
ser la idea que cómo voy a

00:15:02.900 --> 00:15:04.180
resolver este señor que está

00:15:04.780 --> 00:15:05.260
acá

00:15:05.260 --> 00:15:07.740
se lo voy a resolver de esta

00:15:08.940 --> 00:15:09.420
manera

00:15:09.420 --> 00:15:10.180
de otro momento

00:15:12.180 --> 00:15:12.720
listo aquí

00:15:12.720 --> 00:15:15.100
este señor me está

00:15:16.160 --> 00:15:17.680
espera un momento que

00:15:17.680 --> 00:15:18.480
resuelva aquí algo

00:15:18.480 --> 00:15:20.020
bueno mejor lo veo acá

00:15:20.020 --> 00:15:20.940
porque me tiene hay unas

00:15:21.040 --> 00:15:21.160
piezas

00:15:22.540 --> 00:15:23.860
discúlpeme un momento y se

00:15:23.860 --> 00:15:25.040
lo muestro mejor acá

00:15:25.980 --> 00:15:27.060
por favor

00:15:31.360 --> 00:15:31.900
entonces

00:15:31.900 --> 00:15:33.520
por ejemplo lo siguiente

00:15:34.040 --> 00:15:35.240
en que yo tengo

00:15:36.040 --> 00:15:37.100
el año de la película

00:15:37.100 --> 00:15:38.640
noventa noventa noventa

00:15:38.640 --> 00:15:39.720
noventa y uno noventa y

00:15:39.720 --> 00:15:40.760
dos noventa y tres noventa

00:15:40.760 --> 00:15:41.040
y cuatro

00:15:41.740 --> 00:15:42.740
entonces lo que voy a hacer

00:15:42.740 --> 00:15:44.140
es lo siguiente voy a

00:15:44.140 --> 00:15:45.380
convertir el año en

00:15:45.380 --> 00:15:46.160
década

00:15:46.160 --> 00:15:47.900
en pocas palabras este

00:15:47.900 --> 00:15:49.440
año que está aquí noventa

00:15:49.440 --> 00:15:50.920
y uno lo voy a convertir

00:15:50.920 --> 00:15:52.260
en noventa

00:15:52.260 --> 00:15:53.380
porque a mí me interesa es

00:15:53.380 --> 00:15:54.160
la película

00:15:54.720 --> 00:15:56.160
más popular por década

00:15:56.160 --> 00:15:57.660
entonces los años los voy

00:15:57.660 --> 00:15:59.180
a convertir en década

00:15:59.920 --> 00:16:00.920
y ya después que convierta

00:16:00.920 --> 00:16:01.900
los años en década

00:16:01.900 --> 00:16:03.200
hago una agrupación

00:16:03.200 --> 00:16:04.560
y en esa agrupación

00:16:04.560 --> 00:16:05.680
entonces saco los

00:16:05.680 --> 00:16:06.740
diferentes elementos

00:16:07.880 --> 00:16:09.100
ok eso es lo que voy a

00:16:09.100 --> 00:16:10.180
hacer esa es la idea que

00:16:10.180 --> 00:16:10.920
voy a entonces

00:16:11.740 --> 00:16:13.200
listo ahora voy a hacer

00:16:13.200 --> 00:16:14.180
lo siguiente

00:16:14.180 --> 00:16:15.400
voy a usar un componente

00:16:15.400 --> 00:16:16.620
que es muy popular en

00:16:16.620 --> 00:16:16.920
talent

00:16:16.920 --> 00:16:18.500
que se utiliza mucho para

00:16:18.500 --> 00:16:19.920
mapear o para cambiar el

00:16:19.960 --> 00:16:20.920
formato de los datos

00:16:20.920 --> 00:16:22.440
en este caso voy a usar

00:16:22.440 --> 00:16:24.020
entonces el

00:16:24.020 --> 00:16:24.720
tema

00:16:28.620 --> 00:16:29.960
y voy inicialmente

00:16:30.660 --> 00:16:31.780
para hacer un

00:16:31.780 --> 00:16:31.960
testeo

00:16:32.520 --> 00:16:33.880
voy a colocar aquí un

00:16:33.880 --> 00:16:34.460
telocrow

00:16:34.460 --> 00:16:37.360
para testear el resultado

00:16:37.360 --> 00:16:39.720
que me va a dar

00:16:39.720 --> 00:16:40.880
listo entonces

00:16:40.880 --> 00:16:43.020
el telocrow

00:16:43.020 --> 00:16:44.820
voy a agregar otro

00:16:44.820 --> 00:16:45.800
componente que es

00:16:45.800 --> 00:16:45.960
fundamental

00:16:47.340 --> 00:16:49.580
que es un componente

00:16:49.580 --> 00:16:50.920
para agrupar datos

00:16:50.920 --> 00:16:52.160
voy a hacer entonces

00:16:52.160 --> 00:16:53.100
aquí un

00:16:53.100 --> 00:16:54.060
telocrow

00:16:54.060 --> 00:16:54.880
se llama

00:16:55.580 --> 00:16:55.780
telocrow

00:17:02.820 --> 00:17:03.520
telocrow

00:17:04.580 --> 00:17:05.340
y voy a usar otro

00:17:05.340 --> 00:17:06.500
componente que se llama

00:17:08.260 --> 00:17:08.960
telocrow

00:17:08.960 --> 00:17:10.020
componente muy

00:17:10.020 --> 00:17:11.320
utilizado en talent

00:17:12.660 --> 00:17:14.020
en este orden

00:17:14.020 --> 00:17:15.180
y voy a decirle

00:17:15.180 --> 00:17:17.120
la idea como tal

00:17:18.700 --> 00:17:19.820
aclaro que la idea

00:17:19.820 --> 00:17:21.120
fundamental es

00:17:21.120 --> 00:17:21.660
que haga yo

00:17:21.660 --> 00:17:22.700
que agregar un componente

00:17:22.700 --> 00:17:23.180
nuevo

00:17:23.840 --> 00:17:24.440
quizás

00:17:24.440 --> 00:17:25.380
esa no es la forma más

00:17:25.380 --> 00:17:26.380
eficiente pero

00:17:26.380 --> 00:17:27.360
aprovecho esta forma

00:17:27.360 --> 00:17:28.100
para agregar

00:17:28.100 --> 00:17:29.080
el test short

00:17:29.080 --> 00:17:29.760
y el

00:17:30.800 --> 00:17:31.400
telocrow

00:17:31.400 --> 00:17:32.360
entonces son

00:17:32.360 --> 00:17:33.280
cuantos componentes

00:17:33.280 --> 00:17:34.300
he agregado

00:17:34.300 --> 00:17:36.060
uno, dos, tres, cuatro, cinco

00:17:36.060 --> 00:17:36.120
componentes

00:17:36.700 --> 00:17:37.380
el input

00:17:37.380 --> 00:17:38.360
el temap

00:17:38.360 --> 00:17:39.360
el test shortrow

00:17:39.360 --> 00:17:40.120
el telocrow

00:17:40.900 --> 00:17:41.380
y el

00:17:41.380 --> 00:17:41.780
telocrow

00:17:41.780 --> 00:17:42.980
el telocrow

00:17:42.980 --> 00:17:43.960
ya saben que

00:17:43.960 --> 00:17:44.580
hay algunos

00:17:44.580 --> 00:17:45.620
componentes en talent

00:17:45.620 --> 00:17:46.620
que no están

00:17:46.620 --> 00:17:47.700
instalados

00:17:47.700 --> 00:17:48.300
básicamente

00:17:48.300 --> 00:17:49.620
técnicamente que es

00:17:49.620 --> 00:17:50.940
en el caso de java

00:17:50.940 --> 00:17:51.600
como este está

00:17:51.600 --> 00:17:52.460
basado en java

00:17:52.460 --> 00:17:53.340
es descargar un

00:17:53.340 --> 00:17:54.460
punto YAR

00:17:54.460 --> 00:17:55.540
que es el que tiene

00:17:55.540 --> 00:17:56.920
la codificación

00:17:56.920 --> 00:17:57.620
de ese componente

00:17:58.960 --> 00:18:00.080
primero entonces

00:18:01.940 --> 00:18:02.500
aquí

00:18:02.500 --> 00:18:03.760
hay dos

00:18:03.760 --> 00:18:04.820
corrientes

00:18:05.620 --> 00:18:06.820
de personas

00:18:07.840 --> 00:18:09.020
elige cual va a ser

00:18:09.020 --> 00:18:09.700
la forma en que

00:18:09.700 --> 00:18:10.560
tu quieres trabajar

00:18:10.560 --> 00:18:12.060
una forma es

00:18:12.060 --> 00:18:12.480
la que hice

00:18:12.480 --> 00:18:13.640
ahora mismo es que

00:18:13.640 --> 00:18:14.440
yo tengo todos

00:18:14.440 --> 00:18:15.440
los componentes

00:18:16.180 --> 00:18:17.560
agrego todos los componentes

00:18:17.560 --> 00:18:18.000
de java

00:18:18.000 --> 00:18:18.880
los conecto

00:18:18.880 --> 00:18:19.520
y después los

00:18:19.520 --> 00:18:20.300
configuro

00:18:20.300 --> 00:18:21.080
hay personas que

00:18:21.080 --> 00:18:21.440
no le gusta

00:18:21.440 --> 00:18:21.960
trabajar así

00:18:21.960 --> 00:18:23.100
hay personas que

00:18:23.100 --> 00:18:23.840
van agregando

00:18:23.840 --> 00:18:24.700
componentes

00:18:24.700 --> 00:18:25.560
según lo que van

00:18:25.560 --> 00:18:26.600
requiriendo

00:18:26.600 --> 00:18:27.180
al fin

00:18:27.180 --> 00:18:28.160
adaptate como

00:18:28.160 --> 00:18:28.740
tú

00:18:28.740 --> 00:18:29.800
digamos como

00:18:29.800 --> 00:18:30.720
mejor crees tú

00:18:30.720 --> 00:18:31.360
que

00:18:31.360 --> 00:18:32.380
trabajes más rápido

00:18:32.380 --> 00:18:34.040
en este caso

00:18:34.040 --> 00:18:34.700
voy a conectar

00:18:34.700 --> 00:18:35.220
entonces

00:18:35.220 --> 00:18:37.280
el HDFS input

00:18:37.280 --> 00:18:38.320
con

00:18:38.320 --> 00:18:41.260
el temap

00:18:41.260 --> 00:18:42.700
el temap

00:18:42.700 --> 00:18:44.140
y lo conecto

00:18:44.140 --> 00:18:44.760
con el

00:18:44.760 --> 00:18:45.580
techo row

00:18:46.840 --> 00:18:47.760
y voy a

00:18:47.760 --> 00:18:48.420
colocar aquí

00:18:48.420 --> 00:18:49.720
como salida

00:18:51.360 --> 00:18:52.000
ordenar

00:18:53.660 --> 00:18:54.300
registros

00:18:55.740 --> 00:18:57.060
voy a conectar

00:18:57.060 --> 00:18:57.860
el techo row

00:18:57.860 --> 00:18:58.340
con el

00:18:58.340 --> 00:18:59.700
T-aggregated

00:19:02.500 --> 00:19:03.680
e inicialmente

00:19:03.680 --> 00:19:04.420
voy a mandar

00:19:04.420 --> 00:19:06.180
el T-aggregated row

00:19:06.180 --> 00:19:06.920
al

00:19:07.820 --> 00:19:08.460
techo

00:19:08.460 --> 00:19:08.900
log row

00:19:08.900 --> 00:19:09.700
este techo lo voy a

00:19:09.700 --> 00:19:10.260
tener ahí

00:19:10.260 --> 00:19:10.780
inicialmente

00:19:10.780 --> 00:19:11.220
solamente

00:19:11.220 --> 00:19:12.900
es para

00:19:12.900 --> 00:19:13.460
para

00:19:13.460 --> 00:19:13.920
comprobar

00:19:13.920 --> 00:19:15.540
antes de

00:19:15.540 --> 00:19:16.060
finalizar

00:19:16.060 --> 00:19:16.660
el job

00:19:16.660 --> 00:19:17.140
completo

00:19:17.140 --> 00:19:17.540
voy a

00:19:17.540 --> 00:19:17.920
comprobar

00:19:17.920 --> 00:19:19.040
que lo que quiero

00:19:19.040 --> 00:19:20.020
hacer

00:19:20.020 --> 00:19:20.680
es lo que me

00:19:20.680 --> 00:19:21.240
está dando el job

00:19:21.240 --> 00:19:21.860
recordamos

00:19:21.860 --> 00:19:22.520
como tip

00:19:22.520 --> 00:19:23.240
entonces

00:19:23.240 --> 00:19:23.880
que

00:19:23.880 --> 00:19:24.500
ese punto

00:19:24.500 --> 00:19:24.940
rojo que

00:19:24.940 --> 00:19:25.740
tenemos ahí

00:19:25.740 --> 00:19:26.220
en el

00:19:26.220 --> 00:19:26.800
temap

00:19:26.800 --> 00:19:27.300
o en

00:19:27.300 --> 00:19:27.640
cualquier

00:19:27.640 --> 00:19:28.160
componente

00:19:28.160 --> 00:19:28.540
que tenga

00:19:39.740 --> 00:19:40.340
detalle

00:19:40.340 --> 00:19:40.620
y te

00:19:40.620 --> 00:19:40.860
hace

00:19:40.860 --> 00:19:41.440
falta una

00:19:41.440 --> 00:19:42.060
configuración

00:19:43.300 --> 00:19:44.140
ahí

00:19:44.140 --> 00:19:45.220
bien

00:19:45.220 --> 00:19:45.720
entonces

00:19:45.720 --> 00:19:46.540
veamos

00:19:46.540 --> 00:19:47.760
vamos a

00:19:47.760 --> 00:19:48.100
configurar

00:19:48.100 --> 00:19:48.900
inicialmente

00:19:48.900 --> 00:19:49.660
el tema

00:19:49.660 --> 00:19:51.240
recuerda que

00:19:51.240 --> 00:19:51.960
como

00:19:51.960 --> 00:19:52.780
como

00:19:52.780 --> 00:19:53.020
buena

00:19:53.020 --> 00:19:53.540
práctica

00:19:53.540 --> 00:19:53.860
te

00:19:53.860 --> 00:19:54.340
recomiendo

00:19:54.340 --> 00:19:54.780
en que

00:19:54.780 --> 00:19:55.440
no dejes

00:19:55.440 --> 00:19:55.720
estas

00:19:55.720 --> 00:19:56.600
conexiones

00:19:56.600 --> 00:19:57.620
con

00:19:57.620 --> 00:19:57.900
nombres

00:19:57.900 --> 00:19:58.560
genéricos

00:19:58.560 --> 00:19:59.140
row 1

00:19:59.140 --> 00:20:00.480
row 2

00:20:00.480 --> 00:20:01.300
solamente

00:20:01.300 --> 00:20:09.620
la voy a

00:20:09.620 --> 00:20:09.860
cambiar

00:20:09.860 --> 00:20:11.480
a ese row 1

00:20:11.480 --> 00:20:12.440
dale click

00:20:12.440 --> 00:20:12.840
primero en

00:20:12.840 --> 00:20:13.300
un row 1

00:20:13.300 --> 00:20:13.680
y después

00:20:13.680 --> 00:20:14.840
otra vez click

00:20:16.120 --> 00:20:16.900
y lo más

00:20:16.900 --> 00:20:17.540
recomendable

00:20:17.540 --> 00:20:17.980
es que

00:20:17.980 --> 00:20:18.280
le des

00:20:18.280 --> 00:20:18.920
el nombre

00:20:18.920 --> 00:20:19.480
de la

00:20:19.480 --> 00:20:19.720
de la

00:20:19.720 --> 00:20:19.900
entrada

00:20:19.900 --> 00:20:20.480
en este caso

00:20:20.480 --> 00:20:20.800
como el

00:20:20.800 --> 00:20:21.280
archivo se llama

00:20:21.280 --> 00:20:22.140
fill actor

00:20:22.140 --> 00:20:22.720
voy a

00:20:22.720 --> 00:20:23.800
cambiar ese row a

00:20:23.800 --> 00:20:24.080
fill

00:20:24.080 --> 00:20:25.360
on the record actor

00:20:25.360 --> 00:20:26.140
eso no

00:20:26.140 --> 00:20:26.560
más lo voy a

00:20:26.560 --> 00:20:26.860
hacer aquí

00:20:26.860 --> 00:20:27.360
para recordar

00:20:27.360 --> 00:20:27.620
de ayer

00:20:27.620 --> 00:20:27.920
lo demás

00:20:27.920 --> 00:20:28.180
no lo

00:20:28.180 --> 00:20:28.620
voy a hacer

00:20:28.620 --> 00:20:29.980
para evitar

00:20:29.980 --> 00:20:30.300
veníamos

00:20:30.300 --> 00:20:30.920
para

00:20:30.920 --> 00:20:31.260
no

00:20:31.980 --> 00:20:32.580
consumir

00:20:32.580 --> 00:20:33.200
tanto tiempo

00:20:33.200 --> 00:20:33.900
vamos entonces

00:20:33.900 --> 00:20:34.440
aquí ahora

00:20:34.440 --> 00:20:35.120
a configurar

00:20:38.760 --> 00:20:39.560
el tema

00:20:41.880 --> 00:20:42.480
nota

00:20:42.480 --> 00:20:43.060
entonces

00:20:43.060 --> 00:20:43.460
que

00:20:43.460 --> 00:20:44.060
aquí

00:20:44.060 --> 00:20:44.580
aparece

00:20:44.580 --> 00:20:45.340
fill actor

00:20:45.340 --> 00:20:46.020
que fue

00:20:46.020 --> 00:20:46.560
el nombre

00:20:46.560 --> 00:20:46.880
de la

00:20:46.880 --> 00:20:47.100
entrada

00:20:47.100 --> 00:20:47.640
recuerda que

00:20:47.640 --> 00:20:48.400
cambia row 1

00:20:48.400 --> 00:20:49.240
a fill actor

00:20:49.240 --> 00:20:49.780
entonces

00:20:49.780 --> 00:20:50.280
esto que

00:20:50.280 --> 00:20:50.620
está acá

00:20:50.620 --> 00:20:51.580
arriba

00:20:51.580 --> 00:20:52.280
tiene

00:20:52.280 --> 00:20:53.480
el nombre

00:20:53.480 --> 00:20:53.940
de la entrada

00:20:53.940 --> 00:20:54.700
por eso es que

00:20:54.700 --> 00:20:55.960
es más recomendable

00:20:55.960 --> 00:20:56.340
que le des

00:20:56.340 --> 00:20:56.760
el nombre

00:20:56.760 --> 00:20:57.060
allá

00:20:57.060 --> 00:20:57.580
para que

00:20:57.580 --> 00:20:57.880
puedas

00:20:57.880 --> 00:20:58.560
guiarte mejor

00:20:58.560 --> 00:20:59.080
aquí en el

00:20:59.080 --> 00:20:59.360
tema

00:20:59.360 --> 00:21:00.260
y más cuando

00:21:00.260 --> 00:21:00.760
vayas a hacer

00:21:00.760 --> 00:21:01.180
un joy

00:21:01.180 --> 00:21:01.620
a nivel

00:21:01.620 --> 00:21:02.200
de TL

00:21:02.200 --> 00:21:02.860
listo

00:21:02.860 --> 00:21:03.600
nota lo siguiente

00:21:03.600 --> 00:21:03.980
ahora

00:21:03.980 --> 00:21:04.840
estos archivos

00:21:04.840 --> 00:21:05.620
estas columnas

00:21:05.620 --> 00:21:05.900
que están

00:21:05.900 --> 00:21:06.220
aquí

00:21:06.220 --> 00:21:06.980
corresponden a

00:21:06.980 --> 00:21:07.500
las columnas

00:21:07.500 --> 00:21:07.960
de la entrada

00:21:07.960 --> 00:21:08.400
del input

00:21:08.400 --> 00:21:08.960
recordar

00:21:08.960 --> 00:21:09.480
aquel input

00:21:09.480 --> 00:21:09.860
hicimos

00:21:09.860 --> 00:21:10.400
un esquema

00:21:10.400 --> 00:21:11.400
e importamos

00:21:11.400 --> 00:21:12.480
los diferentes

00:21:12.480 --> 00:21:13.000
columnas

00:21:13.000 --> 00:21:13.760
que va a tener

00:21:13.760 --> 00:21:14.600
y acá también

00:21:14.600 --> 00:21:15.300
coincide los tipos

00:21:15.300 --> 00:21:15.660
de datos

00:21:15.660 --> 00:21:16.360
tú puedes cambiar

00:21:16.360 --> 00:21:16.760
los tipos

00:21:16.760 --> 00:21:17.080
de datos

00:21:17.080 --> 00:21:17.980
si tú quieres acá

00:21:17.980 --> 00:21:18.860
pero tienes que

00:21:18.860 --> 00:21:19.420
tener muy

00:21:19.420 --> 00:21:19.960
pendiente

00:21:19.960 --> 00:21:20.560
que de pronto

00:21:20.560 --> 00:21:20.880
puede haber

00:21:20.880 --> 00:21:21.180
unas

00:21:21.180 --> 00:21:21.540
conversiones

00:21:21.540 --> 00:21:22.180
en que

00:21:22.180 --> 00:21:22.660
el lenguaje

00:21:22.660 --> 00:21:23.200
ya no las

00:21:23.200 --> 00:21:23.820
permita

00:21:23.820 --> 00:21:24.600
por ejemplo

00:21:24.600 --> 00:21:25.540
si yo

00:21:25.540 --> 00:21:25.940
intentara

00:21:25.940 --> 00:21:26.360
no la gusta

00:21:26.360 --> 00:21:26.960
ya por favor

00:21:26.960 --> 00:21:27.680
si yo intentara

00:21:27.680 --> 00:21:28.340
cambiar este

00:21:28.340 --> 00:21:29.160
de integer

00:21:29.160 --> 00:21:30.240
a string

00:21:30.840 --> 00:21:31.520
aquí va a ver

00:21:31.520 --> 00:21:31.940
un error

00:21:31.940 --> 00:21:32.320
¿por qué?

00:21:32.380 --> 00:21:33.120
porque el

00:21:33.120 --> 00:21:33.560
dato viene

00:21:33.560 --> 00:21:34.260
de tipo integer

00:21:34.260 --> 00:21:34.880
de la entrada

00:21:34.880 --> 00:21:35.780
y cuando

00:21:35.780 --> 00:21:36.180
llega aquí

00:21:36.180 --> 00:21:37.000
lo intenta convertir

00:21:37.000 --> 00:21:37.300
a string

00:21:37.300 --> 00:21:37.940
y esa

00:21:37.940 --> 00:21:38.340
esa conversión

00:21:38.340 --> 00:21:38.960
no la puede hacer

00:21:38.960 --> 00:21:39.620
directamente

00:21:40.420 --> 00:21:40.860
entonces

00:21:40.860 --> 00:21:42.100
sí puedes cambiar

00:21:42.100 --> 00:21:42.500
los tipos

00:21:42.500 --> 00:21:42.840
de datos

00:21:42.840 --> 00:21:43.460
pero tienes que

00:21:43.460 --> 00:21:43.900
estar muy

00:21:43.900 --> 00:21:44.360
pendiente

00:21:44.360 --> 00:21:45.080
en cómo

00:21:45.080 --> 00:21:45.780
vas a convertir

00:21:45.780 --> 00:21:46.220
esos tipos

00:21:46.220 --> 00:21:46.600
de datos

00:21:46.600 --> 00:21:47.040
¿ok?

00:21:48.280 --> 00:21:49.080
no voy a hacer

00:21:49.080 --> 00:21:49.620
tanto ejemplo

00:21:49.620 --> 00:21:50.420
con esto porque

00:21:50.420 --> 00:21:50.980
lo principal

00:21:50.980 --> 00:21:51.360
aquí es

00:21:51.360 --> 00:21:51.820
big data

00:21:51.820 --> 00:21:52.800
esto normalmente

00:21:52.800 --> 00:21:54.440
venía de un curso

00:21:54.440 --> 00:21:55.160
de tres días

00:21:55.160 --> 00:21:55.780
que se llamaba

00:21:55.780 --> 00:21:56.660
talent data integration

00:21:56.660 --> 00:21:57.140
donde usted

00:21:57.140 --> 00:21:57.600
aprendía esta

00:21:57.600 --> 00:21:58.500
parte pero

00:21:58.500 --> 00:21:59.260
no me puedo

00:21:59.260 --> 00:21:59.980
demorar mucho

00:21:59.980 --> 00:22:01.120
en ciertos

00:22:01.120 --> 00:22:01.500
detallitos

00:22:01.500 --> 00:22:02.540
aquí

00:22:02.540 --> 00:22:03.600
normalmente

00:22:03.600 --> 00:22:03.960
¿cómo

00:22:03.960 --> 00:22:05.280
hace para mapear

00:22:05.280 --> 00:22:05.800
datos

00:22:05.800 --> 00:22:07.520
en esta herramienta

00:22:07.520 --> 00:22:08.500
para mapear

00:22:08.500 --> 00:22:09.240
datos entonces

00:22:09.240 --> 00:22:09.800
aquí tengo

00:22:09.800 --> 00:22:10.740
el dato de entrada

00:22:11.500 --> 00:22:12.420
y para mapear

00:22:12.420 --> 00:22:12.860
el dato

00:22:12.860 --> 00:22:13.760
lo más recomendable

00:22:13.760 --> 00:22:14.180
es que hagas

00:22:14.180 --> 00:22:14.740
lo siguiente

00:22:14.740 --> 00:22:15.420
que definas

00:22:15.420 --> 00:22:16.040
una variable

00:22:16.740 --> 00:22:17.300
intermedia

00:22:17.300 --> 00:22:17.920
entonces

00:22:17.920 --> 00:22:18.620
dale click

00:22:18.620 --> 00:22:19.020
aquí

00:22:19.020 --> 00:22:20.440
en variable

00:22:21.860 --> 00:22:22.780
en el más

00:22:22.780 --> 00:22:25.080
este que está ahí

00:22:25.080 --> 00:22:26.080
aquí te pide

00:22:26.080 --> 00:22:26.720
un tipo

00:22:26.720 --> 00:22:27.360
de datos

00:22:27.360 --> 00:22:28.160
y en este

00:22:28.160 --> 00:22:29.000
caso quiero que

00:22:29.000 --> 00:22:29.640
el tipo de

00:22:29.640 --> 00:22:29.920
datos de

00:22:29.920 --> 00:22:30.200
salida

00:22:30.200 --> 00:22:32.100
sea un entero

00:22:32.100 --> 00:22:32.940
entonces

00:22:32.940 --> 00:22:34.260
voy a cambiar

00:22:34.260 --> 00:22:35.860
esto a entero

00:22:35.860 --> 00:22:36.860
a integer

00:22:39.860 --> 00:22:40.660
y nota que

00:22:40.660 --> 00:22:41.480
del lado

00:22:41.480 --> 00:22:42.220
siguiente

00:22:42.220 --> 00:22:42.960
o sea la columna

00:22:42.960 --> 00:22:43.800
siguiente al table

00:22:43.800 --> 00:22:44.960
que tienes

00:22:44.960 --> 00:22:46.020
te está el nombre

00:22:46.020 --> 00:22:46.560
la variable

00:22:46.560 --> 00:22:47.280
esta variable

00:22:47.280 --> 00:22:49.300
la voy a llamar

00:22:52.980 --> 00:22:53.620
década

00:22:55.860 --> 00:22:55.920
solamente

00:22:55.920 --> 00:22:56.800
como

00:22:56.800 --> 00:22:57.500
elemento

00:22:58.640 --> 00:22:59.280
informativo

00:22:59.280 --> 00:23:00.220
nota que

00:23:00.220 --> 00:23:00.840
al ladito

00:23:00.840 --> 00:23:01.520
de la variable

00:23:01.520 --> 00:23:02.220
vas a tener un

00:23:02.220 --> 00:23:03.280
check box

00:23:03.280 --> 00:23:03.900
cierto

00:23:04.560 --> 00:23:05.080
si

00:23:05.080 --> 00:23:05.860
ese check box

00:23:05.860 --> 00:23:07.240
está habilitado

00:23:07.240 --> 00:23:07.700
nota que

00:23:07.700 --> 00:23:08.240
te cambia

00:23:08.240 --> 00:23:08.900
el tipo de datos

00:23:08.900 --> 00:23:09.440
de int

00:23:09.440 --> 00:23:10.460
a integer

00:23:11.060 --> 00:23:11.860
me explico

00:23:11.860 --> 00:23:12.380
lo que pasa

00:23:12.380 --> 00:23:13.220
es que int

00:23:13.220 --> 00:23:13.960
es lo que llaman

00:23:13.960 --> 00:23:14.560
un tipo de datos

00:23:14.560 --> 00:23:15.820
simple en java

00:23:15.820 --> 00:23:16.600
e integer

00:23:16.600 --> 00:23:17.520
es un tipo

00:23:17.520 --> 00:23:17.860
de datos

00:23:17.860 --> 00:23:18.420
object

00:23:18.420 --> 00:23:19.680
en pocas palabras

00:23:19.680 --> 00:23:20.440
en palabras llanas

00:23:20.440 --> 00:23:20.880
y castas

00:23:20.880 --> 00:23:22.000
para que sirve eso

00:23:22.000 --> 00:23:23.540
si la expresión

00:23:23.540 --> 00:23:23.880
te va a

00:23:23.880 --> 00:23:25.880
volver un nulo

00:23:25.880 --> 00:23:26.620
tienes que

00:23:26.620 --> 00:23:26.980
definirlo

00:23:26.980 --> 00:23:27.520
como queto

00:23:27.520 --> 00:23:28.900
o sea como integer

00:23:28.900 --> 00:23:29.580
o sea tienes que

00:23:29.580 --> 00:23:30.740
estar chuleado

00:23:30.740 --> 00:23:31.620
si sabes

00:23:31.620 --> 00:23:32.840
que la expresión

00:23:32.840 --> 00:23:33.740
no te devuelve

00:23:33.740 --> 00:23:34.440
integer siempre

00:23:34.440 --> 00:23:35.380
te devuelve un valor

00:23:35.380 --> 00:23:36.640
entonces lo dejas

00:23:36.640 --> 00:23:37.360
de tipo simple

00:23:37.360 --> 00:23:37.760
o sea

00:23:37.760 --> 00:23:39.560
sin chulearlo

00:23:39.560 --> 00:23:40.820
porque hay un error

00:23:40.820 --> 00:23:41.280
si lo

00:23:41.280 --> 00:23:41.840
si por ejemplo

00:23:41.840 --> 00:23:42.880
si tienes tipo simple

00:23:42.880 --> 00:23:43.520
así como está

00:23:43.520 --> 00:23:44.180
inicialmente

00:23:44.180 --> 00:23:45.020
sin el chulito

00:23:45.020 --> 00:23:46.660
y te devuelva a nulo

00:23:46.660 --> 00:23:47.220
que sale un error

00:23:47.220 --> 00:23:48.480
de ejecución

00:23:48.480 --> 00:23:49.440
porque los tipos

00:23:49.440 --> 00:23:50.040
simples en java

00:23:50.040 --> 00:23:50.640
siempre tienen que

00:23:50.640 --> 00:23:51.320
tener un valor

00:23:51.320 --> 00:23:52.680
esto no es de talent

00:23:52.680 --> 00:23:53.540
esto es necesariamente

00:23:53.540 --> 00:23:55.800
de java

00:23:55.800 --> 00:23:57.200
listo entonces

00:23:57.800 --> 00:23:58.940
aquí hay varias formas

00:23:58.940 --> 00:23:59.720
de hacer lo mismo

00:23:59.720 --> 00:24:00.900
voy a empezar con una

00:24:00.900 --> 00:24:01.840
quiero tomar

00:24:01.840 --> 00:24:03.000
ese campo que se llama

00:24:03.000 --> 00:24:03.600
gear

00:24:04.560 --> 00:24:05.860
y pasarlo y hacer

00:24:05.860 --> 00:24:06.420
una operación

00:24:06.420 --> 00:24:07.740
para convertirlo en una década

00:24:07.740 --> 00:24:08.380
entonces

00:24:08.380 --> 00:24:10.060
voy a tomar esta columna

00:24:10.060 --> 00:24:10.900
que se llama gear

00:24:10.900 --> 00:24:11.760
y la voy a soltar

00:24:11.760 --> 00:24:12.960
aquí donde dice expression

00:24:14.440 --> 00:24:15.800
para que sea más sencillo

00:24:16.880 --> 00:24:17.920
cuando colocas

00:24:17.920 --> 00:24:18.520
el mouse

00:24:18.520 --> 00:24:20.260
en la expresión

00:24:20.260 --> 00:24:21.240
dale click aquí

00:24:21.800 --> 00:24:22.880
y se te va a habilitar

00:24:22.880 --> 00:24:23.820
un botoncito

00:24:23.820 --> 00:24:24.300
que te va a abrir

00:24:24.300 --> 00:24:24.960
un texaria

00:24:24.960 --> 00:24:25.820
de configuración

00:24:25.820 --> 00:24:26.600
dale click

00:24:26.600 --> 00:24:28.500
ahí en ese botón

00:24:28.500 --> 00:24:29.060
por favor

00:24:29.060 --> 00:24:30.340
para que te aparezca

00:24:30.340 --> 00:24:31.300
un texario

00:24:35.280 --> 00:24:36.560
eso mismo que hice

00:24:36.560 --> 00:24:38.020
de tomar ese gear

00:24:38.020 --> 00:24:39.380
y pasarlo a este lado

00:24:39.380 --> 00:24:40.120
lo hubiese hecho

00:24:40.120 --> 00:24:40.780
también igual

00:24:40.780 --> 00:24:41.300
no lo haga

00:24:41.300 --> 00:24:42.080
para que lo tenga usted

00:24:42.080 --> 00:24:42.660
allá nada más

00:24:42.660 --> 00:24:43.440
para que no tenga que hacer

00:24:43.440 --> 00:24:44.540
dos cosas

00:24:45.340 --> 00:24:45.860
es

00:24:45.860 --> 00:24:46.920
abro la expresión

00:24:46.920 --> 00:24:47.460
vacía

00:24:47.460 --> 00:24:48.800
y aquí me aparecen

00:24:48.800 --> 00:24:49.780
todas las columnas

00:24:49.780 --> 00:24:50.540
de entrada que están

00:24:50.540 --> 00:24:50.980
de este lado

00:24:50.980 --> 00:24:51.540
tanto si yo pude

00:24:51.540 --> 00:24:52.640
también haber hecho esto

00:24:52.640 --> 00:24:53.460
darle doble click

00:24:53.460 --> 00:24:54.420
y me hubiese hecho

00:24:54.980 --> 00:24:56.260
exactamente lo mismo

00:24:56.980 --> 00:24:57.100
ok

00:24:57.980 --> 00:24:58.720
ahora nota que

00:24:58.720 --> 00:25:00.400
en la parte de aquí abajo

00:25:00.980 --> 00:25:01.720
te aparecen

00:25:01.720 --> 00:25:03.980
una parte de funciones

00:25:06.280 --> 00:25:06.980
estas funciones

00:25:07.820 --> 00:25:08.900
estas funciones

00:25:08.900 --> 00:25:09.760
que te aparecen

00:25:09.760 --> 00:25:10.780
de este lado

00:25:10.780 --> 00:25:12.400
no cierre solamente

00:25:12.400 --> 00:25:13.440
mira mi pantalla

00:25:13.440 --> 00:25:14.200
esas funciones

00:25:14.200 --> 00:25:14.940
que te aparecen

00:25:14.940 --> 00:25:15.860
de ese lado

00:25:15.860 --> 00:25:17.580
son las mismas funciones

00:25:17.580 --> 00:25:18.560
que te

00:25:18.560 --> 00:25:19.880
que has agregado

00:25:19.880 --> 00:25:20.520
en esta sesión

00:25:20.520 --> 00:25:21.400
que hice code

00:25:22.340 --> 00:25:23.440
en esta sesión

00:25:23.440 --> 00:25:24.300
code

00:25:24.300 --> 00:25:25.540
donde están unos códigos

00:25:25.540 --> 00:25:26.400
hechos netamente

00:25:26.400 --> 00:25:27.640
en java

00:25:27.640 --> 00:25:28.300
esta que está

00:25:28.300 --> 00:25:28.840
no la está

00:25:28.840 --> 00:25:29.720
mira lo de este lado

00:25:29.720 --> 00:25:30.920
son las funciones

00:25:30.920 --> 00:25:32.260
que te aparecen allá

00:25:32.260 --> 00:25:33.980
entonces tú puedes agregar

00:25:33.980 --> 00:25:34.760
nuevas funciones

00:25:34.760 --> 00:25:36.220
tú las codificas

00:25:36.220 --> 00:25:37.100
nuevas funciones

00:25:37.100 --> 00:25:38.260
y las puedes re-usar

00:25:38.260 --> 00:25:38.860
n veces

00:25:38.860 --> 00:25:39.900
en los proyectos

00:25:39.900 --> 00:25:40.600
que tengo

00:25:40.600 --> 00:25:41.560
mi recomendación

00:25:41.560 --> 00:25:42.200
yo nunca lo he hecho

00:25:42.200 --> 00:25:43.500
mi recomendación es

00:25:43.500 --> 00:25:44.360
si sabes que vas a crear

00:25:44.360 --> 00:25:44.880
una función

00:25:44.880 --> 00:25:46.000
en que la vas a re-usar

00:25:46.000 --> 00:25:47.160
en njobs

00:25:47.160 --> 00:25:48.660
sería bueno que la codifiques

00:25:48.660 --> 00:25:49.740
pero si la vas a usar

00:25:49.740 --> 00:25:50.240
un solo joc

00:25:50.240 --> 00:25:51.040
haz el código

00:25:51.040 --> 00:25:52.220
en algo que te voy a mostrar

00:25:52.220 --> 00:25:52.760
más adelante

00:25:53.660 --> 00:25:54.040
haz el código

00:25:54.040 --> 00:25:55.000
en un componente

00:25:55.000 --> 00:25:55.840
que se llama te-java

00:25:55.840 --> 00:25:56.740
y listo

00:25:56.740 --> 00:25:58.060
lo pones el código ahí

00:25:58.060 --> 00:25:59.240
pero creo que

00:25:59.240 --> 00:26:00.000
desgastarse

00:26:00.000 --> 00:26:01.540
en subir esto acá

00:26:01.540 --> 00:26:02.720
colocarlo en el formato

00:26:02.720 --> 00:26:04.160
que lo especifica tal

00:26:04.160 --> 00:26:05.380
creo que es

00:26:05.380 --> 00:26:05.960
mucho trabajo

00:26:05.960 --> 00:26:06.760
para algo que de pronto

00:26:06.760 --> 00:26:07.640
vas a usar solamente

00:26:07.640 --> 00:26:08.660
un solo joc

00:26:09.700 --> 00:26:10.180
listo

00:26:10.180 --> 00:26:11.020
me devuelvo entonces

00:26:11.020 --> 00:26:11.600
nuevamente

00:26:11.600 --> 00:26:13.220
era solamente informativo

00:26:13.220 --> 00:26:14.640
esa parte aquí

00:26:15.320 --> 00:26:16.620
y voy a convertir

00:26:16.620 --> 00:26:17.400
este año

00:26:19.200 --> 00:26:20.700
voy a convertir

00:26:20.700 --> 00:26:21.500
este año

00:26:21.500 --> 00:26:21.660
entonces

00:26:22.240 --> 00:26:23.860
en una década

00:26:23.860 --> 00:26:25.240
para hacer esto

00:26:25.240 --> 00:26:26.860
esto es netamente java

00:26:26.860 --> 00:26:27.820
hago lo siguiente

00:26:27.820 --> 00:26:29.660
divido entre 10

00:26:29.660 --> 00:26:32.640
y multiplico por 10

00:26:34.800 --> 00:26:39.200
ya le explico entonces

00:26:42.680 --> 00:26:43.880
divido entre 10

00:26:43.880 --> 00:26:44.980
y multiplico por 10

00:26:44.980 --> 00:26:46.180
explico de forma sencilla

00:26:46.180 --> 00:26:47.300
que fue lo que hice ahí

00:26:47.300 --> 00:26:48.640
y esto al final

00:26:48.640 --> 00:26:50.580
termina siendo

00:26:50.580 --> 00:26:51.760
netamente algo

00:26:51.760 --> 00:26:52.640
particular de java

00:26:52.640 --> 00:26:53.560
entonces

00:26:53.560 --> 00:26:54.520
pasa lo siguiente

00:26:54.520 --> 00:26:55.520
supongamos que tú tengas

00:26:55.520 --> 00:26:56.640
este número integer

00:26:58.840 --> 00:26:59.640
giar

00:26:59.640 --> 00:27:01.840
igual a 1991

00:27:02.840 --> 00:27:04.680
si yo por ejemplo

00:27:04.680 --> 00:27:05.180
digo

00:27:05.180 --> 00:27:05.640
giar

00:27:06.600 --> 00:27:08.660
entre 10

00:27:08.660 --> 00:27:10.640
si el dato

00:27:10.640 --> 00:27:11.940
este es entero

00:27:11.940 --> 00:27:12.960
notará lo siguiente

00:27:12.960 --> 00:27:13.900
que giar entre 10

00:27:13.900 --> 00:27:14.460
daría

00:27:14.460 --> 00:27:15.640
1999,1

00:27:16.440 --> 00:27:16.920
verdad

00:27:16.920 --> 00:27:18.620
pero como el dato

00:27:18.620 --> 00:27:19.220
es entero

00:27:19.220 --> 00:27:20.300
entonces la división

00:27:20.300 --> 00:27:21.060
de dos entero

00:27:21.060 --> 00:27:21.560
en java

00:27:21.560 --> 00:27:22.700
da en otro entero

00:27:22.700 --> 00:27:23.360
por lo tanto

00:27:23.360 --> 00:27:24.620
esta parte real se quita

00:27:24.620 --> 00:27:25.200
y me daría

00:27:25.200 --> 00:27:26.220
199

00:27:26.920 --> 00:27:27.480
1999

00:27:27.480 --> 00:27:29.700
si lo multiplico

00:27:29.700 --> 00:27:30.120
por 10

00:27:30.620 --> 00:27:31.020
convierto el año

00:27:31.620 --> 00:27:31.740
91

00:27:32.480 --> 00:27:33.600
en 1990

00:27:33.600 --> 00:27:34.200
que es la década

00:27:34.200 --> 00:27:35.640
que quiero

00:27:35.640 --> 00:27:36.160
ahora

00:27:36.160 --> 00:27:37.060
si el dato

00:27:37.620 --> 00:27:38.680
es un doble

00:27:38.680 --> 00:27:39.700
en java

00:27:39.700 --> 00:27:40.500
por ejemplo

00:27:40.500 --> 00:27:41.120
doble

00:27:41.120 --> 00:27:42.420
voy a copiar esto

00:27:42.420 --> 00:27:43.000
así

00:27:43.960 --> 00:27:44.520
doble

00:27:44.520 --> 00:27:45.640
y este dato

00:27:45.640 --> 00:27:45.960
doble

00:27:45.960 --> 00:27:46.580
o sea real

00:27:46.580 --> 00:27:47.020
o float

00:27:47.020 --> 00:27:47.900
como tú quieras

00:27:47.900 --> 00:27:48.620
en data

00:27:48.620 --> 00:27:49.160
en java

00:27:49.160 --> 00:27:50.380
y datos reales

00:27:50.380 --> 00:27:51.960
sería float y doble

00:27:51.960 --> 00:27:53.260
si yo hago esto

00:27:53.260 --> 00:27:54.080
esto me daría

00:27:54.080 --> 00:27:56.420
si me estaría dando

00:27:57.080 --> 00:27:58.240
esto si me está dando

00:27:58.240 --> 00:27:59.120
esta parte

00:27:59.120 --> 00:28:00.200
entonces ahí

00:28:00.200 --> 00:28:01.220
porque me está resolviendo

00:28:01.220 --> 00:28:01.500
el problema

00:28:01.500 --> 00:28:02.520
porque el dato es entero

00:28:02.520 --> 00:28:03.540
si el dato fuera doble

00:28:03.540 --> 00:28:03.920
o float

00:28:03.920 --> 00:28:04.600
no me daría

00:28:04.600 --> 00:28:06.560
lo que yo quiero

00:28:06.560 --> 00:28:07.540
entonces

00:28:07.540 --> 00:28:08.420
aquí tengo

00:28:08.420 --> 00:28:09.460
divido entre 10

00:28:09.460 --> 00:28:10.800
y multiplico por 10

00:28:11.940 --> 00:28:12.500
ok

00:28:12.500 --> 00:28:13.900
vamos a pasar unos datos

00:28:13.900 --> 00:28:14.480
de aquí

00:28:14.480 --> 00:28:15.200
para acá

00:28:16.200 --> 00:28:16.600
el caso

00:28:16.600 --> 00:28:17.800
no recuerdo el nombre

00:28:17.800 --> 00:28:18.800
ayer que se

00:28:18.800 --> 00:28:19.760
el día de ayer

00:28:19.760 --> 00:28:20.860
alguien se le

00:28:20.860 --> 00:28:21.560
todos los colunas

00:28:21.560 --> 00:28:22.140
se le colocaron

00:28:22.140 --> 00:28:22.540
una sola

00:28:22.540 --> 00:28:24.320
entonces yo te recomiendo

00:28:24.320 --> 00:28:25.620
que expandas esto

00:28:25.620 --> 00:28:26.320
un poco

00:28:27.200 --> 00:28:27.280
verticalmente

00:28:27.280 --> 00:28:28.420
para que tengas espacio

00:28:28.420 --> 00:28:29.760
y vamos a soltar

00:28:29.760 --> 00:28:30.580
de este lado

00:28:32.000 --> 00:28:32.580
década

00:28:32.580 --> 00:28:33.900
y vamos a soltar

00:28:33.900 --> 00:28:34.760
entonces

00:28:36.640 --> 00:28:37.220
década

00:28:38.200 --> 00:28:38.220
title

00:28:40.700 --> 00:28:41.860
y popularidad

00:28:41.860 --> 00:28:42.780
que son los tres campos

00:28:42.780 --> 00:28:43.760
que necesito

00:28:43.760 --> 00:28:44.700
para resolver

00:28:44.700 --> 00:28:45.200
el problema

00:28:45.200 --> 00:28:45.920
de la película

00:28:45.920 --> 00:28:47.160
más popular

00:28:47.760 --> 00:28:48.320
por década

00:28:48.320 --> 00:28:48.900
si

00:28:48.900 --> 00:28:50.140
la fusión

00:28:50.760 --> 00:28:51.060
esta

00:28:52.680 --> 00:28:53.920
es indistinto

00:28:53.920 --> 00:28:54.500
en este caso

00:28:54.500 --> 00:28:55.020
en particular

00:28:55.020 --> 00:28:55.560
te explico

00:28:55.560 --> 00:28:57.100
porque en este caso

00:28:57.100 --> 00:28:58.220
el paréntesis

00:28:58.220 --> 00:28:59.900
y el por

00:28:59.900 --> 00:29:00.380
tienen

00:29:00.380 --> 00:29:01.440
la misma

00:29:01.440 --> 00:29:02.360
precedencia

00:29:02.360 --> 00:29:03.300
entonces

00:29:03.300 --> 00:29:03.980
se evalúa

00:29:03.980 --> 00:29:05.120
de izquierda a derecha

00:29:05.120 --> 00:29:05.780
o sea aquí

00:29:05.780 --> 00:29:06.700
evaluaría como el

00:29:06.700 --> 00:29:07.580
perdón

00:29:07.580 --> 00:29:08.000
el entre

00:29:08.000 --> 00:29:09.560
y el por tiene

00:29:09.560 --> 00:29:10.720
la misma precedencia

00:29:10.720 --> 00:29:11.300
entonces evalúa

00:29:11.300 --> 00:29:12.480
de izquierda a derecha

00:29:12.480 --> 00:29:13.300
pero fíjate algo

00:29:13.300 --> 00:29:13.920
con lo que tú me estás

00:29:13.920 --> 00:29:15.080
mencionando

00:29:15.080 --> 00:29:16.200
si yo tengo

00:29:16.200 --> 00:29:17.300
esto así

00:29:18.180 --> 00:29:19.420
por ejemplo

00:29:19.420 --> 00:29:20.300
tengo ahora

00:29:23.600 --> 00:29:24.220
GR

00:29:24.220 --> 00:29:25.100
tengo esto

00:29:25.100 --> 00:29:25.840
actualmente así

00:29:25.840 --> 00:29:26.840
si yo tengo

00:29:26.840 --> 00:29:28.700
este más aquí

00:29:28.700 --> 00:29:29.400
el por

00:29:29.400 --> 00:29:29.940
tiene más

00:29:29.940 --> 00:29:30.800
precedencia entonces aquí

00:29:30.800 --> 00:29:31.700
multiplicaría

00:29:31.700 --> 00:29:32.560
y después sumaría

00:29:32.560 --> 00:29:33.080
entonces aquí

00:29:33.080 --> 00:29:34.340
si tú quieres sumar

00:29:34.340 --> 00:29:35.440
aquí si es necesario

00:29:35.440 --> 00:29:36.380
esto así

00:29:36.380 --> 00:29:37.720
porque el por

00:29:37.720 --> 00:29:38.620
y el tiene más

00:29:38.620 --> 00:29:39.220
precedencia

00:29:39.220 --> 00:29:39.840
para el caso

00:29:39.840 --> 00:29:40.440
en particular

00:29:40.440 --> 00:29:41.440
pues no

00:29:42.220 --> 00:29:42.880
daría lo mismo

00:29:42.880 --> 00:29:43.800
si le coloco el paréntesis

00:29:43.800 --> 00:29:44.420
gracias a ti

00:29:44.420 --> 00:29:45.660
por preguntar

00:29:46.220 --> 00:29:46.760
fíjate que

00:29:46.760 --> 00:29:47.120
mientras

00:29:47.120 --> 00:29:47.420
algunos

00:29:47.420 --> 00:29:48.180
terminan aquí

00:29:49.300 --> 00:29:50.320
el caso

00:29:51.220 --> 00:29:51.280
del

00:29:52.440 --> 00:29:53.320
el caso

00:29:53.320 --> 00:29:53.880
del hijo mío

00:29:53.880 --> 00:29:54.360
cuando estaba

00:29:54.360 --> 00:29:54.980
en primaria

00:29:54.980 --> 00:29:55.900
entonces el

00:29:55.900 --> 00:29:56.420
profesor le coloco

00:29:56.420 --> 00:29:57.000
una expresión

00:29:57.000 --> 00:29:57.560
de esta

00:29:57.560 --> 00:29:58.500
donde tenía un más

00:29:58.500 --> 00:29:58.980
y un menos

00:29:58.980 --> 00:29:59.660
y un por

00:29:59.660 --> 00:30:00.680
y entonces

00:30:00.680 --> 00:30:01.400
el profesor

00:30:01.400 --> 00:30:01.860
sumaba

00:30:01.860 --> 00:30:02.540
primero restaba

00:30:02.540 --> 00:30:03.600
y después multiplicaba

00:30:03.600 --> 00:30:04.900
no hay paréntesis

00:30:04.900 --> 00:30:05.600
entonces

00:30:05.600 --> 00:30:06.180
yo le estaba

00:30:06.180 --> 00:30:07.200
yo le ayudaba

00:30:07.200 --> 00:30:08.020
a mi hijo a resolver

00:30:08.600 --> 00:30:09.400
los problemas

00:30:10.160 --> 00:30:10.640
y

00:30:10.640 --> 00:30:11.080
perdió esa

00:30:11.880 --> 00:30:12.360
evaluación

00:30:12.360 --> 00:30:13.360
y entonces me tocó bien

00:30:13.360 --> 00:30:13.680
de profesor

00:30:13.680 --> 00:30:14.320
mira qué pena

00:30:14.320 --> 00:30:15.660
lo que pasa es que hay

00:30:15.660 --> 00:30:16.480
una precedencia de

00:30:16.480 --> 00:30:17.160
operadores

00:30:17.160 --> 00:30:18.340
pero eso va más que todo

00:30:18.340 --> 00:30:18.920
para la gente de

00:30:18.920 --> 00:30:19.140
sistema

00:30:19.140 --> 00:30:20.500
la gente pronto

00:30:21.880 --> 00:30:22.960
no le presta mucha

00:30:22.960 --> 00:30:24.120
atención a eso

00:30:25.000 --> 00:30:25.860
pero bueno

00:30:25.860 --> 00:30:26.480
entonces

00:30:26.480 --> 00:30:27.040
aquí tenemos

00:30:27.040 --> 00:30:27.680
esta parte

00:30:28.860 --> 00:30:29.340
ok

00:30:29.860 --> 00:30:30.340
listo

00:30:30.340 --> 00:30:30.720
yes

00:30:30.720 --> 00:30:31.540
me dice

00:30:32.440 --> 00:30:32.920
retomo

00:30:32.920 --> 00:30:33.760
la idea entonces

00:30:33.760 --> 00:30:34.540
al final

00:30:35.160 --> 00:30:35.920
de que quiero

00:30:35.920 --> 00:30:36.220
resolver

00:30:36.220 --> 00:30:37.340
al final me va a quedar

00:30:37.340 --> 00:30:38.180
más o menos

00:30:38.180 --> 00:30:38.980
esto

00:30:39.960 --> 00:30:40.440
mire

00:30:40.440 --> 00:30:41.120
lo siguiente

00:30:41.120 --> 00:30:41.540
ahora

00:30:41.540 --> 00:30:42.060
voy a tomar

00:30:42.060 --> 00:30:42.620
estos datos

00:30:43.300 --> 00:30:43.780
aquí

00:30:44.540 --> 00:30:45.380
me va a quedar

00:30:45.380 --> 00:30:46.320
vamos a poner que

00:30:46.320 --> 00:30:47.060
este ya era

00:30:47.060 --> 00:30:47.720
noventa y uno

00:30:47.720 --> 00:30:48.580
me va a quedar todo

00:30:48.580 --> 00:30:49.380
en noventa

00:30:49.380 --> 00:30:50.220
ahora lo que quiero hacer

00:30:50.220 --> 00:30:51.280
es lo siguiente

00:30:51.280 --> 00:30:52.140
voy a

00:30:52.140 --> 00:30:52.540
ordenar

00:30:52.540 --> 00:30:54.860
por década

00:30:54.860 --> 00:30:55.460
voy a

00:30:55.460 --> 00:30:55.740
ordenar

00:30:55.740 --> 00:30:56.240
por década

00:30:56.240 --> 00:31:00.320
ya les

00:31:00.880 --> 00:31:02.360
voy a hacer lo siguiente

00:31:02.360 --> 00:31:02.800
ahora

00:31:02.800 --> 00:31:03.680
voy a ordenar

00:31:03.680 --> 00:31:04.820
los datos

00:31:04.820 --> 00:31:06.200
una particularidad

00:31:06.200 --> 00:31:06.640
que se tiene

00:31:06.640 --> 00:31:07.080
con los

00:31:07.080 --> 00:31:07.540
componentes

00:31:07.540 --> 00:31:08.020
de talent

00:31:08.020 --> 00:31:09.140
es que

00:31:09.140 --> 00:31:09.780
cuando hay

00:31:09.780 --> 00:31:10.420
un esquema

00:31:10.420 --> 00:31:11.140
de entrada

00:31:12.340 --> 00:31:13.340
el esquema

00:31:13.340 --> 00:31:14.520
cuando hay un

00:31:14.520 --> 00:31:14.760
esquema

00:31:14.760 --> 00:31:15.000
de entrada

00:31:15.000 --> 00:31:15.220
y de

00:31:15.220 --> 00:31:15.380
salida

00:31:15.380 --> 00:31:15.620
en este

00:31:15.620 --> 00:31:15.880
caso

00:31:15.880 --> 00:31:16.600
tema que es

00:31:16.600 --> 00:31:17.000
un esquema

00:31:17.000 --> 00:31:17.300
de entrada

00:31:17.300 --> 00:31:18.100
y de salida

00:31:18.100 --> 00:31:18.540
la

00:31:18.540 --> 00:31:18.820
salida

00:31:29.260 --> 00:31:29.760
automáticamente

00:31:29.760 --> 00:31:30.800
y esto me va

00:31:30.800 --> 00:31:31.140
a llegar

00:31:31.140 --> 00:31:31.740
acá como

00:31:31.740 --> 00:31:32.020
entrada

00:31:32.020 --> 00:31:32.300
en el

00:31:32.300 --> 00:31:32.740
entonces

00:31:32.740 --> 00:31:33.920
haga lo

00:31:34.860 --> 00:31:35.380
siguiente

00:31:35.380 --> 00:31:36.100
vaya al

00:31:36.100 --> 00:31:38.020
y note ve que

00:31:38.020 --> 00:31:38.580
aquí tiene

00:31:38.580 --> 00:31:39.000
editar

00:31:39.940 --> 00:31:40.460
esquema

00:31:40.460 --> 00:31:41.260
entonces como

00:31:41.260 --> 00:31:41.700
este tiene

00:31:41.700 --> 00:31:42.140
que trabajar

00:31:42.140 --> 00:31:42.400
con

00:31:42.400 --> 00:31:42.780
datos

00:31:42.780 --> 00:31:43.660
la posición

00:31:43.660 --> 00:31:44.160
te va a

00:31:44.160 --> 00:31:44.380
cambiar

00:31:44.380 --> 00:31:45.020
pero al final

00:31:45.020 --> 00:31:45.360
te va a dar

00:31:45.360 --> 00:31:45.700
lo mismo

00:31:45.700 --> 00:31:46.400
entonces

00:31:46.400 --> 00:31:46.900
si das

00:31:46.900 --> 00:31:47.360
clic aquí

00:31:47.360 --> 00:31:47.740
en editar

00:31:49.400 --> 00:31:49.920
esquema

00:31:49.920 --> 00:31:50.220
darte

00:31:50.220 --> 00:31:50.780
cuenta que

00:31:50.780 --> 00:31:51.520
aquí

00:31:51.960 --> 00:31:52.900
esta es lo que

00:31:52.900 --> 00:31:53.800
esta es la

00:31:53.800 --> 00:31:54.060
salida

00:31:54.060 --> 00:31:54.800
la entrada que me está

00:31:54.800 --> 00:31:55.240
llegando

00:31:55.240 --> 00:31:56.680
del tema

00:31:57.560 --> 00:31:58.460
y esta es la

00:31:58.460 --> 00:31:58.880
entrada que

00:31:58.880 --> 00:31:59.260
tengo

00:31:59.260 --> 00:31:59.960
del techo

00:32:00.560 --> 00:32:01.640
esto es poco para

00:32:01.640 --> 00:32:01.940
perdón

00:32:01.940 --> 00:32:02.380
esta es la

00:32:02.380 --> 00:32:02.820
salida del

00:32:02.820 --> 00:32:03.100
tema

00:32:03.920 --> 00:32:04.860
y esta es la

00:32:04.860 --> 00:32:05.240
entrada del

00:32:05.240 --> 00:32:05.600
techo

00:32:05.600 --> 00:32:06.780
aquí tú puedes

00:32:06.780 --> 00:32:07.360
agregar

00:32:07.360 --> 00:32:07.720
y quitar

00:32:07.720 --> 00:32:08.180
lo que tú

00:32:08.720 --> 00:32:09.160
quieras

00:32:09.160 --> 00:32:09.700
en caso

00:32:09.700 --> 00:32:10.840
de que

00:32:10.840 --> 00:32:11.500
pasa

00:32:11.500 --> 00:32:12.360
pasa

00:32:12.360 --> 00:32:12.920
y que es

00:32:12.920 --> 00:32:13.700
lástima que no le hago

00:32:13.700 --> 00:32:14.240
un ejemplo para

00:32:14.240 --> 00:32:14.660
cada cosa

00:32:14.660 --> 00:32:15.440
siempre tengo que

00:32:15.440 --> 00:32:16.280
invertirle

00:32:16.280 --> 00:32:16.980
pasa en que de

00:32:16.980 --> 00:32:17.240
pronto

00:32:17.240 --> 00:32:18.180
suponte que aquí

00:32:18.180 --> 00:32:18.560
no te

00:32:18.560 --> 00:32:18.840
llegó

00:32:18.840 --> 00:32:20.080
es muy raro que

00:32:20.080 --> 00:32:20.780
pase esto

00:32:20.780 --> 00:32:21.520
que de pronto

00:32:21.520 --> 00:32:22.240
tenga aquí

00:32:22.240 --> 00:32:23.180
una salida

00:32:23.180 --> 00:32:23.780
y que si

00:32:23.780 --> 00:32:24.160
se hace

00:32:24.160 --> 00:32:24.600
con esta

00:32:24.600 --> 00:32:25.480
entrada acá

00:32:26.100 --> 00:32:26.760
entonces tú

00:32:26.760 --> 00:32:27.060
le puedes

00:32:27.060 --> 00:32:27.460
dar aquí

00:32:27.460 --> 00:32:28.040
sincronizar

00:32:28.580 --> 00:32:29.020
columnas

00:32:29.020 --> 00:32:29.700
y lo que

00:32:29.700 --> 00:32:30.160
hace eso

00:32:30.160 --> 00:32:40.500
es que

00:32:40.500 --> 00:32:40.720
se puede

00:32:40.720 --> 00:32:41.440
pasar pero eso

00:32:41.440 --> 00:32:41.900
para eso es

00:32:41.900 --> 00:32:42.420
sincronizar

00:32:43.940 --> 00:32:44.460
columnas

00:32:44.460 --> 00:32:45.040
entonces vamos

00:32:45.040 --> 00:32:45.440
a configurar

00:32:45.440 --> 00:32:45.900
el techo

00:32:45.900 --> 00:32:46.240
row

00:32:46.240 --> 00:32:47.440
y el techo

00:32:47.440 --> 00:32:47.980
row quiero que

00:32:47.980 --> 00:32:48.120
haga

00:32:48.120 --> 00:32:49.680
lo siguiente

00:32:49.680 --> 00:32:50.460
dele aquí

00:32:50.460 --> 00:32:51.560
un más

00:32:51.560 --> 00:32:53.560
y este más

00:32:53.560 --> 00:32:54.320
entonces

00:32:54.320 --> 00:32:55.060
te coloca

00:32:55.060 --> 00:32:55.620
las

00:32:55.620 --> 00:32:56.100
columnas que

00:32:56.100 --> 00:32:56.260
tiene

00:32:56.260 --> 00:32:57.280
entrada en este caso

00:32:57.280 --> 00:32:57.840
quiero primero

00:32:57.840 --> 00:32:58.840
por década

00:32:58.840 --> 00:32:59.380
y aquí

00:32:59.380 --> 00:32:59.680
tiene que

00:32:59.680 --> 00:33:00.060
estar muy

00:33:00.060 --> 00:33:00.540
pendiente con

00:33:00.540 --> 00:33:01.020
el tipo

00:33:01.020 --> 00:33:01.980
de

00:33:01.980 --> 00:33:02.520
datos

00:33:02.520 --> 00:33:03.340
que vas a

00:33:03.340 --> 00:33:03.780
ordenar

00:33:03.780 --> 00:33:04.780
década es integer

00:33:04.780 --> 00:33:05.860
por lo tanto es

00:33:05.860 --> 00:33:06.280
numérico

00:33:06.280 --> 00:33:07.060
y aquí puedes

00:33:07.060 --> 00:33:07.640
ordenar

00:33:07.640 --> 00:33:08.360
ascendente o

00:33:08.360 --> 00:33:08.840
descendente

00:33:08.840 --> 00:33:09.620
para el caso

00:33:09.620 --> 00:33:10.260
particular

00:33:10.260 --> 00:33:10.940
me da lo

00:33:10.940 --> 00:33:11.520
mismo si es

00:33:11.520 --> 00:33:12.020
ascendente

00:33:12.020 --> 00:33:12.200
o

00:33:13.580 --> 00:33:14.340
descendente

00:33:14.340 --> 00:33:15.340
vamos ahora

00:33:15.340 --> 00:33:16.040
a hacer

00:33:16.040 --> 00:33:16.740
un nuevo

00:33:16.740 --> 00:33:17.120
criterio

00:33:17.120 --> 00:33:17.920
de ordenamiento

00:33:17.920 --> 00:33:19.240
y aquí

00:33:19.240 --> 00:33:19.640
voy a

00:33:19.640 --> 00:33:20.020
ordenar

00:33:20.020 --> 00:33:20.700
ahora por

00:33:21.600 --> 00:33:22.360
popularidad

00:33:22.360 --> 00:33:23.140
popularidad

00:33:23.140 --> 00:33:24.320
también te

00:33:24.320 --> 00:33:24.900
recomendé

00:33:24.900 --> 00:33:25.660
como esto es un

00:33:26.460 --> 00:33:26.940
table

00:33:27.460 --> 00:33:28.200
en java

00:33:28.200 --> 00:33:28.820
java tiene un

00:33:28.820 --> 00:33:29.320
pequeño box

00:33:29.320 --> 00:33:29.840
que no ha podido

00:33:29.840 --> 00:33:30.600
corregir que a veces

00:33:30.600 --> 00:33:31.420
yo muevo con el

00:33:31.420 --> 00:33:32.000
mouse y no me

00:33:32.000 --> 00:33:32.580
actualiza

00:33:32.580 --> 00:33:33.480
cuando tengas un

00:33:33.480 --> 00:33:34.040
table acostumbre

00:33:34.040 --> 00:33:34.940
darle enter

00:33:34.940 --> 00:33:35.540
darle enter

00:33:35.540 --> 00:33:35.960
para que tome

00:33:35.960 --> 00:33:36.500
el cambio

00:33:36.500 --> 00:33:38.020
y quiero que este

00:33:38.020 --> 00:33:38.480
señor me

00:33:38.480 --> 00:33:38.840
ordene

00:33:39.460 --> 00:33:39.940
descendentemente

00:33:39.940 --> 00:33:40.980
entonces retomo

00:33:40.980 --> 00:33:41.540
nuevamente la

00:33:41.540 --> 00:33:42.500
idea mejor acá

00:33:42.500 --> 00:33:43.100
en un nuevo

00:33:43.100 --> 00:33:43.620
archivo

00:33:43.620 --> 00:33:44.260
nuevo aquí

00:33:44.260 --> 00:33:44.780
tengo

00:33:45.940 --> 00:33:47.040
década

00:33:47.040 --> 00:33:47.620
tengo

00:33:47.620 --> 00:33:47.780
title

00:33:49.160 --> 00:33:50.560
y tengo

00:33:50.560 --> 00:33:51.360
popularidad

00:33:51.360 --> 00:33:51.880
suponte que

00:33:51.880 --> 00:33:52.280
tengas aquí

00:33:52.280 --> 00:33:52.880
mil novecientos

00:33:52.880 --> 00:33:53.340
noventa

00:33:53.340 --> 00:33:54.840
título x

00:33:54.840 --> 00:33:55.800
y popularidad

00:33:55.800 --> 00:33:56.360
por ejemplo

00:33:56.360 --> 00:33:57.340
ochenta

00:33:57.340 --> 00:33:58.200
tienes mil

00:33:58.780 --> 00:33:58.820
novecientos

00:33:58.820 --> 00:33:59.780
noventa también

00:33:59.780 --> 00:34:00.460
popularidad

00:34:00.460 --> 00:34:01.640
noventa y uno

00:34:01.640 --> 00:34:02.200
quizás

00:34:02.200 --> 00:34:03.400
tengas dos mil

00:34:03.400 --> 00:34:04.260
aquí

00:34:05.780 --> 00:34:06.320
popularidad

00:34:06.320 --> 00:34:07.900
ochenta y siete

00:34:07.900 --> 00:34:08.860
y

00:34:08.860 --> 00:34:09.500
tengas

00:34:09.500 --> 00:34:09.740
mil

00:34:09.740 --> 00:34:10.460
novecientos

00:34:10.460 --> 00:34:11.300
noventa

00:34:11.300 --> 00:34:12.700
popularidad

00:34:12.700 --> 00:34:13.160
y

00:34:13.160 --> 00:34:13.400
seta

00:34:13.400 --> 00:34:13.940
aquí

00:34:13.940 --> 00:34:16.120
noventa y dos

00:34:16.120 --> 00:34:17.280
al ordenar primero

00:34:17.280 --> 00:34:17.980
por década

00:34:17.980 --> 00:34:18.780
me quedarían los

00:34:18.780 --> 00:34:19.420
datos al final

00:34:19.420 --> 00:34:19.840
de esta

00:34:19.840 --> 00:34:20.260
manera

00:34:20.260 --> 00:34:21.140
me quedaría

00:34:21.140 --> 00:34:21.760
todas las

00:34:21.760 --> 00:34:22.360
décadas

00:34:22.360 --> 00:34:22.800
primero

00:34:22.800 --> 00:34:23.300
ordeno

00:34:23.300 --> 00:34:23.900
por década

00:34:23.900 --> 00:34:24.660
y después por

00:34:24.660 --> 00:34:25.000
popularidad

00:34:25.660 --> 00:34:26.260
descendentemente

00:34:26.260 --> 00:34:27.120
significa que

00:34:27.120 --> 00:34:27.640
el primer

00:34:27.640 --> 00:34:28.120
registro

00:34:28.120 --> 00:34:28.540
que va a

00:34:28.540 --> 00:34:29.620
tener es

00:34:29.620 --> 00:34:30.000
el

00:34:30.000 --> 00:34:30.220
la mayor

00:34:30.220 --> 00:34:30.600
popularidad

00:34:30.600 --> 00:34:30.900
que sería

00:34:30.900 --> 00:34:31.700
noventa y dos

00:34:31.700 --> 00:34:32.220
o sea me

00:34:32.220 --> 00:34:33.140
quedaría más o menos

00:34:33.140 --> 00:34:33.900
esto de esta

00:34:33.900 --> 00:34:34.400
manera

00:34:34.400 --> 00:34:35.660
noventa y dos

00:34:35.660 --> 00:34:36.760
después seguiría

00:34:36.760 --> 00:34:37.220
de esta

00:34:37.220 --> 00:34:37.600
manera

00:34:37.600 --> 00:34:38.980
noventa y uno

00:34:38.980 --> 00:34:40.320
después seguiría

00:34:41.820 --> 00:34:42.280
ochenta

00:34:42.280 --> 00:34:43.460
y después

00:34:43.460 --> 00:34:44.120
seguiría

00:34:44.120 --> 00:34:44.400
este

00:34:44.400 --> 00:34:45.160
dos mil que está aquí

00:34:45.160 --> 00:34:45.960
si me entiende cuál es la

00:34:45.960 --> 00:34:46.140
idea

00:34:46.140 --> 00:34:46.760
al final

00:34:46.760 --> 00:34:47.460
lo que quiero

00:34:47.460 --> 00:34:48.100
es que

00:34:48.100 --> 00:34:48.620
me quede

00:34:48.620 --> 00:34:49.740
en el primera

00:34:49.740 --> 00:34:50.700
fila de cada

00:34:50.700 --> 00:34:51.540
grupo

00:34:51.540 --> 00:34:52.620
me quede el que tenga

00:34:52.620 --> 00:34:53.380
la película que tenga

00:34:53.380 --> 00:34:54.200
mayor popularidad

00:34:54.200 --> 00:34:55.160
eso fue lo que hice

00:34:55.160 --> 00:34:55.600
listo

00:34:55.600 --> 00:34:56.140
esta es la idea

00:34:56.140 --> 00:34:57.600
que me va a quedar así

00:34:58.400 --> 00:34:59.400
ahora mire lo que voy

00:34:59.400 --> 00:35:00.040
a hacer

00:35:00.040 --> 00:35:01.140
voy aquí al

00:35:01.140 --> 00:35:02.600
T aggregated row

00:35:03.520 --> 00:35:04.820
y esto lo que hace

00:35:04.820 --> 00:35:05.880
es un group by

00:35:05.880 --> 00:35:06.780
hago la

00:35:06.780 --> 00:35:07.540
semejanza porque de

00:35:07.540 --> 00:35:08.420
pronto con el group by

00:35:08.420 --> 00:35:09.280
sale más fácil de

00:35:09.280 --> 00:35:09.540
entender

00:35:09.540 --> 00:35:10.380
en un group by

00:35:10.380 --> 00:35:10.860
tú tienes

00:35:10.860 --> 00:35:12.380
un select

00:35:12.380 --> 00:35:13.800
tienes un from

00:35:13.800 --> 00:35:15.440
y tienes un group by

00:35:15.440 --> 00:35:16.080
entonces

00:35:16.600 --> 00:35:17.160
esta parte

00:35:17.160 --> 00:35:17.840
de group by

00:35:17.840 --> 00:35:18.580
tienes acá

00:35:18.580 --> 00:35:19.560
group by como tal

00:35:19.560 --> 00:35:21.080
la función group by

00:35:21.080 --> 00:35:21.860
vamos a

00:35:21.860 --> 00:35:22.880
configurarlo entonces

00:35:22.880 --> 00:35:24.060
voy a

00:35:24.060 --> 00:35:24.960
hacer lo siguiente

00:35:24.960 --> 00:35:25.780
voy a agrupar

00:35:25.780 --> 00:35:27.300
por década

00:35:27.300 --> 00:35:28.020
o sea voy a

00:35:28.020 --> 00:35:28.560
hacer más o menos

00:35:28.560 --> 00:35:29.480
la sentencia de esta

00:35:29.480 --> 00:35:30.040
group by

00:35:30.040 --> 00:35:30.980
década

00:35:30.980 --> 00:35:32.180
cómo se hace esto

00:35:32.180 --> 00:35:33.500
con la

00:35:34.060 --> 00:35:34.680
con la

00:35:34.680 --> 00:35:35.920
con la herramienta

00:35:35.920 --> 00:35:36.380
vete la

00:35:36.380 --> 00:35:37.440
herramienta un momento

00:35:37.440 --> 00:35:38.560
vamos a configurar

00:35:38.560 --> 00:35:39.640
el T aggregated row

00:35:39.640 --> 00:35:40.680
y este

00:35:40.680 --> 00:35:41.280
agrupar

00:35:41.280 --> 00:35:42.040
por

00:35:42.040 --> 00:35:42.940
indica

00:35:42.940 --> 00:35:44.380
el group by

00:35:45.060 --> 00:35:45.540
entonces

00:35:45.540 --> 00:35:46.360
dale aquí

00:35:47.060 --> 00:35:47.480
más

00:35:48.060 --> 00:35:48.660
y date

00:35:48.660 --> 00:35:49.500
cuenta lo siguiente

00:35:49.500 --> 00:35:50.020
que aquí

00:35:50.020 --> 00:35:50.720
no me hace

00:35:50.720 --> 00:35:51.800
automáticamente

00:35:51.800 --> 00:35:52.100
el

00:35:52.800 --> 00:35:53.220
la

00:35:53.220 --> 00:35:54.040
circulación entonces

00:35:54.040 --> 00:35:54.580
vete aquí a

00:35:54.580 --> 00:35:55.520
editar esquema

00:35:55.520 --> 00:35:56.660
por favor

00:35:57.800 --> 00:35:58.200
y de editar

00:35:58.200 --> 00:35:58.660
esquema

00:35:58.660 --> 00:35:59.500
necesito

00:35:59.500 --> 00:36:00.380
lo siguiente

00:36:01.440 --> 00:36:02.100
necesito

00:36:04.500 --> 00:36:05.160
década

00:36:06.200 --> 00:36:06.860
necesito

00:36:06.860 --> 00:36:07.340
title

00:36:07.340 --> 00:36:08.800
y también

00:36:08.800 --> 00:36:09.280
necesito

00:36:09.280 --> 00:36:09.780
la propiedad

00:36:09.780 --> 00:36:10.360
los tres campos

00:36:11.740 --> 00:36:12.400
necesito

00:36:12.400 --> 00:36:13.020
le das

00:36:13.020 --> 00:36:13.600
ok por

00:36:13.600 --> 00:36:14.020
favor

00:36:14.020 --> 00:36:14.860
y ahora

00:36:14.860 --> 00:36:15.640
si te va a

00:36:15.640 --> 00:36:16.040
permitir

00:36:16.760 --> 00:36:17.420
definir

00:36:17.420 --> 00:36:17.940
dale aquí

00:36:17.940 --> 00:36:18.320
más

00:36:19.400 --> 00:36:20.280
y aquí

00:36:20.280 --> 00:36:22.420
tú eliges

00:36:22.940 --> 00:36:23.800
la columna

00:36:23.800 --> 00:36:24.380
aquí tienes

00:36:24.380 --> 00:36:25.620
la columna de entrada

00:36:25.620 --> 00:36:26.200
la columna de

00:36:26.200 --> 00:36:26.780
salida cómo quieres

00:36:26.780 --> 00:36:27.480
llamarla

00:36:27.480 --> 00:36:28.560
con respecto a la

00:36:28.560 --> 00:36:29.020
columna de

00:36:29.020 --> 00:36:29.400
entrada

00:36:30.040 --> 00:36:31.200
y ahora presta

00:36:31.200 --> 00:36:32.300
atención a lo siguiente

00:36:32.300 --> 00:36:33.500
esta función

00:36:33.500 --> 00:36:34.520
esta operación

00:36:35.240 --> 00:36:35.760
acá

00:36:36.800 --> 00:36:37.320
indicaría

00:36:37.940 --> 00:36:38.780
lo que vas a

00:36:38.780 --> 00:36:39.200
colocar la

00:36:39.200 --> 00:36:39.740
función de

00:36:39.740 --> 00:36:40.260
grupo en el

00:36:40.260 --> 00:36:40.980
SELEC

00:36:40.980 --> 00:36:41.640
recordará que

00:36:41.640 --> 00:36:41.780
las

00:36:41.780 --> 00:36:42.320
funciones de

00:36:42.320 --> 00:36:42.940
grupo que tú has

00:36:42.940 --> 00:36:43.400
manejado a

00:36:43.400 --> 00:36:44.360
nivel de SQL son

00:36:44.360 --> 00:36:45.440
con min

00:36:45.440 --> 00:36:46.260
max

00:36:46.940 --> 00:36:47.220
a promedio

00:36:47.220 --> 00:36:47.600
que es

00:36:47.600 --> 00:36:48.720
AVG

00:36:48.720 --> 00:36:49.660
se me

00:36:49.660 --> 00:36:50.040
escapa

00:36:50.040 --> 00:36:50.980
zoom

00:36:50.980 --> 00:36:52.380
etcétera

00:36:52.380 --> 00:36:52.980
entonces

00:36:52.980 --> 00:36:53.620
este señor

00:36:53.620 --> 00:36:54.160
viene con

00:36:54.160 --> 00:36:54.800
algunas en

00:36:54.800 --> 00:36:55.340
particular

00:36:55.340 --> 00:36:56.460
en primer

00:36:56.460 --> 00:36:56.980
lugar

00:36:56.980 --> 00:36:57.820
yo quiero

00:36:57.820 --> 00:36:58.480
sacar

00:36:58.480 --> 00:36:59.700
la máxima

00:36:59.700 --> 00:37:00.220
popularidad

00:37:00.220 --> 00:37:00.980
de la década

00:37:00.980 --> 00:37:01.500
o sea

00:37:01.500 --> 00:37:01.920
max

00:37:01.920 --> 00:37:03.100
popularidad

00:37:04.600 --> 00:37:05.620
si yo

00:37:05.620 --> 00:37:05.940
agrupo

00:37:05.940 --> 00:37:07.700
por década

00:37:07.700 --> 00:37:08.600
esta que está aquí por

00:37:08.600 --> 00:37:08.760
ejemplo

00:37:08.760 --> 00:37:09.340
este sería un

00:37:09.340 --> 00:37:09.860
grupo verdad

00:37:09.860 --> 00:37:10.720
1990

00:37:10.720 --> 00:37:11.500
si te das

00:37:11.500 --> 00:37:12.380
cuenta al sacar el

00:37:12.380 --> 00:37:12.960
máximo me da

00:37:12.960 --> 00:37:13.620
cuánto

00:37:13.620 --> 00:37:14.680
92 si vamos bien

00:37:14.680 --> 00:37:15.060
hasta ahí

00:37:15.060 --> 00:37:16.120
espero que me

00:37:16.120 --> 00:37:16.680
entienda un poquito

00:37:16.680 --> 00:37:17.100
la idea

00:37:18.120 --> 00:37:19.080
significa entonces

00:37:19.080 --> 00:37:20.520
lo siguiente ahora

00:37:21.280 --> 00:37:22.240
en que

00:37:22.240 --> 00:37:22.860
como columna

00:37:22.860 --> 00:37:23.000
de

00:37:23.000 --> 00:37:25.060
salida entonces

00:37:25.660 --> 00:37:26.420
voy aquí

00:37:26.420 --> 00:37:27.280
a cambiar esta

00:37:27.280 --> 00:37:27.920
columna

00:37:27.920 --> 00:37:28.380
y voy a

00:37:28.380 --> 00:37:29.060
definir que esta

00:37:29.060 --> 00:37:29.920
es popularidad

00:37:29.920 --> 00:37:31.000
de popularidad

00:37:31.000 --> 00:37:31.780
especifico la

00:37:31.780 --> 00:37:32.420
función de

00:37:32.420 --> 00:37:32.520
este grupo

00:37:32.520 --> 00:37:33.480
que yo quiero

00:37:33.480 --> 00:37:35.100
que en este caso

00:37:35.100 --> 00:37:35.920
va a ser el

00:37:35.920 --> 00:37:36.900
max

00:37:37.420 --> 00:37:38.100
y

00:37:38.100 --> 00:37:38.600
especifico

00:37:38.600 --> 00:37:39.160
esta es la

00:37:39.160 --> 00:37:39.760
columna el nombre

00:37:39.760 --> 00:37:40.460
la columna de

00:37:40.460 --> 00:37:40.980
salida

00:37:40.980 --> 00:37:41.620
y esta que

00:37:41.620 --> 00:37:41.960
salida

00:37:41.960 --> 00:37:43.060
la voy a mapear

00:37:43.060 --> 00:37:43.700
con la entrada

00:37:43.700 --> 00:37:45.940
que se llama popularidad

00:37:45.940 --> 00:37:47.400
ese ignore null

00:37:47.400 --> 00:37:48.980
que está ahí

00:37:48.980 --> 00:37:49.520
hay algo

00:37:49.520 --> 00:37:50.300
muy particular

00:37:50.300 --> 00:37:51.040
cuando

00:37:51.040 --> 00:37:51.780
las

00:37:51.780 --> 00:37:52.440
funciones

00:37:52.440 --> 00:37:53.180
son de

00:37:53.180 --> 00:37:54.000
suma

00:37:54.000 --> 00:37:54.860
y encuentra

00:37:54.860 --> 00:37:55.700
un nulo

00:37:55.700 --> 00:37:56.460
él sale

00:37:56.460 --> 00:37:57.340
error

00:37:58.900 --> 00:37:59.420
entonces

00:38:00.720 --> 00:38:01.620
tú dirás

00:38:02.480 --> 00:38:03.000
pero

00:38:03.000 --> 00:38:03.560
entonces

00:38:03.560 --> 00:38:04.200
si hay error

00:38:04.200 --> 00:38:04.900
mejor siempre

00:38:04.900 --> 00:38:05.820
coloca ignore null

00:38:06.340 --> 00:38:07.220
no necesariamente

00:38:07.220 --> 00:38:07.940
porque

00:38:07.940 --> 00:38:09.340
si tú colocas ignore null

00:38:10.740 --> 00:38:11.260
quizás

00:38:11.260 --> 00:38:11.980
no te puedes dar

00:38:11.980 --> 00:38:13.560
cuenta de un error

00:38:13.560 --> 00:38:14.040
de datos

00:38:14.040 --> 00:38:14.600
en que

00:38:14.600 --> 00:38:15.420
tú supones

00:38:15.420 --> 00:38:16.240
que esos datos

00:38:16.240 --> 00:38:17.240
no venga en

00:38:17.240 --> 00:38:17.900
nulos

00:38:17.900 --> 00:38:19.860
entonces si le das ignore null

00:38:19.860 --> 00:38:20.740
te viene un nulo

00:38:20.740 --> 00:38:21.580
y tú te das cuenta

00:38:21.580 --> 00:38:22.580
mejor dejar

00:38:22.580 --> 00:38:23.200
y que dispare

00:38:23.200 --> 00:38:23.620
el error

00:38:23.620 --> 00:38:24.360
y tú te das cuenta

00:38:24.360 --> 00:38:24.600
y puedes

00:38:24.600 --> 00:38:25.140
mandar

00:38:25.140 --> 00:38:25.580
de pronto

00:38:25.580 --> 00:38:25.740
esos

00:38:25.740 --> 00:38:26.380
calidad de datos

00:38:26.380 --> 00:38:26.820
y que te digan

00:38:26.820 --> 00:38:27.620
epa

00:38:27.620 --> 00:38:28.220
hubo un error

00:38:28.220 --> 00:38:28.680
eso de ese

00:38:28.680 --> 00:38:29.040
dato no puede

00:38:29.040 --> 00:38:29.680
estar nulo

00:38:29.680 --> 00:38:30.200
el joke

00:38:30.200 --> 00:38:31.180
mío no funcionó

00:38:31.180 --> 00:38:31.700
porque ese

00:38:31.700 --> 00:38:31.840
dato

00:38:31.840 --> 00:38:32.640
no tiene que estar

00:38:32.640 --> 00:38:32.840
nulo

00:38:32.840 --> 00:38:33.240
tienes que

00:38:33.720 --> 00:38:34.120
revisar

00:38:34.120 --> 00:38:34.360
entonces

00:38:34.360 --> 00:38:34.740
hay que

00:38:34.740 --> 00:38:35.260
estar muy

00:38:35.260 --> 00:38:35.740
pendiente

00:38:35.740 --> 00:38:36.800
en cómo

00:38:36.800 --> 00:38:37.220
lo vas a

00:38:37.220 --> 00:38:37.480
manejar

00:38:37.480 --> 00:38:38.000
yo diría

00:38:38.000 --> 00:38:38.620
que si tú sabes

00:38:39.100 --> 00:38:39.500
que

00:38:39.500 --> 00:38:39.840
siempre

00:38:39.840 --> 00:38:41.080
es no nulo

00:38:41.080 --> 00:38:42.140
mejor coloca

00:38:42.140 --> 00:38:43.180
déjalo así

00:38:43.180 --> 00:38:44.020
no que lo ignore

00:38:44.020 --> 00:38:45.120
de tal forma de que

00:38:45.120 --> 00:38:45.640
si hay un error

00:38:45.640 --> 00:38:46.700
te levantes el error

00:38:46.700 --> 00:38:47.400
y tú lo puedas

00:38:48.640 --> 00:38:49.120
corregir

00:38:49.120 --> 00:38:49.900
listo

00:38:49.900 --> 00:38:50.620
voy a hacer ahora

00:38:50.620 --> 00:38:51.320
lo siguiente

00:38:51.320 --> 00:38:52.460
voy a dar aquí

00:38:52.460 --> 00:38:53.040
un más

00:38:53.040 --> 00:38:53.640
y me aparece

00:38:53.640 --> 00:38:54.200
title

00:38:54.200 --> 00:38:55.280
y aquí en la

00:38:55.280 --> 00:38:55.900
función de

00:38:55.900 --> 00:38:56.240
grupo

00:38:56.240 --> 00:38:56.700
voy a

00:38:56.700 --> 00:38:57.320
usar algo

00:38:57.320 --> 00:38:58.260
que

00:38:58.260 --> 00:38:59.380
no aparece

00:39:00.360 --> 00:39:00.840
solamente

00:39:00.840 --> 00:39:01.140
hasta

00:39:01.140 --> 00:39:01.740
versión

00:39:01.740 --> 00:39:02.740
bueno eso nada más

00:39:02.740 --> 00:39:03.480
MySQL lo hace

00:39:03.480 --> 00:39:03.900
porque aquí

00:39:03.900 --> 00:39:04.540
hay un estándar

00:39:04.540 --> 00:39:05.000
de SQL

00:39:05.000 --> 00:39:05.860
que no lo permite

00:39:05.860 --> 00:39:07.480
pero este señor

00:39:07.480 --> 00:39:08.120
sí me permite

00:39:08.120 --> 00:39:09.480
hacer lo siguiente

00:39:09.480 --> 00:39:10.440
date cuenta

00:39:10.440 --> 00:39:10.900
que aquí

00:39:10.900 --> 00:39:11.700
hay una función

00:39:11.700 --> 00:39:12.300
que se llama

00:39:13.980 --> 00:39:14.500
first

00:39:16.620 --> 00:39:17.140
sácame

00:39:17.140 --> 00:39:18.480
el primer

00:39:18.480 --> 00:39:19.180
title

00:39:19.180 --> 00:39:19.640
first

00:39:19.640 --> 00:39:20.480
te explico ahora

00:39:20.480 --> 00:39:20.760
entonces

00:39:20.760 --> 00:39:21.240
que significa

00:39:21.940 --> 00:39:22.460
significa

00:39:22.460 --> 00:39:24.560
lo siguiente

00:39:25.520 --> 00:39:26.040
recordarás

00:39:26.040 --> 00:39:26.640
entonces

00:39:26.640 --> 00:39:27.660
en que

00:39:27.660 --> 00:39:28.300
si yo tengo

00:39:28.300 --> 00:39:28.920
una función

00:39:28.920 --> 00:39:29.680
de grupo a nivel

00:39:29.680 --> 00:39:30.420
de SQL

00:39:30.420 --> 00:39:31.400
yo no puedo

00:39:31.400 --> 00:39:32.000
colocar

00:39:32.000 --> 00:39:33.220
ninguna columna

00:39:33.220 --> 00:39:33.700
que no sea

00:39:33.700 --> 00:39:34.320
función de

00:39:34.320 --> 00:39:34.700
grupo

00:39:34.700 --> 00:39:35.380
me explico

00:39:35.380 --> 00:39:35.960
de esta manera

00:39:35.960 --> 00:39:36.900
si yo intento

00:39:36.900 --> 00:39:37.560
colocar en ese

00:39:37.560 --> 00:39:38.040
SQL este

00:39:38.040 --> 00:39:38.700
title

00:39:39.740 --> 00:39:40.760
que es lo que

00:39:40.760 --> 00:39:40.920
hace

00:39:40.920 --> 00:39:41.740
sale un error

00:39:41.740 --> 00:39:42.080
porque

00:39:42.080 --> 00:39:42.620
porque no es

00:39:42.620 --> 00:39:43.060
función de

00:39:43.060 --> 00:39:43.280
grupo

00:39:43.280 --> 00:39:43.700
y porque

00:39:43.700 --> 00:39:44.160
sale un

00:39:44.160 --> 00:39:44.560
error

00:39:44.560 --> 00:39:45.060
porque está

00:39:45.060 --> 00:39:45.380
diciendo

00:39:45.960 --> 00:39:46.660
si está

00:39:46.660 --> 00:39:47.240
buscando el

00:39:47.240 --> 00:39:47.560
máximo

00:39:47.560 --> 00:39:48.100
significa que

00:39:48.100 --> 00:39:48.500
el máximo

00:39:48.500 --> 00:39:48.760
es uno

00:39:48.760 --> 00:39:49.160
solo

00:39:49.840 --> 00:39:50.440
independiente

00:39:50.440 --> 00:39:51.200
que haya varios

00:39:51.200 --> 00:39:51.780
registros que

00:39:51.780 --> 00:39:52.520
tengan el máximo

00:39:52.520 --> 00:39:53.720
el máximo

00:39:53.720 --> 00:39:54.140
sigue siendo

00:39:54.140 --> 00:39:54.380
uno

00:39:54.380 --> 00:39:54.940
solo

00:39:54.940 --> 00:39:56.140
pero entonces

00:39:56.140 --> 00:39:57.340
si el

00:39:57.340 --> 00:39:57.740
grupo está

00:39:57.740 --> 00:39:58.180
formado

00:39:58.180 --> 00:39:58.640
por tres

00:39:58.640 --> 00:39:59.400
registros

00:39:59.400 --> 00:40:00.100
y solamente

00:40:00.100 --> 00:40:00.420
te puedo

00:40:00.420 --> 00:40:01.320
mostrar uno

00:40:01.320 --> 00:40:01.620
cual

00:40:01.620 --> 00:40:01.960
title

00:40:01.960 --> 00:40:02.300
quiere que

00:40:02.300 --> 00:40:03.020
te muestre

00:40:03.020 --> 00:40:03.400
entonces

00:40:03.400 --> 00:40:03.980
para evitar

00:40:03.980 --> 00:40:05.480
esa confusión

00:40:05.480 --> 00:40:05.960
SQL

00:40:05.960 --> 00:40:06.400
te manda

00:40:06.400 --> 00:40:06.800
un error

00:40:06.800 --> 00:40:07.180
cuando no

00:40:07.180 --> 00:40:07.820
colocas una

00:40:07.820 --> 00:40:08.080
función

00:40:08.080 --> 00:40:09.160
cuando la

00:40:09.160 --> 00:40:09.880
la coluna no está

00:40:09.880 --> 00:40:10.320
dentro de una

00:40:10.320 --> 00:40:10.820
función de

00:40:10.820 --> 00:40:11.300
grupo

00:40:11.300 --> 00:40:12.480
casos diferentes

00:40:12.480 --> 00:40:13.260
como MySQL

00:40:13.260 --> 00:40:13.920
que es un poco

00:40:13.920 --> 00:40:14.560
más rebelde

00:40:14.560 --> 00:40:14.960
con las

00:40:14.960 --> 00:40:15.500
estándares de

00:40:15.500 --> 00:40:15.880
SQL

00:40:15.880 --> 00:40:17.000
y MySQL

00:40:17.000 --> 00:40:17.680
no se complica

00:40:17.680 --> 00:40:18.000
la vida

00:40:18.000 --> 00:40:18.700
MySQL entonces

00:40:18.700 --> 00:40:18.980
tu puedes

00:40:18.980 --> 00:40:19.500
colocar este

00:40:19.500 --> 00:40:19.820
title

00:40:19.820 --> 00:40:21.100
y MySQL lo que

00:40:21.100 --> 00:40:21.940
hace es que

00:40:21.940 --> 00:40:22.420
a partir

00:40:22.420 --> 00:40:22.960
del grupo

00:40:22.960 --> 00:40:23.400
que tenga

00:40:23.400 --> 00:40:24.120
formado

00:40:33.500 --> 00:40:34.900
saco el primer

00:40:34.900 --> 00:40:35.780
fila

00:40:35.780 --> 00:40:36.800
ya yo sé que la

00:40:36.800 --> 00:40:37.640
primera fila

00:40:37.640 --> 00:40:38.060
va a correr

00:40:38.060 --> 00:40:38.720
como está ordenado

00:40:38.720 --> 00:40:39.600
de mayor a menor

00:40:39.600 --> 00:40:40.620
yo sé que la

00:40:40.620 --> 00:40:41.180
primera fila

00:40:41.180 --> 00:40:41.740
que está aquí

00:40:41.740 --> 00:40:42.840
va a corresponder

00:40:42.840 --> 00:40:43.740
al nombre de la

00:40:43.740 --> 00:40:44.520
película con la

00:40:44.520 --> 00:40:45.080
menor popularidad

00:40:45.080 --> 00:40:45.800
entonces

00:40:45.800 --> 00:40:47.060
lo resolví

00:40:47.060 --> 00:40:47.620
de esta manera

00:40:47.620 --> 00:40:48.260
para agregar

00:40:48.260 --> 00:40:49.020
el te short

00:40:49.020 --> 00:40:49.860
y el te

00:40:49.860 --> 00:40:51.440
aggregate row

00:40:52.360 --> 00:40:52.880
listo

00:40:52.880 --> 00:40:53.480
entonces

00:40:53.480 --> 00:40:54.360
aquí

00:40:54.360 --> 00:40:54.820
no hago

00:40:54.820 --> 00:40:56.960
más nada

00:40:59.180 --> 00:40:59.700
perfecto

00:40:59.700 --> 00:41:00.020
entonces

00:41:00.020 --> 00:41:00.540
antes de

00:41:00.540 --> 00:41:00.920
ejecutarlo

00:41:00.920 --> 00:41:01.360
te voy a

00:41:01.360 --> 00:41:01.620
explicar

00:41:01.620 --> 00:41:02.280
dónde es que

00:41:02.280 --> 00:41:02.640
entra el

00:41:02.640 --> 00:41:03.040
Big Data

00:41:03.040 --> 00:41:04.760
en el caso

00:41:04.760 --> 00:41:05.700
particular de la

00:41:06.560 --> 00:41:07.120
herramienta

00:41:07.120 --> 00:41:07.920
el procedimiento

00:41:07.920 --> 00:41:08.360
de Big Data

00:41:08.360 --> 00:41:08.980
lo está

00:41:08.980 --> 00:41:09.740
derivando

00:41:09.740 --> 00:41:10.140
en dos

00:41:10.140 --> 00:41:10.660
elementos

00:41:10.660 --> 00:41:11.160
o lo

00:41:11.160 --> 00:41:11.640
hace con

00:41:11.640 --> 00:41:12.640
MacReduce

00:41:12.640 --> 00:41:13.640
que prácticamente

00:41:13.640 --> 00:41:14.240
MacReduce

00:41:14.240 --> 00:41:14.600
quedó

00:41:14.600 --> 00:41:15.100
simplemente

00:41:16.700 --> 00:41:17.260
para

00:41:17.260 --> 00:41:17.920
aplicaciones

00:41:17.920 --> 00:41:18.600
relegadas

00:41:18.600 --> 00:41:19.280
a Hadoop

00:41:19.280 --> 00:41:19.620
decíamos

00:41:19.620 --> 00:41:20.340
ya funcionan

00:41:20.340 --> 00:41:20.780
con Hadoop

00:41:20.780 --> 00:41:21.180
para que

00:41:21.180 --> 00:41:21.620
MacReduce

00:41:21.620 --> 00:41:22.220
para que lo vas a

00:41:22.220 --> 00:41:22.360
cambiar

00:41:22.360 --> 00:41:22.880
te funciona

00:41:23.860 --> 00:41:24.420
perfectamente

00:41:24.420 --> 00:41:25.280
o lo

00:41:25.280 --> 00:41:25.580
utilizas

00:41:25.580 --> 00:41:26.080
Spark

00:41:26.080 --> 00:41:26.980
entonces

00:41:26.980 --> 00:41:27.320
la

00:41:27.320 --> 00:41:27.520
herramienta

00:41:27.520 --> 00:41:28.300
se deriva en esos

00:41:28.300 --> 00:41:28.680
dos

00:41:28.680 --> 00:41:29.300
o lo

00:41:29.300 --> 00:41:29.600
hace con

00:41:29.600 --> 00:41:30.080
MacReduce

00:41:30.080 --> 00:41:30.340
o lo

00:41:30.340 --> 00:41:31.920
hace con Spark

00:41:31.920 --> 00:41:32.560
cuando

00:41:32.560 --> 00:41:33.340
hace con

00:41:33.340 --> 00:41:33.860
MacReduce

00:41:33.860 --> 00:41:34.380
entonces

00:41:34.380 --> 00:41:34.880
que hace

00:41:34.880 --> 00:41:36.280
la herramienta

00:41:36.280 --> 00:41:36.920
como has

00:41:36.920 --> 00:41:37.320
usado

00:41:37.320 --> 00:41:37.660
una

00:41:37.660 --> 00:41:38.480
entrada que es

00:41:39.460 --> 00:41:40.020
HDFS

00:41:40.020 --> 00:41:41.260
la herramienta

00:41:41.260 --> 00:41:42.460
lo que va a hacer es lo siguiente

00:41:42.460 --> 00:41:43.780
todo lo que conecte

00:41:43.780 --> 00:41:44.340
después

00:41:44.340 --> 00:41:45.100
de aquí

00:41:45.100 --> 00:41:46.040
hacia adelante

00:41:46.040 --> 00:41:47.780
esto lo va a convertir

00:41:47.780 --> 00:41:48.440
en un código

00:41:48.440 --> 00:41:48.820
Java

00:41:48.820 --> 00:41:50.240
pero ese código Java

00:41:50.240 --> 00:41:50.860
lo va a

00:41:50.860 --> 00:41:51.700
convertir a

00:41:51.700 --> 00:41:52.200
MacReduce

00:41:52.200 --> 00:41:52.420
o sea

00:41:53.340 --> 00:41:53.820
MacReduce

00:41:53.820 --> 00:41:55.080
para distribuir

00:41:55.080 --> 00:41:55.960
toda esta parte

00:41:55.960 --> 00:41:56.580
sobre el cluster

00:41:56.580 --> 00:41:56.960
que tiene

00:41:56.960 --> 00:41:58.480
sobre Hadoop

00:41:58.480 --> 00:41:59.600
entonces ya tú no tienes que

00:41:59.600 --> 00:42:00.140
programar en

00:42:00.140 --> 00:42:00.820
MacReduce

00:42:00.820 --> 00:42:01.240
¿por qué?

00:42:01.300 --> 00:42:02.480
porque él sabe que a

00:42:02.480 --> 00:42:03.440
partir de esta entrada

00:42:03.940 --> 00:42:04.800
es lo que va a

00:42:04.800 --> 00:42:05.560
hacer entonces que

00:42:05.560 --> 00:42:06.320
todo este código

00:42:06.320 --> 00:42:07.000
lo va a convertir

00:42:07.000 --> 00:42:07.560
en MacReduce

00:42:07.560 --> 00:42:07.960
y lo va a

00:42:07.960 --> 00:42:08.420
ejecutar con

00:42:09.160 --> 00:42:09.640
Tcluster

00:42:09.640 --> 00:42:10.240
entonces ya te

00:42:10.240 --> 00:42:10.880
despreocupa

00:42:10.880 --> 00:42:12.280
si yo no tuviese

00:42:12.280 --> 00:42:13.200
esta entrada aquí

00:42:13.200 --> 00:42:13.960
si no yo hubiese

00:42:13.960 --> 00:42:14.660
leído el archivo

00:42:14.660 --> 00:42:15.040
con

00:42:15.960 --> 00:42:16.440
TfileInput

00:42:16.440 --> 00:42:16.620
de

00:42:16.620 --> 00:42:17.700
por ejemplo

00:42:17.700 --> 00:42:18.500
este

00:42:18.500 --> 00:42:19.120
TfileInput

00:42:19.120 --> 00:42:19.900
de Limite

00:42:19.900 --> 00:42:20.960
y lo conecto

00:42:20.960 --> 00:42:21.600
con este tema

00:42:21.600 --> 00:42:22.540
que está aquí

00:42:22.540 --> 00:42:23.700
ahí me puede dar

00:42:23.700 --> 00:42:24.500
el mismo resultado

00:42:24.500 --> 00:42:25.640
pero ya no estoy

00:42:25.640 --> 00:42:26.400
ejecutándolo con

00:42:27.260 --> 00:42:27.740
MacReduce

00:42:27.740 --> 00:42:29.080
entonces ahí es donde

00:42:29.080 --> 00:42:30.100
entra la herramienta

00:42:30.100 --> 00:42:30.660
con la

00:42:30.660 --> 00:42:31.340
Big Data

00:42:31.340 --> 00:42:32.600
ahora con el caso

00:42:32.600 --> 00:42:33.180
de Spark es

00:42:33.180 --> 00:42:34.800
mucho más sencillo

00:42:34.800 --> 00:42:35.720
porque Spark

00:42:35.720 --> 00:42:36.560
tú puedes

00:42:36.560 --> 00:42:37.680
no tener la

00:42:37.680 --> 00:42:38.180
entrada con

00:42:38.180 --> 00:42:38.700
HDFS

00:42:38.700 --> 00:42:39.900
sino con el TfileInput

00:42:39.900 --> 00:42:40.540
por ejemplo

00:42:40.540 --> 00:42:42.260
y aquí hay unos

00:42:42.260 --> 00:42:42.940
elementos de

00:42:42.940 --> 00:42:43.260
configuración

00:42:43.260 --> 00:42:43.800
que lo vas a

00:42:43.800 --> 00:42:44.300
encontrar acá

00:42:44.300 --> 00:42:44.640
bajito

00:42:44.640 --> 00:42:45.120
y tú le das

00:42:45.120 --> 00:42:45.980
chulea y se

00:42:45.980 --> 00:42:47.040
conviértame ese código

00:42:47.040 --> 00:42:47.960
a Spark

00:42:47.960 --> 00:42:49.280
entonces toma ese código

00:42:49.280 --> 00:42:49.840
y lo convierte

00:42:49.840 --> 00:42:50.960
Spark basado con Java

00:42:50.960 --> 00:42:52.120
y lo ejecuta

00:42:52.120 --> 00:42:52.880
con Tcluster de

00:42:52.880 --> 00:42:54.020
Spark que tengas tú

00:42:54.020 --> 00:42:55.880
ese es

00:42:55.880 --> 00:42:57.120
la ventaja

00:42:57.120 --> 00:42:58.240
de la herramienta

00:42:58.240 --> 00:42:59.440
entonces tú terminas

00:42:59.440 --> 00:42:59.860
al final

00:42:59.860 --> 00:43:00.880
usando una herramienta

00:43:00.880 --> 00:43:01.680
ETL

00:43:01.680 --> 00:43:02.920
que la herramienta

00:43:02.920 --> 00:43:04.360
toma ese ETL

00:43:04.360 --> 00:43:04.840
el código

00:43:04.840 --> 00:43:05.260
que al final

00:43:05.260 --> 00:43:06.080
lo convierte en Java

00:43:06.080 --> 00:43:07.260
y lo manda

00:43:07.260 --> 00:43:08.080
o a MacReduce

00:43:08.080 --> 00:43:09.040
o la manda a Spark

00:43:09.040 --> 00:43:10.380
dependiendo de tu configuración

00:43:10.380 --> 00:43:11.560
como la tengas

00:43:11.560 --> 00:43:12.500
ese es

00:43:12.500 --> 00:43:13.120
prácticamente

00:43:13.120 --> 00:43:14.480
el boon de la herramienta

00:43:14.480 --> 00:43:15.960
que te evita

00:43:16.480 --> 00:43:17.340
escribir el código

00:43:17.340 --> 00:43:18.040
en MacReduce

00:43:18.040 --> 00:43:18.800
o en Spark

00:43:18.800 --> 00:43:20.120
automáticamente lo hace

00:43:21.000 --> 00:43:21.900
listo entonces

00:43:21.900 --> 00:43:23.000
eso es

00:43:23.000 --> 00:43:23.640
la esencia

00:43:23.640 --> 00:43:24.600
de la herramienta

00:43:24.600 --> 00:43:25.540
a nivel de Big Data

00:43:25.540 --> 00:43:26.260
al final

00:43:26.260 --> 00:43:27.380
date cuenta que

00:43:27.380 --> 00:43:28.020
en resumida cuenta

00:43:28.540 --> 00:43:28.680
sería

00:43:28.680 --> 00:43:30.100
la misma herramienta

00:43:30.100 --> 00:43:30.920
ETL

00:43:30.920 --> 00:43:31.820
pero me ofrece

00:43:31.820 --> 00:43:32.580
la característica

00:43:32.580 --> 00:43:33.240
de convertir

00:43:33.240 --> 00:43:34.120
el código Java

00:43:34.120 --> 00:43:35.060
para que sea ejecutado

00:43:35.060 --> 00:43:35.700
con MacReduce

00:43:35.700 --> 00:43:36.400
o con una Spark

00:43:36.400 --> 00:43:37.240
esa es la esencia

00:43:37.240 --> 00:43:38.360
del Big Data

00:43:38.360 --> 00:43:39.560
sobre esta herramienta

00:43:39.560 --> 00:43:40.060
pues

00:43:40.060 --> 00:43:41.200
ahora que vamos a hacer

00:43:41.200 --> 00:43:41.680
entonces

00:43:41.680 --> 00:43:43.140
vamos a

00:43:43.140 --> 00:43:43.580
ejecutar

00:43:43.580 --> 00:43:45.980
este señor de aquí

00:43:45.980 --> 00:43:47.100
vamos a darle aquí

00:43:47.100 --> 00:43:48.440
verifica por favor

00:43:48.440 --> 00:43:49.220
en que

00:43:50.800 --> 00:43:51.360
el

00:43:51.360 --> 00:43:52.220
el yo que vayas a

00:43:52.220 --> 00:43:52.660
ejecutar

00:43:52.660 --> 00:43:53.540
corresponda

00:43:53.540 --> 00:43:53.680
al

00:43:53.680 --> 00:43:54.560
yo que deseas

00:43:54.560 --> 00:43:55.260
en este caso

00:43:55.260 --> 00:43:56.240
yo película

00:43:56.240 --> 00:43:56.760
más popular

00:43:56.760 --> 00:43:57.040
voy a

00:44:01.180 --> 00:44:01.700
ejecutar aquí

00:44:02.560 --> 00:44:03.040
bueno

00:44:03.040 --> 00:44:03.360
voy a

00:44:03.360 --> 00:44:03.720
ejecutar

00:44:03.720 --> 00:44:04.160
a ver qué

00:44:04.160 --> 00:44:04.540
sale

00:44:05.180 --> 00:44:05.800
el yo

00:44:05.800 --> 00:44:06.520
puede que sea

00:44:06.520 --> 00:44:07.040
lento

00:44:07.040 --> 00:44:07.440
pues

00:44:07.440 --> 00:44:07.780
no tengo

00:44:07.780 --> 00:44:07.980
gran

00:44:07.980 --> 00:44:08.240
cantidad

00:44:08.240 --> 00:44:08.480
porque

00:44:08.480 --> 00:44:09.240
la máquina

00:44:09.240 --> 00:44:10.140
virtual de Hyper-V

00:44:10.140 --> 00:44:10.660
tiene poca

00:44:10.660 --> 00:44:11.400
memoria

00:44:11.400 --> 00:44:11.680
pues

00:44:11.680 --> 00:44:12.200
en un ambiente

00:44:12.200 --> 00:44:12.500
real

00:44:12.500 --> 00:44:13.100
vas a tener un

00:44:13.100 --> 00:44:13.340
clúster

00:44:13.340 --> 00:44:13.820
con varios

00:44:14.340 --> 00:44:15.080
equipos

00:44:15.080 --> 00:44:15.860
o varias

00:44:15.860 --> 00:44:16.800
o varios

00:44:17.720 --> 00:44:18.680
o varios

00:44:19.560 --> 00:44:20.200
contenedores

00:44:21.340 --> 00:44:22.320
bueno aquí salió

00:44:22.320 --> 00:44:23.140
un error

00:44:23.140 --> 00:44:24.500
y fíjese que me

00:44:24.500 --> 00:44:25.180
dice que la

00:44:25.180 --> 00:44:25.960
popularidad que es

00:44:26.700 --> 00:44:27.340
nula

00:44:27.340 --> 00:44:27.960
lo que te

00:44:27.960 --> 00:44:28.380
había dicho

00:44:28.380 --> 00:44:29.260
entonces

00:44:30.600 --> 00:44:31.240
eh

00:44:31.240 --> 00:44:31.620
ah no

00:44:31.620 --> 00:44:32.460
aquí en realidad

00:44:32.460 --> 00:44:33.180
para cualquier

00:44:33.180 --> 00:44:33.740
función de

00:44:33.740 --> 00:44:33.980
grupo

00:44:33.980 --> 00:44:34.420
si hay un

00:44:34.420 --> 00:44:34.820
nul sale un

00:44:34.820 --> 00:44:35.020
error

00:44:35.820 --> 00:44:36.460
entonces

00:44:36.460 --> 00:44:37.400
qué pena

00:44:38.200 --> 00:44:39.440
aquí popularidad

00:44:39.440 --> 00:44:39.760
a sacar

00:44:39.760 --> 00:44:40.320
el máximo

00:44:40.320 --> 00:44:40.720
como una

00:44:40.720 --> 00:44:41.800
función numérica es el

00:44:41.800 --> 00:44:42.320
problema

00:44:42.320 --> 00:44:43.740
saca el máximo

00:44:43.740 --> 00:44:45.340
de ese integer

00:44:45.340 --> 00:44:45.740
dale

00:44:45.740 --> 00:44:46.460
ignore

00:44:46.460 --> 00:44:47.040
nulls por

00:44:47.040 --> 00:44:47.520
favor

00:44:47.520 --> 00:44:48.440
y vuelve a

00:44:48.440 --> 00:44:48.820
ejecutar

00:44:53.520 --> 00:44:54.280
nuevamente

00:44:59.120 --> 00:44:59.880
solamente

00:44:59.880 --> 00:45:00.680
para popularidad

00:45:00.680 --> 00:45:01.060
porque

00:45:01.060 --> 00:45:01.960
no creo

00:45:01.960 --> 00:45:02.220
que haya

00:45:02.220 --> 00:45:02.540
error porque

00:45:02.540 --> 00:45:03.500
no es

00:45:03.500 --> 00:45:04.420
ninguna función

00:45:04.420 --> 00:45:05.700
si efectivamente

00:45:05.700 --> 00:45:06.540
solamente con

00:45:06.540 --> 00:45:07.080
popularidad

00:45:07.080 --> 00:45:08.500
efectivamente

00:45:08.500 --> 00:45:09.940
y ahí te

00:45:09.940 --> 00:45:10.140
están

00:45:10.140 --> 00:45:10.760
mostrando

00:45:11.720 --> 00:45:12.440
entonces

00:45:13.180 --> 00:45:13.900
las

00:45:13.900 --> 00:45:14.580
películas

00:45:14.580 --> 00:45:15.420
con su

00:45:16.300 --> 00:45:17.200
aquí no

00:45:17.200 --> 00:45:17.460
se ve

00:45:17.460 --> 00:45:17.900
muy bien

00:45:17.900 --> 00:45:18.440
pero aquí

00:45:19.340 --> 00:45:20.060
tenemos

00:45:21.180 --> 00:45:21.900
las

00:45:25.720 --> 00:45:26.440
películas

00:45:27.800 --> 00:45:29.720
Brenda no sé si

00:45:29.720 --> 00:45:30.100
le quita

00:45:30.100 --> 00:45:30.460
ignore

00:45:30.460 --> 00:45:30.660
null

00:45:30.660 --> 00:45:30.980
y vuelve a

00:45:32.420 --> 00:45:32.460
ejecutar

00:45:32.460 --> 00:45:33.440
o

00:45:33.440 --> 00:45:33.960
voy a

00:45:33.960 --> 00:45:34.340
verificar

00:45:34.340 --> 00:45:34.860
para ver qué

00:45:34.860 --> 00:45:35.280
error tiene

00:45:35.280 --> 00:45:37.120
dice input string

00:45:37.120 --> 00:45:37.840
gear

00:45:37.840 --> 00:45:38.440
listo

00:45:38.440 --> 00:45:38.960
pareciese

00:45:38.960 --> 00:45:39.740
lo siguiente

00:45:39.740 --> 00:45:40.600
en que

00:45:40.600 --> 00:45:40.820
cuando

00:45:40.820 --> 00:45:41.380
intenta

00:45:41.380 --> 00:45:41.780
leer

00:45:41.780 --> 00:45:42.320
hay un

00:45:42.320 --> 00:45:42.560
dato

00:45:42.560 --> 00:45:43.580
entero

00:45:43.580 --> 00:45:44.360
voy a

00:45:44.360 --> 00:45:44.900
ver lo

00:45:44.900 --> 00:45:45.820
siguiente

00:45:45.820 --> 00:45:46.440
explico

00:45:46.440 --> 00:45:46.680
este

00:45:46.680 --> 00:45:46.920
error

00:45:46.920 --> 00:45:50.900
aquí dice

00:45:50.900 --> 00:45:52.080
input string

00:45:52.080 --> 00:45:52.840
gear

00:45:52.840 --> 00:45:54.220
aquí el

00:45:54.220 --> 00:45:54.620
problema

00:45:54.620 --> 00:46:01.460
es lo

00:46:01.460 --> 00:46:02.060
que

00:46:02.060 --> 00:46:02.200
este

00:46:02.940 --> 00:46:03.460
entero

00:46:03.460 --> 00:46:04.360
lo intenta

00:46:04.360 --> 00:46:04.720
convertir

00:46:04.720 --> 00:46:05.220
a numérico

00:46:05.220 --> 00:46:05.580
pero qué

00:46:05.580 --> 00:46:05.940
problema que

00:46:05.940 --> 00:46:06.340
tenga un

00:46:06.340 --> 00:46:06.540
gear

00:46:06.540 --> 00:46:07.040
ya

00:46:07.040 --> 00:46:07.420
intenta

00:46:07.420 --> 00:46:07.700
convertir

00:46:07.700 --> 00:46:08.140
a numérico

00:46:08.140 --> 00:46:08.500
sale un

00:46:08.500 --> 00:46:08.720
error

00:46:08.720 --> 00:46:09.440
cuál es el

00:46:09.440 --> 00:46:09.860
problema que

00:46:09.860 --> 00:46:10.300
tiene

00:46:10.300 --> 00:46:10.880
que está

00:46:10.880 --> 00:46:11.260
leyendo

00:46:11.260 --> 00:46:11.940
encabezado

00:46:11.940 --> 00:46:12.200
como

00:46:12.760 --> 00:46:13.280
datos

00:46:13.280 --> 00:46:13.980
váyase

00:46:13.980 --> 00:46:14.460
al input

00:46:14.460 --> 00:46:14.960
por favor

00:46:14.960 --> 00:46:15.400
dele doble

00:46:15.400 --> 00:46:16.640
al input

00:46:16.640 --> 00:46:17.380
hcf

00:46:17.380 --> 00:46:17.820
input si está

00:46:17.820 --> 00:46:18.180
amable

00:46:18.180 --> 00:46:18.920
y note que

00:46:18.920 --> 00:46:19.400
en el

00:46:19.400 --> 00:46:19.940
header

00:46:19.940 --> 00:46:21.400
tiene cero

00:46:21.400 --> 00:46:21.960
colóquelo

00:46:21.960 --> 00:46:22.440
uno

00:46:22.440 --> 00:46:23.160
al decirle

00:46:23.160 --> 00:46:23.320
uno

00:46:23.320 --> 00:46:23.760
que la

00:46:23.760 --> 00:46:24.100
primera

00:46:24.100 --> 00:46:24.720
la primera

00:46:24.720 --> 00:46:24.960
fila

00:46:24.960 --> 00:46:25.320
no la

00:46:25.320 --> 00:46:25.820
tome

00:46:25.820 --> 00:46:26.480
porque va a

00:46:26.480 --> 00:46:26.900
intentar

00:46:26.900 --> 00:46:27.220
leer

00:46:27.220 --> 00:46:27.940
un entero

00:46:27.940 --> 00:46:28.480
y le va a

00:46:28.480 --> 00:46:28.720
mandar

00:46:28.720 --> 00:46:29.100
gear

00:46:29.100 --> 00:46:29.660
intenta

00:46:29.660 --> 00:46:30.180
convertirlo

00:46:30.180 --> 00:46:30.420
sale un

00:46:30.420 --> 00:46:30.880
error

00:46:30.880 --> 00:46:31.620
vuelve a

00:46:31.620 --> 00:46:31.960
ejecutar

00:46:31.960 --> 00:46:32.320
nuevamente

00:46:32.320 --> 00:46:32.720
para ver

00:46:32.720 --> 00:46:33.440
perfecto

00:46:33.440 --> 00:46:34.060
ahí lo tiene

00:46:34.060 --> 00:46:34.800
perfecto

00:46:35.820 --> 00:46:36.340
ahí

00:46:36.340 --> 00:46:37.400
ahora si

00:46:37.400 --> 00:46:38.120
quisiésemos

00:46:38.120 --> 00:46:38.780
algo en

00:46:38.780 --> 00:46:39.560
particular de

00:46:39.560 --> 00:46:39.920
esto es

00:46:40.540 --> 00:46:41.060
base

00:46:41.940 --> 00:46:42.960
del señor

00:46:42.960 --> 00:46:43.500
Eclipse

00:46:44.820 --> 00:46:45.720
hay veces que

00:46:45.720 --> 00:46:46.240
tú quieres

00:46:46.240 --> 00:46:46.880
maximizar

00:46:46.880 --> 00:46:47.280
por ejemplo

00:46:47.280 --> 00:46:47.940
si le damos

00:46:47.940 --> 00:46:48.380
doble clic

00:46:48.380 --> 00:46:48.820
en una

00:46:48.820 --> 00:46:49.440
perspectiva

00:46:49.440 --> 00:46:49.780
en esta

00:46:49.780 --> 00:46:50.040
de room

00:46:50.040 --> 00:46:50.720
le damos doble

00:46:50.720 --> 00:46:51.720
clic

00:46:51.720 --> 00:46:52.460
dese cuenta

00:46:52.460 --> 00:46:53.420
que automáticamente

00:46:53.420 --> 00:46:54.760
me maximiza

00:46:54.760 --> 00:46:55.460
si

00:46:55.460 --> 00:46:55.960
quisiera

00:46:55.960 --> 00:46:56.560
colocarlo

00:46:56.560 --> 00:46:57.280
nuevamente

00:46:57.280 --> 00:46:57.900
en como

00:46:57.900 --> 00:46:58.480
estaba

00:46:58.480 --> 00:46:59.160
en la

00:46:59.160 --> 00:46:59.540
configuración

00:46:59.540 --> 00:47:00.460
de tu

00:47:00.460 --> 00:47:00.880
de tu

00:47:00.880 --> 00:47:01.720
talen

00:47:01.720 --> 00:47:02.040
le das

00:47:02.040 --> 00:47:02.840
nuevamente doble

00:47:02.840 --> 00:47:03.020
clic

00:47:03.020 --> 00:47:03.540
y te lo

00:47:03.540 --> 00:47:03.800
coloca

00:47:03.800 --> 00:47:04.380
en la

00:47:04.380 --> 00:47:05.040
posición en que

00:47:05.040 --> 00:47:05.240
estaba

00:47:06.420 --> 00:47:07.020
la

00:47:07.020 --> 00:47:08.000
herramienta

00:47:08.000 --> 00:47:08.420
como lo

00:47:08.420 --> 00:47:08.660
hayas

00:47:08.660 --> 00:47:09.020
definido

00:47:09.020 --> 00:47:09.340
hagamos

00:47:09.340 --> 00:47:10.240
algo aquí

00:47:10.240 --> 00:47:11.500
vamos a

00:47:11.500 --> 00:47:12.020
si deseas

00:47:12.020 --> 00:47:12.340
vamos a

00:47:12.340 --> 00:47:12.740
ordenar

00:47:12.740 --> 00:47:13.120
los los

00:47:13.120 --> 00:47:13.460
datos

00:47:13.460 --> 00:47:14.580
bueno no tiene sentido

00:47:14.580 --> 00:47:14.920
vamos a hacer

00:47:14.920 --> 00:47:15.420
lo siguiente ahora

00:47:15.420 --> 00:47:15.900
vamos a crear

00:47:15.900 --> 00:47:16.260
un nuevo

00:47:16.260 --> 00:47:16.660
componente

00:47:16.660 --> 00:47:17.000
aquí

00:47:17.640 --> 00:47:18.600
como ya yo sé que

00:47:18.600 --> 00:47:18.760
me

00:47:18.760 --> 00:47:19.240
funciona

00:47:19.240 --> 00:47:19.680
voy a hacer

00:47:19.680 --> 00:47:20.160
lo siguiente

00:47:20.160 --> 00:47:20.620
voy a quitar

00:47:20.620 --> 00:47:20.860
este

00:47:20.860 --> 00:47:21.680
telocrow

00:47:22.780 --> 00:47:23.220
bueno

00:47:23.220 --> 00:47:23.800
si quieren

00:47:23.800 --> 00:47:24.340
lo dejan

00:47:24.340 --> 00:47:24.640
también

00:47:25.300 --> 00:47:25.740
vamos

00:47:28.100 --> 00:47:28.540
aclaro

00:47:28.540 --> 00:47:29.060
bueno

00:47:30.000 --> 00:47:30.440
la

00:47:30.440 --> 00:47:30.680
pregunta

00:47:30.680 --> 00:47:31.000
que me

00:47:31.000 --> 00:47:31.260
hicieron

00:47:31.260 --> 00:47:31.700
ayer

00:47:31.700 --> 00:47:32.140
en

00:47:32.140 --> 00:47:32.740
cuá

00:47:32.740 --> 00:47:32.980
los

00:47:32.980 --> 00:47:33.320
datos

00:47:33.320 --> 00:47:33.680
tal cosa

00:47:33.680 --> 00:47:33.960
lo que

00:47:33.960 --> 00:47:34.100
pasa

00:47:34.100 --> 00:47:34.940
es que

00:47:34.940 --> 00:47:35.560
si

00:47:35.560 --> 00:47:35.780
tienen

00:47:35.780 --> 00:47:36.120
muchos

00:47:36.120 --> 00:47:36.720
datos

00:47:37.360 --> 00:47:37.800
mandar

00:47:37.800 --> 00:47:38.020
esto

00:47:38.020 --> 00:47:38.220
a

00:47:38.220 --> 00:47:38.460
consola

00:47:38.460 --> 00:47:38.680
te

00:47:38.680 --> 00:47:38.880
consume

00:47:38.880 --> 00:47:39.180
mucho

00:47:40.040 --> 00:47:40.480
tiempo

00:47:40.480 --> 00:47:41.160
y el

00:47:41.160 --> 00:47:41.340
joke

00:47:41.340 --> 00:47:41.620
te va a

00:47:59.960 --> 00:48:00.400
demorar

00:48:00.400 --> 00:48:00.420
mucho

00:48:00.420 --> 00:48:01.780
si

00:48:01.780 --> 00:48:02.160
output

00:48:02.160 --> 00:48:02.520
significa

00:48:03.920 --> 00:48:04.680
a

00:48:04.680 --> 00:48:05.500
escribir

00:48:05.500 --> 00:48:05.780
en el

00:48:05.780 --> 00:48:06.380
sistema de

00:48:06.380 --> 00:48:06.820
fichero

00:48:06.820 --> 00:48:07.120
del

00:48:07.120 --> 00:48:07.860
señor

00:48:07.860 --> 00:48:08.860
si esto tiene

00:48:08.860 --> 00:48:09.100
un

00:48:09.100 --> 00:48:10.040
que tiene

00:48:10.040 --> 00:48:10.280
que tener

00:48:10.280 --> 00:48:11.440
un esquema

00:48:11.440 --> 00:48:12.620
un esquema

00:48:12.620 --> 00:48:13.380
con el cual va a

00:48:13.380 --> 00:48:13.440
crear

00:48:13.440 --> 00:48:14.340
archivo

00:48:14.340 --> 00:48:14.720
pero

00:48:14.720 --> 00:48:15.280
cuando

00:48:15.280 --> 00:48:15.840
conecto

00:48:15.840 --> 00:48:16.120
este

00:48:16.120 --> 00:48:16.820
telog

00:48:16.820 --> 00:48:18.300
con el

00:48:18.300 --> 00:48:19.480
telop

00:48:22.120 --> 00:48:26.880
automáticamente la salida del Tegar Gate se convierte en entrada en el T, en el T HDFCU.

00:48:26.920 --> 00:48:30.940
Bueno, el T-Log no, pero sí podías hacer lo siguiente. Voy a dejarlo como estaba

00:48:30.940 --> 00:48:35.700
anteriormente y se lo voy a dejar. Usted hágalo con allá con un, sin el T-Log.

00:48:35.800 --> 00:48:42.320
Aquí pude de hecho varias cosas. Si quisieses por ejemplo tener ese T-File en un archivo,

00:48:44.040 --> 00:48:49.160
podías aquí cambiar este T-Log por un T-File Output. O si quisieses dejar todavía la

00:48:49.160 --> 00:48:59.460
salida, yo pude haber hecho este T HDFCU Output aquí y conecto el T-Log Road con este HDFCU.

00:48:59.600 --> 00:49:03.440
¿Qué va a pasar aquí? Que aquí me va a mostrar lo que pasa por aquí y al final lo que pasa

00:49:03.440 --> 00:49:07.540
por aquí lo va a mandar acá. Hay varias formas de hacerlo. Al final lo que quiero es que la

00:49:07.540 --> 00:49:13.820
salida de aquí me quede en un archivo allá en el clóset dejado. Pero es viable también

00:49:13.820 --> 00:49:17.900
este esquema en que dejo este intermedio aquí. Podías dejarlo porque normalmente en

00:49:17.900 --> 00:49:23.520
T-Log Road cuando tenemos datos reales, datos de pruebas, y podíamos aquí dejar ese T-Log ahí,

00:49:23.560 --> 00:49:31.980
bien funcionaría igual sin o con el T-Log Road. Voy a configurar ahora entonces este Output que está acá.

00:49:34.000 --> 00:49:40.180
Lo que les decía como... Sí, dígame. A ver, aquí hay varias cosas.

00:49:42.040 --> 00:49:49.680
Bueno, en primer lugar, si el T-Log Road no lo tengo, no tendría un archivo de logs.

00:49:50.700 --> 00:49:57.960
En primer lugar. Ahora, hay varios componentes en talent que te pueden mandar. Por ejemplo,

00:49:58.040 --> 00:50:07.040
hay un componente que se llama un T-Warning. Este T-Warning que está aquí te manda algunos

00:50:07.040 --> 00:50:13.880
warning que tú quieres. Pero el problema donde tú quieres llegar es si el T-Log Road no lo tengo,

00:50:14.820 --> 00:50:24.920
¿cómo podría detectar un issue? Aquí... Sí, sí. Ah, sí, listo. Pero ese mensaje tendría que

00:50:25.440 --> 00:50:36.100
sacarlo con un componente que es T-Log Catcher. Este T-Log Catcher, sin este T-Log Road,

00:50:36.100 --> 00:50:41.740
yo tengo este T-Log Catcher y este T-Log Catcher lo podía mandar a un T-File,

00:50:41.820 --> 00:50:46.400
o sea, a un archivo de log físico, de memoria secundaria. Mira lo siguiente,

00:50:46.540 --> 00:50:50.940
la idea sería de esta manera. Sin este T-Log Road, podía quitar el T-Log Road y colocar un

00:50:50.940 --> 00:50:56.400
T-Log Catcher. Si hay un error aquí en el job, él lo manda al T-Log Catcher,

00:50:56.580 --> 00:50:59.740
pero el T-Log Catcher me queda de memoria principal. Entonces, lo que haría es que el

00:50:59.740 --> 00:51:03.840
T-Log Catcher lo mandaría a un archivo de log. Perdón, aquí es un T-File Output.

00:51:06.100 --> 00:51:11.120
Y tendría mis archivos de log normal de estos jobs. Si me entiendes la idea y si quieres

00:51:11.120 --> 00:51:16.000
que esté muerto, te invento un ejemplo más tarde. Pero la idea sería la menor. Sin el T-Log Road,

00:51:16.260 --> 00:51:20.000
el T-Log Catcher captura cualquier error que haya aquí y para mantener la memoria

00:51:20.000 --> 00:51:24.760
secundaria lo manda a un T-File Output. Si de pronto la idea se dice...

00:51:24.760 --> 00:51:30.060
Sí, exactamente, exactamente. Sí señor, así es, efectivamente. Tiene que quedar un T-Log Catcher.

00:51:32.220 --> 00:51:37.300
Ah, listo. La única es que el T-Log Road lo manda a consola. Listo. Y el T-Log Catcher,

00:51:38.820 --> 00:51:43.940
el T-Log Road mandaría que ella escribiría aquí, pero si hay un error detrás, el T-Log

00:51:43.940 --> 00:51:49.240
no lo captura. Entonces, el T-Log Catcher sí captura cualquier error que haya en el flujo y

00:51:49.240 --> 00:51:54.900
te guarda el error, en qué posición estaba, y con el T-File lo guardas en un log de memoria

00:51:54.990 --> 00:52:01.550
secundaria. Y ahí mantiene tu log listo. Vamos entonces aquí a este THDF Output entonces para

00:52:01.550 --> 00:52:07.130
configurarlo. Como les decía, ya yo sabía que usar dos componentes de THDFS, la mejor forma

00:52:07.130 --> 00:52:15.970
era con un Conectium. Entonces aquí uso la conexión existente. Nombre del archivo. Si deseas

00:52:15.970 --> 00:52:20.910
para que no coloques la ruta, hacemos el fluquito del día de ayer. Voy a buscar un

00:52:20.970 --> 00:52:26.050
archivo que esté, voy a coger un archivo que esté en la ubicación que yo quiera, por ejemplo,

00:52:26.110 --> 00:52:37.170
aquí, y después le cambio el nombre. En este caso lo voy a llamar Mejores Undercore Películas

00:52:38.670 --> 00:52:43.910
por Década. Es para evitar colocar toda la ruta, entonces tomo un archivo que está ahí,

00:52:44.230 --> 00:52:48.610
y después le cambio el nombre para que sea mucho más sencillo. Perfecto, entonces aquí le

00:52:48.790 --> 00:52:54.390
coloco TextFile, el circuit si todavía no lo he explicado. La acción, si vas a ejecutar varias

00:52:54.390 --> 00:52:59.130
veces este yo, mejor coloca Sobreescribir. El añadir lo que hace que cada vez que ejecute le

00:52:59.130 --> 00:53:03.470
vaya a ir más datos al archivo como tal, pero en este caso desea solamente Sobreescribir.

00:53:05.030 --> 00:53:08.690
El Sobreescribir si no está creado lo crea, y si está creado lo sobreescribe entonces.

00:53:09.570 --> 00:53:15.410
Al nombre del archivo, ah, ok, sí. Para ese caso en particular,

00:53:17.630 --> 00:53:22.970
déjenme decirle, bueno, pero le adelanto un poco porque si acaso no me da tiempo de

00:53:25.090 --> 00:53:30.150
hacerle un ejemplo con eso, pero entonces la herramienta maneja lo que llaman

00:53:30.150 --> 00:53:35.590
variables globales. Entonces aquí hay una variable que se llama, por ejemplo, aquí hay

00:53:35.590 --> 00:53:43.590
un test global bar, este señor me permite crear variables globales, entonces imagínate un programa

00:53:43.590 --> 00:53:48.990
que tú define la variable que sea aquí, la voy a colocar aquí, nombreArchivo, nombreArchivo.

00:53:50.830 --> 00:53:57.210
Listo, entonces aquí defino la variable. Podría usar un componente que se llama

00:53:57.210 --> 00:54:05.770
Tjava que monte primero, y aquí por si algo le digo a la variable que llamé nombreArchivo,

00:54:06.790 --> 00:54:13.830
le puedo colocar aquí un nombre que se genere a través de, tome la fecha del día y define

00:54:13.830 --> 00:54:19.330
el nombre. Y lo que hago acá es que en vez de mandarle a colocar aquí el nombre,

00:54:20.010 --> 00:54:24.630
hago una concatenación con la variable global. Sé que lo dije muy rápidamente,

00:54:24.630 --> 00:54:29.350
pero voy a intentar entonces hacer un ejemplo con este para ver si salen, pero sería la forma en

00:54:29.350 --> 00:54:34.670
que haría dinámico el nombre. Defino una variable, la variable le cambia el valor cada vez que

00:54:34.670 --> 00:54:41.290
ejecute y listo, perfectamente puedo concatenar con el nuevo valor y me da. Listo, es que es

00:54:41.290 --> 00:54:47.290
muy este, normalmente aquí ya llevábamos toda la teoría, cuando estaba este curso antes

00:54:47.290 --> 00:54:51.850
teníamos toda la teoría ya está básica del talent y ya tú sabías cómo resolver estos

00:54:51.850 --> 00:54:56.850
problemas que me estabas preguntando. Pero bueno, vamos a ver, vamos a intentar ejecutar aquí este

00:54:56.850 --> 00:55:03.790
señor de acá, listo run acá, debería ahora hacer lo siguiente, debería generar, como tengo

00:55:03.790 --> 00:55:08.350
el telorode por la mitad, me va a mostrar los datos que pasan por ahí y al final me

00:55:08.350 --> 00:55:16.710
debería mandar el archivo al clóser de Hadoop. Dice que aquí no hubo problema, entonces voy

00:55:16.710 --> 00:55:25.090
a revisar acá el clóser de Hadoop, tengo esta, un momento a ver qué, ahora sí, bueno aquí

00:55:25.090 --> 00:55:32.070
tengo el clóser de Hadoop y aquí está, bueno no estaba, F5, ya tengo mejores películas por

00:55:32.950 --> 00:55:41.390
década, voy a bajar aquí y voy a descarguelo aquí mismo por favor desde la interfaz y

00:55:41.390 --> 00:55:44.870
veamos cómo nos quedó el archivo, el archivo me quedó sin encabezados, se me

00:55:45.110 --> 00:55:54.590
dejó colocar los encabezados. Sí, se nos olvidó configurar ese encabezado, entonces

00:55:58.490 --> 00:56:07.890
voy aquí, que raro porque me está dando eso acá, voy aquí a este señor acá y le

00:56:07.890 --> 00:56:14.050
digo incluir header en la parte de abajo, incluir header, se va al output, por favor a

00:56:14.050 --> 00:56:19.890
confusión del output y en la última opción hay un chulito que dice incluir header acá,

00:56:19.890 --> 00:56:24.810
incluir header acá en la parte de abajo ya, bajito y lo vuelvo a ejecutar nuevamente y

00:56:24.810 --> 00:56:35.130
debería agregar los encabezados. Vamos a ver entonces, debería de este lado.

00:56:41.590 --> 00:56:52.070
¿Quién me habló? Sí, normalmente cuando se cambia o quiero volver al mismo lugar le da

00:56:53.270 --> 00:56:59.530
nuevamente doble clic, pero ahora tiene algo, lo que hace es que le cambió, lo que estaba acá

00:56:59.530 --> 00:57:04.430
abajo en la confusión que tiene acá abajo, la tiene ahora del lado izquierdo porque le

00:57:04.570 --> 00:57:09.570
cambió la forma de perspectiva. Haga lo siguiente ahora, ok, dígale lo que hay ahí,

00:57:10.770 --> 00:57:17.290
note en la parte, no sé si me voy a mostrar su pantalla aquí, mire que de este lado es que

00:57:17.290 --> 00:57:22.290
tiene ahora la configuración que tenía acá, entonces si da clic aquí, por ejemplo, dele

00:57:22.290 --> 00:57:30.650
clic aquí a donde está como la paleta esa, dele clic ahí, espere que ahora, dele doble

00:57:30.650 --> 00:57:38.210
clic a eso y debería colocársela abajo, dele aquí donde dice component, doble clic,

00:57:38.310 --> 00:57:42.690
nuevamente doble clic y ahí va armando nuevamente. Ahora, ese run, dele doble clic nuevamente

00:57:44.370 --> 00:57:49.990
y ahora doble clic nuevamente ahí en la parte de arriba, espere un momento,

00:57:50.030 --> 00:57:57.050
hay que cerrar ese, se nos cambió la forma. Listo, perfecto, sí, así es. Intente ejecutar

00:57:57.050 --> 00:58:01.410
ahora nuevamente, ya creo que ya ejecutó, no sé si ya había ejecutado, creo que le cambió

00:58:01.410 --> 00:58:06.910
alguna configuración. Váyase al basic, ahí en la parte de abajo está en memory run,

00:58:07.570 --> 00:58:19.330
váyase en basic run porque ahí está haciendo es, váyase aquí, memory run, suba a la

00:58:19.330 --> 00:58:24.730
primera opción que es basic run para si vuelve a ejecutar ahí porque ahí está haciendo era

00:58:24.730 --> 00:58:31.650
un análisis de memory ahí. No sé, Fernanda, en el caso suyo salió un error allá, suba para ver,

00:58:33.850 --> 00:58:40.810
suba para ver ahí en donde está el run, suba a la barra de, a ver qué error puede salir ahí,

00:58:41.610 --> 00:58:49.550
suba y suba, está al principio, normalmente sale en el principio. Ahí está, la segunda

00:58:49.550 --> 00:58:53.850
línea dice que ya existe. Sí, exactamente, porque ya existe, dele doble clic al output,

00:58:53.850 --> 00:58:59.010
por favor, listo, perdón, dele ejecutar ahora, listo, perfecto, entonces continuamos,

00:59:01.650 --> 00:59:10.210
a ver si me da tiempo de hacer un ejemplito con alguna IA y podamos relacionar el job con IA.

00:59:11.430 --> 00:59:14.770
Bueno, vamos a crear otro ejercicio aquí entonces, ya cerramos este de aquí,

00:59:18.150 --> 00:59:27.290
vamos y vamos a crear aquí create job, un nuevo job, vamos a hacer lo siguiente,

00:59:27.870 --> 00:59:34.250
job, lo vamos a llamar job, calcular, producción,

00:59:39.330 --> 00:59:46.010
por estado, temporada, es decir, vamos a hacer entonces a sacar los datos de

00:59:47.950 --> 00:59:53.970
cuánto es la producción por estado y por temporada. Vamos a ver aquí finish,

00:59:58.470 --> 01:00:01.970
vamos, que venga, vamos a abrir el anterior para tomar la configuración de conexión,

01:00:04.790 --> 01:00:10.170
este vamos a tener, listo, esto que es aquí, vamos a copiar

01:00:13.730 --> 01:00:17.970
y vamos a pegarlo acá, para no tener que volver a configurar eso.

01:00:20.110 --> 01:00:23.530
Listo, voy a cerrar esto que ya no me interesa este lado.

01:00:25.450 --> 01:00:32.090
Vamos entonces a hacer lo siguiente ahora, vamos a tener un HDFS input,

01:00:34.830 --> 01:00:41.130
HDFS input, vamos a tener ahora un THDFS output,

01:00:44.110 --> 01:00:46.370
vamos a tener un T-aggregator row nuevamente,

01:00:52.630 --> 01:00:55.410
agregue otro THDFS input si es tan amable,

01:00:56.650 --> 01:00:57.170
input

01:01:01.650 --> 01:01:06.590
y esto es para ejemplificar aquí, coloque un THDFS row.

01:01:07.250 --> 01:01:15.150
Bueno, listo, entonces este es el archivo que vamos a manejar, nos piden, esto lo que hace es que

01:01:15.150 --> 01:01:22.570
tiene el valor de la por estado, por distrito, por año, por temporada, cuánto se ha cultivado

01:01:22.570 --> 01:01:27.830
y cuándo fue la producción, cuánto, digamos, cuánto tomé de la cosecha que tuvo,

01:01:28.830 --> 01:01:34.290
y vamos a hacer lo siguiente ahora. En primer lugar, voy a tomar del HD,

01:01:34.330 --> 01:01:38.350
que lo hicimos el día de ayer, tomamos y creamos, subimos el archivo que se llama

01:01:38.350 --> 01:01:42.890
producción, entonces vamos a hacer lo siguiente, este HDFS input que está aquí,

01:01:45.870 --> 01:01:47.610
voy a decirle usar conexión existente,

01:01:50.890 --> 01:01:58.770
defino la conexión aquí, y ahora voy a tomar como referencia el archivo que se llama producción.csv,

01:02:00.930 --> 01:02:05.450
perfecto, producción, ahora necesito el esquema de producción,

01:02:07.210 --> 01:02:11.890
necesito el esquema, que es la recomendación que te hago yo cuando tienes varios archivos,

01:02:12.130 --> 01:02:16.970
tiene muchas columnas, carece de sentido que lo haga de forma manual, entonces créate,

01:02:16.970 --> 01:02:21.370
en una porción de ese archivo muy pequeño y vamos a crear una metadata de ese archivo,

01:02:22.850 --> 01:02:29.110
vamos entonces aquí a decirle file delimited, clic derecho y crear file delimited,

01:02:29.470 --> 01:02:34.710
esto lo estoy haciendo simplemente para tomar las columnas y el orden y los tipos de

01:02:34.710 --> 01:02:43.410
datos en que están, lo voy a llamar producción, en español producción, next aquí,

01:02:47.850 --> 01:02:51.950
busca tu carpeta temporal y ahí vas a encontrar el archivito de producción,

01:02:53.570 --> 01:02:57.470
en un ambiente real pues no vas a tener archivo completo, vas a tener solamente las columnas,

01:02:57.610 --> 01:03:10.170
nada más abrir, next, está separado por coma y el día de ayer te comenté acerca de la

01:03:10.170 --> 01:03:15.470
codificación, normalmente pues con un UTF-8 te debe bastar pero en algunos casos, en español

01:03:15.470 --> 01:03:22.770
el Windows 15-52 te puede servir mucho mejor, le digo que tiene encabezado y que está separado

01:03:22.770 --> 01:03:28.750
por coma y después le doy refresh para ver que todo esté bien, listo y aquí lo que quiero

01:03:28.750 --> 01:03:34.170
sacar es cuánto he hecho por producción, por estado y por temporada, sé cuánto he producido,

01:03:34.310 --> 01:03:39.790
por estado y por temporada, es lo que quiero, dale aquí next y el día de ayer lo hicimos

01:03:39.790 --> 01:03:47.510
un poco diferente, vamos a exportar automáticamente este señor, en la penúltimo botón, vamos a

01:03:47.510 --> 01:03:53.290
exportarlo directamente el esquema, en el penúltimo botón de esta ventana, le das click ahí y va

01:03:53.290 --> 01:03:58.710
a exportar el esquema, si dígame, el que perdón, el name de la producción, producción,

01:03:59.430 --> 01:04:08.110
será producción list y aquí vamos a llamarlo entonces producción.xml, esto fue lo que hicimos

01:04:08.110 --> 01:04:12.910
el día de ayer, la diferencia es que el día de ayer lo hicimos ya cuando estaba creado,

01:04:13.390 --> 01:04:18.770
este es cuando lo está terminando de crear, entonces me lleva listo a guardar y le doy

01:04:18.770 --> 01:04:26.870
finish aquí, si digo, Beatriz voy a ir para ver, primero ya creo el archivo delimitado,

01:04:27.130 --> 01:04:32.650
no, vamos a ver, dele click derecho ahí en donde está en la metadata, justamente en

01:04:32.650 --> 01:04:39.370
click derecho, a un momento, a qué pena, que me equivoco, que fue de pantalla, listo,

01:04:39.370 --> 01:04:45.910
ahí está en el penúltimo botón, dele next por favor, dele next, y ahora en el penúltimo

01:04:45.910 --> 01:04:52.010
botón de esta ventana, listo, vamos a hacer lo mismo que hicimos el día de ayer, coloque

01:04:52.010 --> 01:04:58.610
ahí entonces producción y asegúrse de terminar con xml, dele guardar ahí, finish por favor y

01:04:58.610 --> 01:05:05.290
listo, vamos por ahí, ahora vamos a tomar ese esquema que está ahí, vamos nuevamente a hfs

01:05:05.290 --> 01:05:10.430
input, que asegúrese donde dice editar esquema, que en este caso está en la parte de arriba y

01:05:10.430 --> 01:05:19.030
en el penúltimo botón es para importar, busque entonces aquí producción, vamos a darle

01:05:19.030 --> 01:05:26.650
aquí ok y ya tuvo que haber importado entonces el esquema exactamente con los nombres de

01:05:26.880 --> 01:05:32.420
que para el caso de talent pues es irrelevante, lo más importante es el orden y el tipo de datos

01:05:32.420 --> 01:05:37.600
de cómo vas a sacar las columnas, si quiere le puede cambiar el nombre, pero bueno, normalmente

01:05:37.600 --> 01:05:44.920
uno a nivel de producción deja los mismos nombres, acto seguido vamos entonces a conectar

01:05:44.920 --> 01:05:54.100
aquí con el t-aggregated y el t-aggregated row lo conectamos con el hdfs output,

01:05:55.380 --> 01:06:02.740
listo entonces repasemos este componente que es muy usado a nivel de cuando voy a sacar algunos

01:06:02.740 --> 01:06:07.700
cálculos porque recordará que cuando yo voy a analizar algo analizo en conjunto para ver la

01:06:07.700 --> 01:06:13.700
frecuencia que puede tener los datos, entonces vamos al t-aggregated row y vamos entonces

01:06:13.700 --> 01:06:21.020
donde dice editar esquema, en el caso anterior utilicé los mismos nombres de columna que me

01:06:21.020 --> 01:06:26.780
tenían de aquí de entrada, voy a hacerlo un poco diferente, si los nombres de entrada tú

01:06:26.780 --> 01:06:31.040
lo quieres conservar pues lo más lógico es que tomes de aquí para evitar para hacer más rápido

01:06:31.040 --> 01:06:36.940
y lo mandes para este lado como fue el caso de ayer, el caso del proceso pasado, voy a crear

01:06:36.940 --> 01:06:41.860
ahora unas nuevas variables que son las que voy a sacar, entonces las voy a colocar en

01:06:41.860 --> 01:06:49.600
español ahora, aquí tengo un más y este más lo voy a llamar entonces aquí me agregó una

01:06:49.600 --> 01:06:55.880
nueva fila, voy a darle clic ahí donde dice new column y la voy a llamar estado en español,

01:06:56.760 --> 01:07:03.260
tipo de dato stream, por qué lo hice diferente la vez pasada es porque muchas veces vas a

01:07:03.260 --> 01:07:08.440
quisiera conservar los mismos nombres entonces era más rápido que pasar los nombres que tenía

01:07:08.440 --> 01:07:12.680
y los tipos de datos, aquí lo voy a hacer un poco diferente por si acaso te toca hacerlo

01:07:13.340 --> 01:07:18.620
de esta manera alguna vez, estado voy a colocar aquí, voy a agregar una nueva columna

01:07:18.620 --> 01:07:25.460
que la voy a llamar temporada, que también es temporada y voy a agregar entonces

01:07:27.780 --> 01:07:34.920
una nueva columna, la voy a llamar estilo snake case total underscore producción

01:07:36.520 --> 01:07:42.260
y aquí es donde va a quedar la sumatoria de esa producción, entonces como voy a sumar

01:07:42.260 --> 01:07:47.600
datos que son numéricos, el tipo de datos no podía ser string entonces, entonces voy a

01:07:47.600 --> 01:07:53.600
expandir aquí y voy a escoger el tipo de datos más conveniente, para este caso entonces

01:07:54.820 --> 01:08:00.660
aquí tiene, java tiene estos tipos de datos son directamente de java, entonces aquí tiene

01:08:00.660 --> 01:08:07.620
lo siguiente, si sus datos son de tipo enteros entonces java tiene integer y tiene long,

01:08:08.260 --> 01:08:15.120
integer le ocupa menos cantidad que long, el long si es un dato mucho más grande y de igual

01:08:15.120 --> 01:08:21.880
forma tengo, para reales tengo flowat que es para reales y tengo doble, si el doble, si el número

01:08:21.880 --> 01:08:28.880
es muy grande entonces usa el doble, si no, usa flowat, si no cabe en un doble, java tiene un

01:08:28.880 --> 01:08:33.960
tipo de datos especiales que se llama big decimal que ahí aparece, que lo que hace internamente

01:08:33.960 --> 01:08:38.100
es que maneja el dato como si fuese un string, o sea hace unos cálculos matemáticos pero lo

01:08:38.100 --> 01:08:43.220
guarda al final como si fuese un string, pero no es el caso la cantidad de datos no me da

01:08:43.220 --> 01:08:52.840
para big decimal entonces use por favor doble. Este icono que está aquí, perdón este chulito que

01:08:52.840 --> 01:08:58.460
está ahí en el medio que se llama clave, perdón, esto es, esta clave se usa cuando

01:09:00.100 --> 01:09:04.460
ejemplifico, son muchas cosas que de pronto estoy metiendo la cabeza, esa clave que está ahí se usa

01:09:05.720 --> 01:09:09.540
es, supongamos que tú quisieses mandar esos datos en una tabla a la base de datos, entonces

01:09:09.540 --> 01:09:13.740
yo coloco una clave, me manda ese dato como si fuera ya de primaria, me colocó un primaria

01:09:13.740 --> 01:09:21.520
aquí a ese campo, pero no es el caso, te estoy informando y acá recuerde que este nullable es

01:09:21.520 --> 01:09:29.320
el mismo chulito que hicimos con el caso de la variable en el tema que si iba a recibir nulo

01:09:29.320 --> 01:09:39.520
la chuleabas, si sabes que no va a recibir nulo entonces pues no la chuleas, no quiero

01:09:39.520 --> 01:09:48.860
la chuleabas y ahora voy a agrupar entonces como quiero que es sacar por estado y por temporada

01:09:48.860 --> 01:09:53.140
me toca hacer en el group by, me tengo que agrupar entonces primero por estado y después por

01:09:53.140 --> 01:09:56.780
temporada, recuerda que el orden en que agrupes te va a dar diferente entonces primero voy a

01:09:56.780 --> 01:10:02.400
agrupar por estado, voy a darle aquí clic y aquí me dice estado y acá tienes que mapearlo

01:10:02.400 --> 01:10:10.720
con la columna de entrada que sería state name, perfecto ahí mapeo bien, agrega ahora una nueva

01:10:10.720 --> 01:10:19.580
columna temporada y mapearlo con la columna temporada de entrada que sería season, listo

01:10:19.580 --> 01:10:24.000
no vamos a seguir agrupando, vamos a definir entonces una función de grupo, vamos a darle

01:10:24.000 --> 01:10:29.940
entonces aquí en el más y aquí me va a aparecer las las columnas que todavía están

01:10:29.940 --> 01:10:35.580
libres ya yo había usado temporada y estado y nada más tenía producción entonces función aquí

01:10:36.860 --> 01:10:43.160
la función sería suma y que columna vas a sumar entonces spande y hay una columna que

01:10:43.160 --> 01:10:48.000
se llama producción y el error que vimos pues normalmente cuando es matemático si

01:10:48.000 --> 01:10:53.760
hay algún nulo entonces voy aquí ignore null para que me funcione pero recuerda que como

01:10:53.760 --> 01:10:58.660
recomendación si tú sabes que no debe haber nulo no debes colocar ese ignore de tal forma

01:10:58.660 --> 01:11:08.080
que salga un error si de pronto viene un nulo. Configuramos el HDFS output digo usar conexión

01:11:08.080 --> 01:11:15.260
existente y ahora voy a hacer lo siguiente entonces voy a escribir nombre archivo mismo

01:11:15.260 --> 01:11:18.700
truco que apliqué ahora voy a buscar un nombre archivo que esté en la carpeta donde yo quiero

01:11:18.760 --> 01:11:29.760
perdón aquí no especificé la conexión aquí en el combo voz amplió aquí y escojo aquí

01:11:30.620 --> 01:11:38.360
bueno cualquier archivo que al final lo voy a cambiar el nombre y lo voy a llamar entonces

01:11:40.960 --> 01:11:49.980
producción on the record por on the record temporada perdón por estado on the record

01:11:49.980 --> 01:11:53.580
temporada. Aquí un par de recomendaciones

01:11:56.680 --> 01:12:01.400
el problema de las codificaciones ya habíamos visto en el Tefalinput que hay varias

01:12:01.400 --> 01:12:09.320
codificaciones ASCII, ISO, la ISO, la ANSI entonces te voy a recomendar en que los JOTS ya adopte

01:12:09.320 --> 01:12:15.020
su sistema de codificación el que tú ya has definido por estándar normalmente casa como UTF-8

01:12:15.020 --> 01:12:19.800
por ejemplo aquí sitúa codificación personalizada por defecto está en ISO,

01:12:20.680 --> 01:12:24.800
ese ISO es inglés si los datos tienen español y le mandas para ISO allá cuando los vayas

01:12:24.800 --> 01:12:30.660
a leer baja tiene un pequeño problema entonces normalmente acostumbra pues a usar

01:12:30.660 --> 01:12:35.740
estándar que tú ya definido UTF-8 no sé el que hayas definido pero si los datos en español

01:12:35.740 --> 01:12:41.600
mejor que se casen con un estándar de UTF-8 si de pronto es europeo el ISO le funciona

01:12:42.400 --> 01:12:47.140
perfectamente eso lo quería mencionar aquí y lo último aquí es esa parte de compresión

01:12:47.140 --> 01:12:54.360
de datos pasa lo siguiente en que recordará que por la forma de clostrización que se tiene

01:12:54.360 --> 01:12:59.380
que está en este caso de JADUT JADUT lo que tiene es lo siguiente toma un archivo y lo

01:12:59.380 --> 01:13:05.340
divide en diferentes partes o particiones pero esas particiones la réplica por una cuestión

01:13:05.340 --> 01:13:11.460
netamente de redundancia por si acaso se daña alguna particiones por ejemplo si notamos aquí

01:13:11.460 --> 01:13:18.820
esta partición de JADUT acá nota que aquí tengo una replicación de 3 significa que este

01:13:18.820 --> 01:13:26.020
señor va a replicar tres veces la misma partición eso te va a ampliar a digamos en

01:13:26.120 --> 01:13:31.200
en gran medida el almacenamiento que vas a ocupar en memoria secundaria la ventaja que tienes con

01:13:31.200 --> 01:13:36.580
esto es que la memoria secundaria es muy barata a nivel de clau pero quizás hay archivos que

01:13:36.580 --> 01:13:42.180
son muy grandes entonces la herramienta te permite hacer lo siguiente te permite comprimir

01:13:42.180 --> 01:13:49.800
los datos entonces de aquí una compresión de datos y aquí están varios formatos de

01:13:49.800 --> 01:13:54.760
compresión estos formatos de compresión vienen directamente del mundo de UNIX aquí está

01:13:54.760 --> 01:14:06.340
si y vamos a quedar aquí incluir hider incluir listo ahora vamos a hacer lo siguiente quiero

01:14:06.340 --> 01:14:13.220
ahora leer este archivo porque lo quiero leer es porque cuando está comprimido tienes que leerlo

01:14:13.220 --> 01:14:18.400
tienes que especificar que está comprimido aquí me adelanté un poco a usar este como yo

01:14:19.540 --> 01:14:25.520
perdón no me adelanté que pena no me olvide lo último que di no me adelanté entonces

01:14:25.520 --> 01:14:31.060
qué vamos a hacer ahora este hdf input va a leer este archivo que voy a escribir acá

01:14:31.060 --> 01:14:36.680
entonces que voy a hacer estando en el hdfs up voy a copiar la ruta del archivo el

01:14:36.680 --> 01:14:42.320
nombre del archivo la voy a copiar y la voy a pegar en hdfs input aquí voy a configurar

01:14:42.320 --> 01:14:49.520
que voy a usar una conexión existente configuro la conexión y voy a pegar aquí el nombre del

01:14:49.520 --> 01:14:56.920
archivo de salida que tengo en el hdfs listo ahora que voy a hacer recuerde que todo lo

01:14:56.920 --> 01:15:01.360
input y output que tenga tiene que tener un esquema el esquema de entrada tiene que ser

01:15:01.360 --> 01:15:04.680
el mismo esquema de salida de este archivo que está aquí por ende ya yo sé que este

01:15:04.840 --> 01:15:13.080
hasta acá voy a este a este output le digo editar esquema y voy a exportar el esquema

01:15:13.080 --> 01:15:21.140
este que estado que está aquí donde está este sería la antepenúltima opción aquí la

01:15:21.140 --> 01:15:28.880
antepenúltimo botón perdón antepenúltimo botón y lo voy a llamar entonces producción

01:15:28.880 --> 01:15:31.000
temporada producción

01:15:33.980 --> 01:15:37.640
temporada punto xml te doy aquí guardar

01:15:39.540 --> 01:15:48.360
cierro aquí con ok y lo que hago ahora me voy al input al esquema del input y aquí si es

01:15:48.360 --> 01:15:55.480
el penúltimo botón y busco entonces el archivo del esquema que exporte abrir y

01:15:55.480 --> 01:15:59.960
debería dar entonces listo aquí damos ok

01:16:03.300 --> 01:16:05.880
y por último conecto el input

01:16:07.800 --> 01:16:14.500
con este teloro ah listo sí perfecto y lleva hider pero el momento en el input listo

01:16:14.500 --> 01:16:18.920
estoy no con si si gracias entonces en el input tengo que hacer aquí tendría que tener

01:16:20.740 --> 01:16:28.540
un hider la codificación tendría que ser la misma que sería utf-8 y necesariamente tendría

01:16:28.540 --> 01:16:33.380
que descomprimir los datos porque vienen comprimido la descomprensión tendría que

01:16:33.380 --> 01:16:40.760
estar en el mismo algoritmo que colocarte el op vamos ya lo exportó o todavía falta

01:16:40.760 --> 01:16:45.240
importarlo había por dónde va bueno bien vamos primero a exportarlo primero nos vamos

01:16:45.240 --> 01:16:55.840
al hdfs output le da en editar el esquema este esquema de salida para exportarlo va a ser

01:16:55.840 --> 01:17:04.100
el tercer bot el atp no último botón que dice export all y aquí lo exporta llamélo

01:17:04.100 --> 01:17:09.680
producción temporada y aseguré que sea punto xml si están a mal dele ok perfectamente ahora

01:17:09.680 --> 01:17:20.220
se va al input al hfs input y edita el esquema del hdf input perfecto editar esquema y ahora

01:17:20.220 --> 01:17:29.600
importa que sería el botoncito el penúltimo botoncito penúltimo botón y busca el archivo

01:17:29.600 --> 01:17:42.200
que ya había exportado listo header en uno la codificación tiene que ser igual a la del output

01:17:42.200 --> 01:17:49.760
si la codificación del hfs output está en utf-8 como el caso mío que la cambie aquí en utf-8

01:17:50.320 --> 01:17:55.400
la el input también tendría que estar en utf-8 si no la configuró no hay ningún problema porque

01:17:55.400 --> 01:18:02.500
la bala por defecto que sería la hizo y por último como este archivo lo comprimió tiene

01:18:02.500 --> 01:18:07.500
que descomprimirlo en el mismo algoritmo de ese cuenta que en el output yo comprimí con

01:18:07.500 --> 01:18:15.960
jett con jesset y acá voy a descomprimir con jesset bien cuánto su job habría en ese trabajo

01:18:15.960 --> 01:18:22.460
que está ahí a ver si no acordamos ahí cuánto su yo que habrían ahí habrían tres verdad el

01:18:22.460 --> 01:18:30.980
tepe yo el segundo su job y el tercer su yo aquí por defecto aquí me funcionaría bien en el caso

01:18:30.980 --> 01:18:36.780
particular por qué porque no tiene que darse ese y después este pero como buena práctica y quizá

01:18:36.780 --> 01:18:41.480
porque se te puede olvidar a ti mejor define el orden jerárquico si hay una jerarquía define

01:18:41.480 --> 01:18:46.540
la jerarquía de los su job entonces recordamos cómo hacíamos esto vamos al primer su job a

01:18:46.680 --> 01:18:54.240
elemento del su job 1 y voy a conectarlo con el disparador con su job ok hacia el primer

01:18:54.240 --> 01:19:00.660
componente del su job aunque la ejecución da igual este este yo que se puede leer más

01:19:00.660 --> 01:19:06.580
fácilmente porque sé que se ejecuta primero y después que se ejecuta después listo entonces

01:19:06.580 --> 01:19:14.840
voy a hacer aquí voy a ejecutar aquí verifiquen el ron que sea igual al que está ejecutando

01:19:14.840 --> 01:19:17.240
y vamos a ejecutar este señor

01:19:23.220 --> 01:19:27.760
aquí me sale un error dice no puede ser progresado porque incompatible o

01:19:27.760 --> 01:19:29.480
no sé no es raro extrañamente raro

01:19:36.280 --> 01:19:41.220
bueno ahí está los datos en que salió un warning ahí pero no sé por qué se lo

01:19:41.220 --> 01:19:51.160
hace warning ahí está entonces por ejemplo voy a sacar solamente dos dáticos aquí nada más

01:19:51.160 --> 01:19:56.920
para verlos aquí lo que veo raro es que no me lo está formateando bien parece ser que no

01:19:56.920 --> 01:20:04.880
lo está formateando bien el separador de campo acá es punto y coma y el separador

01:20:04.880 --> 01:20:09.080
es punto y coma no sé parece que no está como que

01:20:12.940 --> 01:20:18.540
hay algunos que tienen errores voy a verificar entonces aquí luis está preguntando algo para ver

01:20:18.540 --> 01:20:23.680
en el esquema el campo producción viene definido como stream a ok bien stream porque

01:20:23.680 --> 01:20:25.760
bien stream entiendo

01:20:29.140 --> 01:20:34.760
ah claro aquí está como es trin lo tomó mal y por eso que sale error

01:20:36.440 --> 01:20:40.900
bueno si quieres vamos aquí voy a cambiar el problema que tiene déjame un momentico ahí

01:20:40.900 --> 01:20:46.040
y solución aquí los demás porque yo te entendí la idea muchas gracias no me da cuenta

01:20:46.040 --> 01:20:53.460
voy a voy voy en el caso de luis que tiene a listo luis a ti salió error entonces vamos a

01:20:53.460 --> 01:21:00.740
ver el error te salió en el no porque ese input que está ejecutando luis

01:21:02.740 --> 01:21:09.860
el de abajo es el vete a tu hdf o por un momento luis hdf o por un momento

01:21:11.940 --> 01:21:18.720
ya está sube eso coloca lo más porque si no perfecto ese que está ahí

01:21:18.720 --> 01:21:23.380
es que está ejecutando al revés luis yo está buscando la chido que yo está creado

01:21:23.460 --> 01:21:27.460
borra el subyop borra el pt perdón borra la flecha del onsujok ok

01:21:28.800 --> 01:21:37.040
que están a mal de onsujok ok borrala ahora vete y dale clic derecho al input el de abajo

01:21:38.180 --> 01:21:43.460
y ahora sí dale clic derecho disparador porque se se ejecuta primero onsujok ok con el de

01:21:43.460 --> 01:21:47.580
arriba y porque estaba buscando el archivo que tuvimos está creado ejecuta ahora sí para ver

01:21:47.580 --> 01:21:51.800
y ahí está total producción porque ahora le cambiamos el tipo de datos para solucionar

01:21:51.800 --> 01:21:58.680
el problema perfecto liso el problema que tenías era el que tenías al revés el quién más perfecto

01:21:58.680 --> 01:22:04.780
vamos a solucionar el problema este del del warning que me sale este warning ojo lo

01:22:04.780 --> 01:22:10.060
siguiente y sería interesante bueno interesante que haya pasado esto el problema que tengo es

01:22:10.060 --> 01:22:15.720
que en el te agregué este robo todo haciendo una suma de un dato que es entero entonces

01:22:15.720 --> 01:22:21.460
mira lo siguiente yo pude haber cambiado el tipo de datos aquí en el te agregué este row de

01:22:21.460 --> 01:22:28.400
a doble el problema que tengo es que el señor viene string y va a intentar convertir el string

01:22:28.400 --> 01:22:33.920
a doble y va a tener un error entonces aquí lo mejor es convertirlo desde el inicio vete acá

01:22:33.920 --> 01:22:48.520
al hfs este este output editar esquema y conviértelo a doble que creo que sé por qué lo hizo

01:22:49.380 --> 01:22:53.320
conviértelo un momento a doble este señor se me perdió el doble aquí está doble

01:22:55.420 --> 01:23:01.480
entre pasa lo siguiente que muchas veces yo con cambio aquí al inicio y los elementos que

01:23:01.480 --> 01:23:07.340
siguen a continuación no los cambia entonces hay que verificar que el doble siga en el

01:23:07.340 --> 01:23:16.980
siguiente componente voy aquí al te agregué terro voy aquí a editar esquema y si si lo

01:23:18.300 --> 01:23:25.060
cambió si lo cambió lo cambié al inicio y cambió la cadena hay veces que no lo hace ahora

01:23:25.060 --> 01:23:34.860
vamos a ejecutarlo para ver si no sale error porque quizás salga un pequeñito error

01:23:37.000 --> 01:23:40.600
listo aquí el error fue porque no coloqué para que sólo escribiera entonces voy a dar

01:23:40.600 --> 01:23:48.600
aquí over white brenda tiene un error ahí ya voy a ver para ver qué tiene cuál error que tiene

01:23:49.840 --> 01:23:57.380
ya un momento para ver bueno perfecto ahí salió listo perfecto ningún problema ok ese

01:23:57.380 --> 01:24:03.300
era el warning que teníamos muchas gracias luis aquí no es necesario que lo cambies en

01:24:03.300 --> 01:24:10.920
el input 2 el porque el input 2 te quedó como te quedó como string a no no perdón no qué pena

01:24:10.920 --> 01:24:16.460
confusión bien quién era brenda que tiene error muestrame el room dale click en el room brenda

01:24:16.460 --> 01:24:20.740
por favor si está mal para ver qué error tiene dice todo no puede ser progresada diva

01:24:20.740 --> 01:24:26.300
entonces después nombre a total producción a listo bs al hfc input por favor al 2 al 2

01:24:26.300 --> 01:24:30.620
exactamente 6 de doble clic si está mal ahí fue porque no lo colocó encabezado entonces

01:24:30.620 --> 01:24:36.900
intenta leer intenta convertir un string a entero y no la elegir tiene que estar en uno corrida

01:24:36.900 --> 01:24:43.240
inmediatamente váyase al che al hfc output al 1 por favor si están amables al esquema del 1

01:24:43.240 --> 01:24:52.880
al hfs el 1 gracias al perdón al input que pena al input hfs input 1 no así si tiene

01:24:52.880 --> 01:24:58.120
colocarle 1 también 1 porque tiene encabezado váyase a editar esquema un momento de ese

01:24:58.120 --> 01:25:06.300
ahí editar esquema ahí cambie production el tipo de datos que está en string cambia

01:25:06.300 --> 01:25:14.540
los dobles si están amables el último ahí entre dele ahí lo tomó dele que yes ejecute

01:25:14.540 --> 01:25:19.800
ahora para ver nuevamente ya se alte al hf output y cambie de crear a overwrite doble

01:25:19.800 --> 01:25:27.140
clic ahí y cambie action el action de crear a sobre escribir y vuelve a ejecutar nuevamente

01:25:27.140 --> 01:25:37.220
perfecto ahora sí listo ok listo si va a la a su cluster de hadut f5

01:25:40.080 --> 01:25:48.020
que sería este punto csv ya la como en es más la extensión carece de sentido porque ya

01:25:48.020 --> 01:25:52.900
pierdo el formato de más si yo lo descargo aquí creo que me debe salir como un formato

01:25:53.040 --> 01:26:00.080
binario algo así por el estilo ahí está porque está está comprimido

01:26:07.180 --> 01:26:11.740
cuánto pesa el archivo a ver 3 3 puntos megas permítame y hago aquí una

01:26:11.740 --> 01:26:15.800
una pequeña observación voy a ejecutarlo sin no la guste simplemente para verlo acá

01:26:16.000 --> 01:26:17.480
no lo voy a comprimir

01:26:22.180 --> 01:26:27.280
y voy a ver cuánto pesaría para comprar los dos voy a cambiar aquí el nombre para ver más

01:26:27.280 --> 01:26:33.460
o menos cuánto aunque el archivo muy pequeño entonces quizás no se ve tan claro porque

01:26:33.460 --> 01:26:53.600
muy pequeño archivo listo ahí está ejecutando perfecto f5 vea el original pesa sin comprimir

01:26:53.600 --> 01:27:01.380
14 megas y comprimido da 3 megas y comprimir bastante comprimir bastante bueno continuamos

01:27:01.380 --> 01:27:07.020
con otro ejemplo y vamos a hacer un join ahora como hacemos un join acá entonces perfecto listo

01:27:09.440 --> 01:27:15.180
voy a sacar lo siguiente mire tengo los datos esto de esta manera voy a tomar aquí estado

01:27:20.440 --> 01:27:26.660
bueno listo voy a sacar nada más estos tres campos aquí que sería crochet listo y producción

01:27:29.020 --> 01:27:34.680
quiero sacar la mayor producción por año entonces primero me tocaría sumar todas

01:27:34.680 --> 01:27:41.180
las producciones que haya en ese año y después saco la mayor que tenga desde cuenta que el

01:27:41.180 --> 01:27:45.540
mayor que como lo hice anteriormente creo que lo tenía por aquí no sé este que está aquí

01:27:46.580 --> 01:27:54.260
este esta forma que hice yo era para introducir el texor no me funcionaría en todos los casos

01:27:54.260 --> 01:27:59.340
porque puede hacer el caso en que haya dos películas para este caso muy particular que

01:27:59.340 --> 01:28:06.280
tenga la mayor popularidad por ejemplo yo puedo tener aquí x con propiedades 92 aquí en realidad

01:28:06.280 --> 01:28:11.940
que el dato me tenía que dar 2 pero como yo estoy sacando solamente el primero nada más me

01:28:11.940 --> 01:28:16.720
mostraría este que está aquí entonces realidad esa consulta o ese yo de la forma

01:28:16.720 --> 01:28:22.720
en que lo tengo puede que me cause algunos problemas porque quizás haya varios películas

01:28:22.720 --> 01:28:27.840
que tengan la mayor popularidad por ende voy a hacer entonces el ejercicio de forma diferente

01:28:27.840 --> 01:28:34.800
esto entonces voy a hacer lo siguiente voy a sacar ahora la mayor producción que hay por año

01:28:36.900 --> 01:28:43.640
listo esto este solo voy a hacer es para incluir cómo se haría un join entre varios

01:28:43.640 --> 01:28:48.360
archivos para esto entonces vamos a irnos nuevamente al talent

01:28:51.340 --> 01:28:57.620
y vamos entonces a crear aquí en el big data que está acá

01:28:57.620 --> 01:29:01.620
clic derecho y voy a crear un nuevo yo

01:29:02.700 --> 01:29:10.780
este yo que lo voy a crear entonces yo lo voy a llamar calcular mayor

01:29:13.180 --> 01:29:20.920
under score producción por año coloque por anualidad porque no le va a aceptar el

01:29:20.920 --> 01:29:25.260
año entonces colócale por anualidad yo calcular mayor producción por anualidad

01:29:25.260 --> 01:29:28.300
como le decía voy a tratar de hacer los archivos de forma diferente cada

01:29:28.300 --> 01:29:32.300
yo para poder incluir componentes nuevos le damos aquí entonces finish

01:29:35.240 --> 01:29:38.020
y cópiese del anterior las conexiones por favor

01:29:40.780 --> 01:29:57.500
creo los siguientes elementos agregué un hdfs es más como es el mismo archivo por favor

01:29:57.500 --> 01:30:05.640
en el pasado cópiese el input de producción y fue el primer thdfs input entonces voy a la

01:30:07.720 --> 01:30:11.860
anterior al estado temporada que me sirve cuando tengo que volver a configurar eso

01:30:11.860 --> 01:30:20.440
voy a tomar el hdfs el input 1 que es el que le de producción y lo voy a pegar acá se

01:30:20.440 --> 01:30:30.900
me escapaba y con esto entonces para evitar tener que volver a configurar algo que ya

01:30:30.900 --> 01:30:40.640
ve lo que voy a hacer primero voy a obtener cuál es la mayor producción por año ok cuál

01:30:40.640 --> 01:30:46.400
es la mayor producción por año y después saco entonces los demás elementos entonces

01:30:46.400 --> 01:30:53.600
voy a hacer lo siguiente voy a agregar aquí ahora un aggregator row y ya está lo más

01:30:53.600 --> 01:30:58.320
lo manejamos voy a agregar aquí un thdfs output

01:31:03.900 --> 01:31:07.840
y voy entonces a hacer las conexiones aquí

01:31:11.840 --> 01:31:14.760
vamos a conectarlo aquí a este output

01:31:20.280 --> 01:31:24.220
listo entonces voy a sacar lo mismo ahora mira lo que voy a hacer primero

01:31:25.120 --> 01:31:33.200
voy a calcular cuánto ha sido la producción que he tenido por estado por temporada y por año

01:31:33.200 --> 01:31:37.540
me toca hacer la sumatoria pero voy a hacer algo particular diferente a la que tenía

01:31:37.540 --> 01:31:42.400
anteriormente voy a mandar esto primero a un archivo entonces voy a hacer aquí lo siguiente

01:31:42.400 --> 01:31:49.260
voy aquí al aggregator row voy entonces aquí donde dice editar esquema voy a sacar entonces

01:31:49.260 --> 01:32:02.180
aquí la columna estado voy a la columna temporada el anterior fue que saqué la producción por

01:32:02.180 --> 01:32:07.340
temporada y por estado esta va a sacar por estado temporada y por año se voy a colocar

01:32:07.340 --> 01:32:18.500
aquí un nuevo que se llame anualidad y este que está aquí va a ser de tipo integer y

01:32:18.500 --> 01:32:25.660
voy a colocar aquí total total on record producción y este va a ser de tipo doble

01:32:30.260 --> 01:32:36.200
la diferencia que hay el anteriormente solamente tenía la producción por estado y temporada

01:32:36.200 --> 01:32:44.880
aquí va a sacar la producción por estado temporada y por año ok y es

01:32:46.160 --> 01:32:51.220
configuramos entonces el group by que sería agrupar aquí espero un momento que algunos

01:32:51.220 --> 01:32:57.260
que todavía han terminado listo el te agregué este row entonces vamos a agrupar por primero

01:32:57.260 --> 01:33:03.680
por estado en este caso mapea la columna de salida está bien mapeada con la columna

01:33:03.800 --> 01:33:09.920
entrada vamos a agregar la temporada que si me toca cambiar así son

01:33:11.700 --> 01:33:16.120
voy a agrupar ahora por anualidad que sería crop gear

01:33:18.860 --> 01:33:24.480
y vamos a hacer entonces una operación en el total voy a hacer una suma

01:33:27.120 --> 01:33:32.740
de la producción que tengo y voy a ignorar null por el problema que tuve ahora parecido

01:33:32.740 --> 01:33:38.960
al otro la única diferencia que hay es que ahora voy a agrupar por estado temporada y

01:33:38.960 --> 01:33:43.780
por año el anterior solamente agrupe por estado y temporada ahora quiero saber cuál

01:33:43.780 --> 01:33:50.880
es la producción tanto por estado temporada y por año ahora en el hdfs output haga lo

01:33:50.880 --> 01:33:56.900
siguiente entonces configuremos usar conexión existente busque un archivo que ya esté aquí

01:33:57.640 --> 01:33:59.280
se me olvidó configurarla aquí

01:34:01.100 --> 01:34:09.760
un archivo que esté aquí cualquiera y lo va a llamar este archivo de salida producción

01:34:12.700 --> 01:34:13.880
llámelo producción

01:34:17.280 --> 01:34:26.900
producción estado under score temporada anualidad listo aquí le da sobre escribir

01:34:26.900 --> 01:34:32.520
por si acaso lo vamos a ejecutar varias veces y dígale que incluya el hdfs voy a hacer un

01:34:32.520 --> 01:34:38.160
ejemplo entonces mientras usted va haciendo esa parte de aquí tenemos estado en ese momento

01:34:38.160 --> 01:34:40.020
para mostrarle cómo quedaría los datos

01:34:47.360 --> 01:34:53.740
si más o menos ese archivo de salida va a quedar de esta manera tengo el estado y tengo

01:34:53.740 --> 01:35:01.080
cada temporada el año y voy a sacar la producción por año más o menos me quedaría así se me

01:35:01.080 --> 01:35:06.400
repite varias veces el estado temporada y por cada año en la temporada me va a calcular el

01:35:06.400 --> 01:35:15.120
valor eso es lo que va a volver hasta aquí estamos hasta aquí ahora quiero sacar lo

01:35:16.200 --> 01:35:25.620
quiero sacar el máximo de cada grupo que está aquí entonces si analiza el máximo

01:35:26.540 --> 01:35:32.320
el máximo de aquí cuál sería carrito sería de aquí sería este de aquí verdad sería el máximo

01:35:34.680 --> 01:35:40.680
si saco el máximo de acá sería este registro de acá o sea el que el año que más tiene o sea

01:35:41.520 --> 01:35:49.500
tengo hasta aquí voy a sacar estos máximos de acá se voy a crear aquí voy a colocarle para

01:35:50.340 --> 01:36:02.720
identificar voy a colocarle aquí una nota aquí voy a colocar se obtienen se obtiene lo producido

01:36:05.760 --> 01:36:16.440
por año producido por año en cada estado y temporada eso lo que se hace aquí lo acomoda

01:36:16.440 --> 01:36:22.700
como usted quiera para poder bajar esto tiene que hacerlo acá directamente en el

01:36:22.700 --> 01:36:27.480
aquí creo también lo puedo hacer aquí lo puedo hacer aquí lo voy a bajar para que me quede así

01:36:30.840 --> 01:36:35.800
bueno no me está bajado ahí está esto hace esto voy a hacer lo siguiente entonces

01:36:36.480 --> 01:36:41.120
voy a sacar la segunda parte que es esta que está aquí entonces para esto vamos a hacer

01:36:41.120 --> 01:36:51.780
lo siguiente voy a hacer lo siguiente voy a hacer aquí un hdfs input nuevamente un

01:36:51.780 --> 01:37:07.340
te agregué terro te agregué terro te agregué terro y voy a mandar a este señor a un thdfs output

01:37:10.180 --> 01:37:12.460
porque así vamos a ver si así

01:37:14.260 --> 01:37:19.100
la única forma de hacer esto es lo siguiente este año no lo puedo sacar así directamente

01:37:19.100 --> 01:37:26.960
sino a partir de cómo está el archivo yo voy a sacar el máximo valor o sea en pocas palabras

01:37:26.960 --> 01:37:33.060
cuál es el máximo producido en esta en esto sería esta fila de aquí entonces que voy a

01:37:33.060 --> 01:37:42.800
hacer yo voy a agrupar por estado y temporada y voy a sacar el max producido eso lo que

01:37:42.800 --> 01:37:47.900
voy a hacer en este agregate significa que me está dando al final estaría dando en el

01:37:48.400 --> 01:37:56.620
grupo este de aquí me estaría dando x a y me estaría dando 13 en este grupo de acá que

01:37:56.620 --> 01:38:01.860
voy a hacer voy a agrupar por estado y temporada y sacar el máximo me estaría dando x

01:38:05.460 --> 01:38:11.100
b y aquí me estaría dando 18 y después hago un join de estos dos archivos para

01:38:11.100 --> 01:38:16.300
poder sacar el año aclaro que lo estoy haciendo así es para poder incursionar

01:38:16.300 --> 01:38:22.980
en el join vamos a lo siguiente vamos aquí vamos a conectar este señor de aquí con este de acá

01:38:26.740 --> 01:38:31.080
y voy a conectar este te agregué este rub con este de acá

01:38:33.780 --> 01:38:37.300
el archivo que voy a leer aquí es el archivo producido en este punto de acá

01:38:39.140 --> 01:38:44.660
entonces voy a hacer lo siguiente voy a exportar el esquema de aquí editar esquema

01:38:46.460 --> 01:38:55.160
ya saben cómo es aquí voy aquí al output editar esquema y aquí sería la antepenúltima

01:38:55.160 --> 01:39:06.700
exporto y lo voy a llamar entonces producción estado temporada año anualidad porque no es

01:39:06.700 --> 01:39:18.800
anualidad punto xml ok del output me robo el nombre del archivo para poderlo copiar allá en el input

01:39:23.520 --> 01:39:26.500
aquí usar conexión existente sí dígame

01:39:30.000 --> 01:39:34.920
Beatriz vamos a ver si está raro un momento permítame y accedo de forma

01:39:34.920 --> 01:39:42.800
interactiva para poder manipular su pantalla voy a darle aquí un guardar aquí un momento voy a

01:39:42.800 --> 01:39:49.400
hacer no sé si pronto fue voy a cerrar este señor de acá volverlo a ir para ver no sé fue

01:39:49.400 --> 01:39:56.520
algo extraño hay que ese algo extraño ahí no sigamos entonces no sé qué pasó ahí algo

01:39:56.520 --> 01:40:01.480
extrañamente raro ya se quitó ahí se realicen el ingeniero bueno aquí el input este que está

01:40:01.480 --> 01:40:10.520
aquí editamos el esquema y exporto aquí y aquí sería producción estado temporada anualidad ok

01:40:15.980 --> 01:40:20.560
ese en realidad estoy sacando el máximo de un grupo que normalmente uno lo hace con un sub

01:40:22.260 --> 01:40:26.580
query acá lo que voy a hacer es que voy a dividirlo en dos archivos y después hago un

01:40:26.580 --> 01:40:31.220
de los dos y resuelvo el problema voy a esperar que algunos están

01:40:33.420 --> 01:40:37.820
mientras algunos que todavía están mientras espero alguno me regala

01:40:37.820 --> 01:40:42.180
dos minutos con café y vengo a seguir inmediatamente con café mientras algunos terminan ahí ya
Talend Big Data Integration y Ecosistema de Talend Videos

Search

Quick Links

Use Cases

DaDesktop