1. Talend Open Studio para ESB, 2. Data Quality: Advanced Techniques, 3.Talend Big Data Integration Videos

                WEBVTT

00:00:00.000 --> 00:00:06.360
de Q, un acceso directo, que está en el último, en la esquina superior derecha, le das doble

00:00:06.360 --> 00:00:16.320
clic, por favor, y deberíamos, entonces, subir el talent data quality. La interfaz

00:00:16.320 --> 00:00:21.900
es similar porque se basa en la interfaz de Clikset, por lo tanto, lo que vas a ver

00:00:21.900 --> 00:00:27.560
es diferente, son, digamos, algunas cosas del menú. Voy a decirle que no quiero

00:00:27.560 --> 00:00:31.700
ver más eso, listo, vamos a Skit.

00:00:34.320 --> 00:00:39.160
Bueno, el caso mío ya subió, el caso de Mauricio, hay que darle Skit, Mauricio, para

00:00:39.160 --> 00:00:44.260
que te cargue completamente. Bueno, empiezo a ver que se conectó

00:00:44.260 --> 00:00:48.800
Ana Lilia, también se conectó Julio. Por favor, ejecuten el talent data quality,

00:00:48.940 --> 00:00:56.500
que es superior derecha, el que dice dos de Q, acceso directo. Recuerden que

00:00:56.500 --> 00:01:01.000
todo este software, perdón, este software, todo se va a ser compartido por ustedes,

00:01:01.160 --> 00:01:07.160
las presentaciones, todos los ejemplos, los recursos. Si desea, al final, pues

00:01:07.160 --> 00:01:10.800
sacamos una copia de seguridad de todos los ejercicios que hemos hecho y queda

00:01:10.800 --> 00:01:13.900
también con eso los ejercicios, por si acaso.

00:01:16.740 --> 00:01:21.080
Bueno, listo, podemos iniciar, entonces, para ir mostrándole teóricamente cómo

00:01:21.080 --> 00:01:24.700
está conformado, entonces, esta herramienta.

00:01:25.700 --> 00:01:30.680
Si todos ven mi pantalla, ¿verdad? Todos ven la batalla compartida mía, ¿cierto?

00:01:31.060 --> 00:01:35.200
Perfecto, muchas gracias por el feedback. Listo, entonces, note que

00:01:35.200 --> 00:01:40.440
pues gráficamente es muy parecido al menú, a la interfaz gráfica, lo que

00:01:40.440 --> 00:01:45.600
te da a cambiar, perdón, es el menú. Entonces, aquí en el repositorio es

00:01:45.600 --> 00:01:49.520
donde está el centro como tal de la herramienta.

00:01:49.520 --> 00:01:54.260
En este repositorio vas a encontrar lo siguiente. En primer lugar, cuando vas

00:01:54.260 --> 00:01:59.080
aquí donde dice data profiling, ya te había advertido en qué herramienta lo

00:01:59.080 --> 00:02:04.860
que hace es profiling. Por ende, que esta herramienta, la versión, digamos,

00:02:05.060 --> 00:02:10.200
Open Studio, me permite solamente encontrar anomalías. Si tienes y vas a

00:02:10.200 --> 00:02:13.600
hacer limpieza o curación de la anomalía, tendrías entonces que

00:02:13.600 --> 00:02:17.280
abrir el Talent Data Integration. Y no te preocupes si es encorroso si

00:02:17.420 --> 00:02:21.180
es el Talent Studio como el que tienes allá en la empresa, pues todos los

00:02:21.180 --> 00:02:25.260
componentes del Quality y el Data Integration lo vas a encontrar en la

00:02:25.260 --> 00:02:29.680
misma interfaz. O sea que ahí vas a poder hacer tanto el profiling como la

00:02:29.680 --> 00:02:34.280
curación o limpieza del dato. Listo, cuando expanda aquí el profiling,

00:02:34.500 --> 00:02:39.680
vas a encontrar entonces análisis. Esos son los análisis que vamos a

00:02:39.680 --> 00:02:43.780
hacer para encontrar una posible anomalía. Recuerda que esas

00:02:43.780 --> 00:02:48.320
anomalías para poder definirla y encontrarla, tienes que basarte en un

00:02:48.320 --> 00:02:50.560
estándar de calidad de datos de tu empresa.

00:02:52.140 --> 00:02:55.700
Quizás podías encontrar anomalías de inconsistencia, te entiendo, pero para

00:02:55.700 --> 00:02:58.820
que hagas un proceso más riguroso, partiendo el hecho en que es más para

00:02:58.820 --> 00:03:02.980
el ingeniero de datos, tienes que tener un documento de estándares que

00:03:02.980 --> 00:03:06.420
te lo hace normalmente el gobierno de datos para definir a qué llamamos

00:03:06.420 --> 00:03:11.440
calidad de datos en mi empresa. Segundo a un nombre que me parece

00:03:11.440 --> 00:03:15.520
que no está como que tan correcto, aquí dice librerías. Normalmente

00:03:15.520 --> 00:03:22.660
librerías uno lo, digamos que lo relaciona como con software que me va

00:03:22.660 --> 00:03:25.520
a permitir a mí agregarle funcionalidades como tal a algo, a

00:03:25.520 --> 00:03:29.100
librerías. Pero eso no es eso, expanda librerías por favor.

00:03:31.260 --> 00:03:36.400
Entonces te encuentra con diferentes elementos que vas a configurar.

00:03:36.800 --> 00:03:41.140
Primero, vas a encontrarte con lo que llaman indicadores. Ya te había

00:03:41.140 --> 00:03:45.860
dicho que tú te vas a basar en un estándar de calidad. Los indicadores es

00:03:45.860 --> 00:03:51.000
una medida cuantitativa para definir la calidad del dato, o

00:03:51.000 --> 00:03:55.100
una medida cuantitativa. Entonces yo puedo definir lo siguiente.

00:03:56.040 --> 00:04:04.840
Mira, para que para que los datos de mi empresa haya calidad de

00:04:04.840 --> 00:04:09.500
datos, mínimo el 20% de los datos tienen que asegurar que no haya nulos.

00:04:10.340 --> 00:04:14.440
Entonces tú lo defines como número, o sea una medida netamente cuantitativa.

00:04:14.480 --> 00:04:22.520
Vamos con los patrones. En los patrones lo que haces es que vas a verificar el

00:04:22.520 --> 00:04:28.260
formato de un dato. Si corresponde a un formato, por ejemplo,

00:04:28.800 --> 00:04:36.900
tú tienes por ejemplo el dato de el número de celular, el número de celular de la

00:04:36.900 --> 00:04:42.760
persona. Entonces el número de celular estaría compuesto por primero, más, segundo el número

00:04:42.760 --> 00:04:47.380
del país, tercero, los tres dígitos, abro comillas, del operador y lo demás

00:04:47.380 --> 00:04:52.620
el número tuyo. Entonces tú quieres definir que ese formato como tal se

00:04:52.620 --> 00:04:57.920
establezca y se cumpla. Entonces cuando tú quieres que un formato se cumpla lo

00:04:57.920 --> 00:05:01.580
que debería hacer es un patrón. En el caso de la herramienta te

00:05:01.580 --> 00:05:05.300
permite hacer dos tipos de patrones. Un patrón que viene de expresiones

00:05:05.300 --> 00:05:11.260
regulares y un patrón a nivel de SQL. Entonces vuelvo, repito, la herramienta va,

00:05:11.400 --> 00:05:14.780
es más técnica, por lo tanto va para un ingeniero de datos. Entonces se asume,

00:05:15.400 --> 00:05:19.660
o la herramienta asume, en que tú tienes conocimientos básicos a nivel de SQL y

00:05:19.660 --> 00:05:22.640
conocimientos básicos a nivel de programación en expresiones regulares.

00:05:24.380 --> 00:05:28.720
Con expresiones regulares te puedo una recomendación. Yo antes me

00:05:28.720 --> 00:05:35.280
desgastaba con estas expresiones regulares, definiéndolas y eso me gustaba mucho

00:05:35.280 --> 00:05:40.820
tiempo a nivel de producción. Me costaba a veces hacer una expresión regular que

00:05:40.820 --> 00:05:46.140
fuera eficiente, que sea entendible. Yo creo que hoy ya no estoy en ese plan

00:05:46.140 --> 00:05:50.500
de perderse tiempo. Yo prácticamente lo que estoy usando es SIA para esa

00:05:50.500 --> 00:05:54.680
parte. Es decir, le digo el contexto del caso y digo dame una expresión

00:05:54.680 --> 00:06:00.040
regular que me permita validar este formato. Y entonces eso es lo que estoy

00:06:00.040 --> 00:06:04.560
haciendo, me lo da, lo pruebo y listo. Pues yo creo que eso me

00:06:04.560 --> 00:06:07.680
mejora mucho la productividad porque ya no pierdo tanto tiempo en

00:06:07.680 --> 00:06:10.940
haciendo esas expresiones regulares. Pero bueno, si tú lo sabes y la querías

00:06:10.940 --> 00:06:18.660
aplicar, perfecto, ningún problema. La otra es haciendo un SQL y este SQL

00:06:18.660 --> 00:06:22.280
básicamente para los que ya tienen experiencia básicamente lo que va a

00:06:22.280 --> 00:06:26.960
hacer es una expresión de tipo like. Un like que like recordará que tiene

00:06:26.960 --> 00:06:30.480
varios operadores, varios modificadores que son el porcentaje,

00:06:31.240 --> 00:06:37.180
entonces es eso, es definir eso. Ahora viene la regla.

00:06:37.740 --> 00:06:43.700
Entonces los patrones son para que tú valides un formato y la regla es para

00:06:43.700 --> 00:06:50.460
que tú valides una condición. Entonces en esa condición tú puedes

00:06:50.460 --> 00:06:55.880
decir lo siguiente. Bueno, yo quiero validar en que la edad a partir de

00:06:55.880 --> 00:06:59.060
un cálculo que yo hago a la fecha de nacimiento para un cliente tiene que

00:06:59.060 --> 00:07:04.060
ser mayor a cero o mayor a 18 años por ejemplo. Entonces eso es una

00:07:05.260 --> 00:07:09.080
condición. Partiendo del hecho en que yo sé que la mayoría aquí tienen un

00:07:09.080 --> 00:07:13.980
perfil desarrollador, quizás empiezas a pensar pero yo

00:07:13.980 --> 00:07:19.580
podía validar una condición con un, por ejemplo, con un

00:07:19.580 --> 00:07:26.500
con un patrón y tú lo puedes hacer. Lo que pasa es que por recomendación y

00:07:26.500 --> 00:07:31.400
para que no haya confusión, lo que te dice la herramienta o como recomendación

00:07:31.400 --> 00:07:37.460
es que el patrón lo vayas a usar para definir el formato y las reglas para

00:07:37.460 --> 00:07:43.480
validar una condición, si se cumple o no se cumple. Por ejemplo, tú

00:07:43.480 --> 00:07:48.880
puedes decir, mira, yo quiero validar en que

00:07:48.880 --> 00:07:55.180
en que todos los datos cumplan la condición que sean verdadero, sean

00:07:55.180 --> 00:08:00.140
no puedo hacer con un regex o lo puedo hacer con una regla. Sí, claro, lo que

00:08:00.140 --> 00:08:03.080
quiero que entiendas es cuál es la idea de la herramienta. Al final tú

00:08:03.080 --> 00:08:08.500
te terminas adaptando y lo que viene aquí después viene es un metadata

00:08:09.700 --> 00:08:13.500
y este metadata corresponde a los metadatos que ya habíamos definido,

00:08:13.680 --> 00:08:18.060
metadatos hipotécticos, que habíamos definido ya la misma herramienta el

00:08:18.060 --> 00:08:22.320
talent data integration. Solamente hay una pequeña diferencia, que las

00:08:22.320 --> 00:08:27.400
metadatas acá son la cantidad de fuentes de datos o tipos de fuentes de

00:08:27.400 --> 00:08:32.020
datos ya son pocas comparadas con el talent data integration. Acá solamente va a

00:08:32.020 --> 00:08:36.300
tener dos fuentes, una que es bases de datos y una que es archivo CSV.

00:08:38.060 --> 00:08:42.940
¿Por qué nada más esas dos fuentes? Bueno, aclaro que esto viene más de

00:08:44.160 --> 00:08:48.060
lo que dice la herramienta y estadísticamente creo que tiene

00:08:48.060 --> 00:08:52.100
razón. En primer lugar, pues normalmente tú analizas tus bases de

00:08:52.100 --> 00:08:56.020
datos, eso no hay un puente de discusión. La pregunta que pronto te

00:08:56.020 --> 00:08:59.940
sucedería a ti es ¿Por qué la herramienta no me permite JSON o me

00:08:59.940 --> 00:09:05.340
permite XML? Que son formatos bastante, digamos, bastante utilizados.

00:09:05.740 --> 00:09:12.360
Bueno, aquí vamos a lo siguiente. Hay una característica del CSV que lo

00:09:12.360 --> 00:09:17.760
hace, digamos, mejor candidato cuando tú quieres compartir grandes

00:09:17.760 --> 00:09:23.460
cantidades de datos. Por ejemplo, quieres compartir un backup de tu base de datos.

00:09:24.840 --> 00:09:30.100
Entonces, el mejor formato para hacer ese backup es CSV. ¿Por qué no haces de

00:09:30.100 --> 00:09:34.040
pronto o a nivel de plano? No hablamos de backup propios de cada motor.

00:09:35.200 --> 00:09:39.500
Digamos como un formato plan. Digamos que tú quieres entregarle los

00:09:39.500 --> 00:09:43.260
datos de los clientes a un software de recursos humanos para que haga algo.

00:09:44.020 --> 00:09:47.280
Entonces, el mejor formato, digamos, no le entregas un backup de la base de datos

00:09:47.280 --> 00:09:51.880
porque de pronto quizás no tenga el motor allá o se lo va a entregar un cliente diferente.

00:09:52.840 --> 00:09:56.480
Estamos hablando de formatos planos. Cuando digo plano es que tú puedas

00:09:56.480 --> 00:10:02.200
ver el contenido del dato como tal. Pero tú dices, bueno, ¿Pero por qué no lo pongo?

00:10:02.360 --> 00:10:06.440
Porque es CSV, porque es el mejor formato para esa para esa

00:10:06.440 --> 00:10:10.940
compartición. ¿Por qué? Primero porque es un formato bastante antiguo y

00:10:10.940 --> 00:10:16.120
muchos raro una aplicación hoy en día que no te lea un CSV o raro un

00:10:16.120 --> 00:10:18.440
software que no tenga una librería para leerte un CSV.

00:10:20.040 --> 00:10:24.960
Aparte de eso, el software tiene una característica que es la comprensión del

00:10:24.960 --> 00:10:30.160
dato. Lo que pasa es que hacer el backup sobre un CSV sale más pequeño que

00:10:30.160 --> 00:10:35.320
tirarlo sobre un JSON o un XML, porque recordarás que el JSON, por cada

00:10:35.320 --> 00:10:39.420
fila que yo tenga, me va a repetir los nombres de columnas, mientras que el

00:10:39.420 --> 00:10:43.360
CSV nada más tiene la columna en la parte de arriba y lo demás son puro

00:10:43.400 --> 00:10:48.340
datos a nivel de columnas o de filas, perdón, a nivel de filas. Entonces a nivel

00:10:48.340 --> 00:10:51.940
te sale mucho más recomendable y es el formato que se establece cuando tú vas a

00:10:51.940 --> 00:10:56.180
compartir datos de un punto A o punto B sin especificar tecnologías. Ya te

00:10:56.180 --> 00:11:01.180
digo ya porque el JSON y además que el JSON, el JSON,

00:11:01.440 --> 00:11:05.740
con JSON vas a ver algo que es una cuestión más filosófica y

00:11:05.740 --> 00:11:10.240
conceptual, que algunos dicen que el JSON no es un dato no estructurado.

00:11:10.240 --> 00:11:16.900
Hay más de conceptos, pero la ventaja que tienes con un CSV es que la estructura del

00:11:16.900 --> 00:11:20.620
CSV se conserva en todas las filas. O sea, tú sabes que si tienes cuatro

00:11:20.620 --> 00:11:23.700
columnas, sabes que todas las filas van a tener cuatro columnas y

00:11:23.700 --> 00:11:28.000
depende si están vacías o no. Pero en un JSON, tú no puedes garantizar que

00:11:28.000 --> 00:11:31.740
todas las filas del JSON tienen igual nombre de columna e igual número

00:11:31.740 --> 00:11:39.880
de columna. ¿Por qué? Porque tú puedes definir en cada fila lo que tú

00:11:39.880 --> 00:11:40.520
quieres, y eso es lo que es la estructura del JSON y la estructura del

00:11:41.380 --> 00:11:42.040
JSON.

00:11:42.040 --> 00:11:47.820
Listo, esto sería entonces con respecto a lo que es la herramienta. Ahora, la

00:11:47.820 --> 00:11:53.120
confesión de la herramienta, pues es muy poca. Lo máximo que puedes hacer

00:11:53.120 --> 00:11:57.200
aquí que sería interesante, lo demás es una cuestión netamente gráfica,

00:11:57.460 --> 00:12:01.360
pero la herramienta te permite, por ejemplo,

00:12:02.920 --> 00:12:09.220
básicamente, que puede ser interesante, que no lo veo mucho. Algo que se llama

00:12:11.100 --> 00:12:16.160
el analysis tuning o puesta a punto análisis. Esto lo que hace es que tú

00:12:16.160 --> 00:12:21.520
puedas configurar un máximo de memoria en el cual si la aplicación, cuando tú

00:12:21.520 --> 00:12:25.700
la ejecutas, sobrepasa el máximo de memoria, entonces en ese caso se

00:12:25.700 --> 00:12:30.780
detiene la aplicación. ¿Eso para qué sirve? Normalmente eso sirve cuando tú

00:12:30.780 --> 00:12:34.660
utilizas el talent data quality como marketplace, por ejemplo, en AWS, porque

00:12:34.660 --> 00:12:39.560
tú puedes comprar en AWS la suscripción de esta herramienta y sabrías que a

00:12:39.560 --> 00:12:42.880
nivel de cloud lo que más te cuesta es procesamiento y memoria. Entonces,

00:12:42.880 --> 00:12:47.120
quizás tú sube mucho memoria y te sube mucho la facturación y mejor

00:12:47.120 --> 00:12:51.820
detienes el proceso. Bueno, eso es lo que veo para qué puede servir. Lo

00:12:51.820 --> 00:12:54.940
otro ya son confesiones a nivel visuales que la vamos a ver a lo

00:12:54.940 --> 00:12:59.900
largo del curso. Entonces, no le veo como en el talent que podía ver la

00:12:59.900 --> 00:13:03.180
herramienta de talent. ¿Puedo cambiar el idioma? Ah, bueno, aquí puedo cambiar el idioma, perdón.

00:13:03.400 --> 00:13:07.900
Ya es una cuestión penétamente de algo muy común de herramientas de talent,

00:13:08.780 --> 00:13:11.300
pero que no pasa con las herramientas cloud. El cloud si no puedo

00:13:11.300 --> 00:13:16.100
cambiar nada más de tres idiomas.

00:13:16.640 --> 00:13:20.560
Listo. Entonces, vamos a lo siguiente. Entonces vamos a hacer nuestro primer

00:13:20.560 --> 00:13:23.820
análisis. Esto creo que todos estamos conectados.

00:13:24.120 --> 00:13:27.540
No sé si hasta el momento hay una pregunta o podemos iniciar. Todo esto fue

00:13:27.980 --> 00:13:31.140
teórico. Vamos a iniciar ahora sí la parte práctica con respecto a la

00:13:31.140 --> 00:13:34.720
herramienta. No sé si hay alguna pregunta o si quieres esperamos a

00:13:34.720 --> 00:13:37.380
alguno que todavía se conecte. No sé.

00:13:41.000 --> 00:13:44.660
Bueno, vamos. Bueno, vamos a iniciar. Muchísimas gracias por el firme.

00:13:45.660 --> 00:13:49.320
Listo, vamos a hacer lo siguiente. Entonces, lo primero es vamos a

00:13:49.320 --> 00:13:53.820
clasificar los análisis. Entonces, dentro de esta carpeta análisis vamos a

00:13:53.820 --> 00:13:59.660
crear un pequeño folder y en este folder pues puede identificar ya sea

00:13:59.660 --> 00:14:04.340
tu empresa o el proyecto en el que estés. En este caso, pues voy a colocar

00:14:04.340 --> 00:14:07.540
el nombre de su empresa. Aquí normalmente pues colocarás el nombre

00:14:07.540 --> 00:14:11.700
del proyecto de los análisis que van a hacer. En este caso, bueno, le

00:14:11.700 --> 00:14:14.460
coloqué Axel.

00:14:16.560 --> 00:14:22.300
Listo. Acto seguido, por favor. Vamos a hacer lo siguiente. Vamos a

00:14:22.300 --> 00:14:28.200
tener una carpeta por cada tipo de análisis que vamos a hacer. Entonces, voy

00:14:28.200 --> 00:14:32.180
a empezar con un análisis que se llama estructural. Por lo tanto, voy a crear

00:14:32.180 --> 00:14:37.940
una carpeta aquí y aquí voy a definir la palabra estructurales diciendo de

00:14:37.940 --> 00:14:40.380
que aquí voy a guardar todos los análisis estructurales que tengo de

00:14:40.380 --> 00:14:43.420
Axel. Entonces, creo que es una subcarpeta en Axel y me queda de esta forma.

00:14:45.200 --> 00:14:46.000
Ok, sí.

00:14:47.800 --> 00:14:53.540
No hay problema. Va a este análisis aquí y dale clic derecho,

00:14:53.660 --> 00:14:58.540
crea folder, por favor. En este caso usamos AXA o ahí técnicamente debías

00:14:58.540 --> 00:15:01.060
colocar el nombre del proyecto en que estés.

00:15:01.760 --> 00:15:05.420
Y dentro de AXA vamos a colocar todos los tipos de análisis que vamos a

00:15:05.420 --> 00:15:08.500
hacer para AXA o para el proyecto que tú quieras. En este caso vamos a

00:15:08.500 --> 00:15:12.680
empezar con uno que se llama estructurales. Entonces, por favor, te

00:15:12.880 --> 00:15:16.620
colocaría la carpeta de esta forma, AXA y una subcarpeta llamada de

00:15:16.620 --> 00:15:20.940
estructurales. Sí, exactamente. Normalmente, pues ahí colocarías en

00:15:20.940 --> 00:15:23.740
vez de AXA los nombres del proyecto en que estés para hacer la calidad de

00:15:23.740 --> 00:15:28.820
datos como ingeniero de datos. Listo. Entonces, ¿cómo hacemos un análisis

00:15:28.820 --> 00:15:32.580
dentro de la herramienta? Entonces, para esto pues te ubicas en la

00:15:32.580 --> 00:15:36.940
carpeta donde lo vas a colocar. En este caso estructural y vamos a dar

00:15:36.940 --> 00:15:41.300
clic derecho y vamos a darle nuevo análisis.

00:15:41.800 --> 00:15:46.080
Note que la herramienta los clasifica por tipo los análisis y en realidad

00:15:46.080 --> 00:15:51.800
son bastante extensos. Vamos a hacer por lo menos uno de cada uno y para

00:15:51.800 --> 00:15:55.820
que usted tenga por lo menos la idea qué puedo hacer con cada uno de esos

00:15:55.820 --> 00:16:00.300
tipos de análisis. En primer lugar, vamos a crear entonces nos vamos a la

00:16:00.300 --> 00:16:05.020
carpeta que se llama estructurales y la expandimos. Y aquí vamos a hacer

00:16:05.020 --> 00:16:08.360
lo siguiente. Note aquí que aquí hay tres tipos de análisis pero

00:16:08.360 --> 00:16:13.420
prácticamente el mismo pero diferentes en diferentes contextos. Dice que ahí

00:16:13.420 --> 00:16:20.900
está el que dice connection, está el que dice catalog y el que dice esquema.

00:16:21.360 --> 00:16:25.500
Entonces, primero analicemos conceptualmente esa palabra catálogo y

00:16:25.500 --> 00:16:30.860
esa palabra esquema. En primer lugar, ¿qué es un esquema? Yo había dicho ayer,

00:16:31.200 --> 00:16:33.720
bueno, esa analogía que hice no es tan buena que fue como si fuese un

00:16:33.720 --> 00:16:38.600
baseado pero en realidad no lo es. En realidad, ¿qué es un esquema?

00:16:38.900 --> 00:16:44.800
Un esquema te permite organizar lógicamente un conjunto de objetos,

00:16:45.200 --> 00:16:49.040
por ejemplo, tablas. Entonces, yo te ya he colocado el del caso ayer. Yo tengo una baseado

00:16:49.040 --> 00:16:55.060
en Pogge que se llama metadatos de redes sociales y dentro tengo un

00:16:55.060 --> 00:16:58.960
esquema que se llama Facebook, otro Instagram. Eso al final lo que hace es

00:16:58.960 --> 00:17:02.680
como si fuera que me crea una subcarpeta y en esa subcarpeta me

00:17:02.680 --> 00:17:05.820
permite organizar realmente todos los objetos que tengo de Facebook. Eso al final ¿para qué

00:17:05.820 --> 00:17:10.580
sirve? Pues me permite organizar mejor, digamos, mis objetos y, segundo, me

00:17:10.580 --> 00:17:14.680
permite mucho para el rendimiento porque si el objeto está dentro de

00:17:14.680 --> 00:17:19.460
Facebook, pues lo buscaría como si, haga la analogía, como si nada más lo

00:17:19.460 --> 00:17:24.000
buscara dentro de la carpeta de Facebook. Hay otras en que yo no he

00:17:24.000 --> 00:17:29.080
visto, yo creo que ya estoy un poco más viejo, quien no define el concepto

00:17:29.780 --> 00:17:34.640
es una especie de esquema, pero ese catálogo que está ahí no lo

00:17:34.640 --> 00:17:37.360
confunda con el catálogo de datos de una base de datos porque recuerden que

00:17:38.040 --> 00:17:41.980
una base de datos tiene metatablas que al final termina siendo su catálogo

00:17:41.980 --> 00:17:45.400
de datos. Es decir, en el catálogo de datos de una base de datos te guardan los

00:17:45.400 --> 00:17:48.980
datos de las bases de datos, de las tablas y de estadísticas que

00:17:48.980 --> 00:17:52.460
tengan esas tablas, cuántas columnas tiene, cuántas filas tiene, nombre de

00:17:52.460 --> 00:17:57.500
columna. No es ese catálogo. Este catálogo es muy parecido al catálogo

00:17:57.500 --> 00:18:01.840
de como si fuese una especie de esquema. Por ejemplo, esquema MySQL no maneja

00:18:01.840 --> 00:18:07.220
esquema, pero Oracle y Poggres maneja esquema, siendo que cada uno lo

00:18:07.220 --> 00:18:11.460
maneja de forma diferente. Por eso ser DBA, normalmente es DBA en un

00:18:11.460 --> 00:18:15.140
motor porque hay unas diferencias que son significativas en muchos

00:18:15.140 --> 00:18:20.540
motores. Mientras que en casos de Oracle, un esquema es prácticamente un

00:18:20.540 --> 00:18:24.160
usuario, entonces yo tengo un usuario de una base de datos y el usuario crea unos

00:18:24.160 --> 00:18:29.260
objetos. Ese es un esquema. Mientras que para Poggres es parecido, siendo que el

00:18:29.260 --> 00:18:33.540
esquema no pertenece a un usuario, sino el esquema es de una base de datos y

00:18:33.540 --> 00:18:36.360
esa base de datos, ese esquema se lo puede dar permiso a diferentes

00:18:36.360 --> 00:18:39.600
usuarios. Entonces, la forma en que trata el esquema es diferente.

00:18:40.860 --> 00:18:46.200
Pero MySQL no maneja eso. Entonces, MySQL maneja, para él, catálogo es una

00:18:46.200 --> 00:18:49.340
base de datos, pero te vas a dar cuenta en un software que para

00:18:49.340 --> 00:18:53.320
MySQL esquema, para él, es una base de datos. Es una cuestión

00:18:53.320 --> 00:18:57.160
honestamente de conceptual, de nombres, y espero que no se me confunda con eso. Al

00:18:57.160 --> 00:19:00.620
final, vea el concepto. Yo no he visto todavía los catálogos de base de datos que

00:19:00.620 --> 00:19:04.780
tenga esa parte. Al final, sería como una especie de esquema. Vea que esquema es cuando

00:19:04.780 --> 00:19:08.340
quiero analizar, digamos, que dentro de una base de datos, por ejemplo de

00:19:08.340 --> 00:19:11.240
Poggres, un esquema, el esquema public, el esquema Facebook, el esquema que

00:19:11.240 --> 00:19:16.160
tú quieras. Y conexión significa en que voy a analizar toda la base de

00:19:16.160 --> 00:19:21.200
datos, independiente si tiene esquema o no tiene esquema. Entonces,

00:19:21.200 --> 00:19:24.260
partiendo de este hecho, vamos a hacer lo siguiente. Vamos a hacer la conexión

00:19:24.260 --> 00:19:27.880
aquí. Vamos a escoger este conectio.

00:19:31.220 --> 00:19:35.780
Y colocamos, entonces, lo siguiente. Yo voy a usar, entonces, un snake case en

00:19:35.780 --> 00:19:40.380
minúscula todo. Si usted quiere, deje espacio en blanco al nombre de análisis.

00:19:40.800 --> 00:19:45.820
Lo voy a llamar de esta forma. Análisis, under score, estructural,

00:19:47.820 --> 00:19:52.500
sinuq. Sinuq es la base de datos que estábamos usando el día de ayer.

00:19:53.740 --> 00:20:00.700
Connection, el de connection. Sí, sí, sí, muchísimas gracias. Propósito, analizar la

00:20:02.660 --> 00:20:08.560
estructura de la base de datos de sinuq.

00:20:08.880 --> 00:20:12.240
Se da lo mismo, el motor aplica, fíjate, aplicas lo mismo, lo de pronto es que

00:20:12.240 --> 00:20:16.180
te puede dar cosas diferentes. Aquí, si se da cuenta, el menú sigue muy

00:20:16.180 --> 00:20:21.180
parecido a como hacía el job. Tengo el autor, tengo el estatus, entonces el

00:20:21.180 --> 00:20:27.000
estatus es los típicos, development, testing y producción. Listo, ahí lo

00:20:27.000 --> 00:20:31.780
definís, ahí análisis. Ya eso va más con el estándar que haya definido

00:20:31.780 --> 00:20:36.340
internamente en tu empresa. Cómo pasa un análisis de developer a CUA y cómo

00:20:36.340 --> 00:20:40.620
pasa de CUA a producción. Ya eso es netamente, pues, suyo allá en su

00:20:40.620 --> 00:20:45.540
empresa. Listo, lo demás es el path, el tipo, bueno, de dónde va a quedar. Aquí

00:20:45.540 --> 00:20:49.780
le damos test, no hay más nada que hacer aquí. Y aquí, ojo, lo siguiente.

00:20:50.180 --> 00:20:54.020
Este tipo de datos estructural solamente se puede hacer en los

00:20:54.020 --> 00:20:57.980
metadatos de conexiones a base de datos. No lo puedo hacer a nivel de

00:20:57.980 --> 00:21:04.280
archivos CSV, principalmente porque el archivo CSV no maneja metadatos a

00:21:04.280 --> 00:21:09.060
nivel de lo que es tipo de datos, ya es primaria, ya es que puede tener una

00:21:09.060 --> 00:21:13.560
tabla, etcétera. Por lo tanto, solamente esto lo puedes hacer sobre bases de

00:21:13.560 --> 00:21:18.200
datos, nada más. Spade, por favor, perdón, se me

00:21:18.200 --> 00:21:23.140
escapaba aquí. Que pena, aquí, vamos a darle aquí un cáncer, por favor, démosle

00:21:23.140 --> 00:21:27.660
aquí un cáncer. Aunque lo podía hacer después, pero bueno, démosle un cáncer.

00:21:27.680 --> 00:21:29.660
Vamos a hacer la conexión a la base de datos chino.

00:21:31.000 --> 00:21:35.300
Esta conexión, hagámosla toda de forma particular, porque yo creo que ya

00:21:35.300 --> 00:21:39.820
de ayer debiste aprenderlo. Si no, te voy guiando entonces. Si ya sabes cómo

00:21:39.820 --> 00:21:44.840
hacerlo, pues hazlo independiente. Creas una nueva conexión aquí.

00:21:45.920 --> 00:21:50.860
Listo, está un poco lento. Listo. Ya viene el nombre de la conexión. Te había

00:21:50.860 --> 00:21:55.000
dicho ayer, entonces, que la vamos a llamar base de datos y el motor en

00:21:55.000 --> 00:22:00.680
que está Chinut MySQL. Te aparece lo mismo, propósito, descripción.

00:22:00.680 --> 00:22:10.980
Entonces, propósito, entonces, conectar a la base de datos transaccional

00:22:13.380 --> 00:22:15.540
de la empresa Chinut.

00:22:20.160 --> 00:22:24.080
Listo, aquí, pues ya las versiones esta aplican lo mismo que te planteé, el

00:22:24.080 --> 00:22:27.540
minor, el mayor, eso fue lo que, ya eso también, directamente, de tu

00:22:27.540 --> 00:22:34.580
empresa, le das aquí next. Aplica lo mismo, entonces, buscas el motor, que

00:22:34.580 --> 00:22:47.100
sería MySQL. El login sería, dígame. Sí, sí, sí, qué pena, salte de análisis

00:22:47.100 --> 00:22:52.980
para tirar la conexión, sí, qué pena. Ahí lo dije muy rápido, entonces, sí.

00:22:52.980 --> 00:22:58.260
Acá en metadata, ella hace exactamente lo mismo que hiciste allá en

00:22:58.260 --> 00:23:06.720
training integration. El login, entonces, sería root, conservamos. El password sería

00:23:06.720 --> 00:23:16.260
también root y el server sería 127.0.0.1. El puerto sigue siendo FIU y aquí

00:23:16.260 --> 00:23:19.420
le colocamos, entonces, la base de datos de Chinut.

00:23:25.520 --> 00:23:33.320
Me pide lo mismo, punto uno, punto uno, 127.0.0.1, que es lo que llaman

00:23:33.320 --> 00:23:39.100
dirección de look back o dirección local. Y no se te olvide, pues, colocar la

00:23:39.100 --> 00:23:44.800
base de datos Chinut, el nombre, y aquí, no, no testee, voy a testear

00:23:44.800 --> 00:23:47.960
nuevamente para ver, la testía.

00:23:47.960 --> 00:23:57.820
A darle eso. Esta herramienta, al final, tiene un problema aquí que, a veces,

00:24:01.840 --> 00:24:04.540
bueno, no me deja nuevamente.

00:24:07.280 --> 00:24:10.140
Bueno, pero si te conectó bien esta herramienta, no hay que hacer recuperación

00:24:10.140 --> 00:24:12.820
de extraer esquema porque automáticamente lo da.

00:24:14.400 --> 00:24:18.260
Le das test connection y mira para ver, confirma para ver que te dio crear,

00:24:18.640 --> 00:24:22.720
entonces, en el árbol el nombre de base de datos y te tuvo que hacer un

00:24:22.720 --> 00:24:27.000
import automáticamente de los objetos que están en esa base de datos. Debe

00:24:27.000 --> 00:24:30.020
aparecerte doce tablas.

00:24:36.340 --> 00:24:40.620
No, nada más, se le hace el import automático. No es como la otra

00:24:40.620 --> 00:24:43.520
herramienta. Esta te importa automáticamente las tablas. ¿Cómo te

00:24:43.520 --> 00:24:48.320
quedó? ¿Quién me habló por ahí? Alid. Si te debe aparecer las doce tablas,

00:24:48.500 --> 00:24:53.820
cierto. Ok, perfecto. Este, esta herramienta, uno, yo una vez hablé

00:24:53.820 --> 00:24:59.120
con un con un asesor y yo le hacía la pregunta, yo tengo una duda a nivel

00:24:59.120 --> 00:25:02.680
de software. Como yo desarrollo software, entonces uno lo uno lo ve el punto

00:25:02.680 --> 00:25:06.720
de software acá. Tú, ¿Por qué en la, por qué en el talent data

00:25:06.720 --> 00:25:11.100
integration, ustedes en el talent integration no importan automáticamente

00:25:11.100 --> 00:25:14.040
el esquema cuando yo me, cuando una conexión de tablas. Recuerde que en

00:25:14.040 --> 00:25:18.960
talent data integration yo doy recuperar esquema. A respuesta me dice él, no,

00:25:19.060 --> 00:25:24.280
lo que pasa es que muchas veces tú no vas a usar todas las tablas que

00:25:24.280 --> 00:25:29.720
están definidas en una base de datos. No, yo te acepto esa parte, pero no

00:25:29.720 --> 00:25:32.720
entiendo por qué entonces en el talent data quality te traes todas,

00:25:32.720 --> 00:25:38.260
porque no te aplica, o es lo uno o es lo otro. Al final, me di una respuesta,

00:25:38.560 --> 00:25:41.700
dice, no, lo que pasa es que cada herramienta tiene comunidades

00:25:41.700 --> 00:25:45.560
diferentes, entonces lo vende de punto de vista diferente. Ah, bueno, ahora sí te entendí.

00:25:48.760 --> 00:25:52.680
Listo. Entonces, ahora sí, por favor, ya después que hizo esta conexión,

00:25:53.540 --> 00:26:00.320
vayamos nuevamente a hacer el análisis, nuevo análisis. Aquí, listo. Vamos a hacer

00:26:00.320 --> 00:26:08.480
entonces análisis estructural. Ah, perdón. Aquí debo escoger, perdón. Es el tipo de

00:26:08.480 --> 00:26:15.880
análisis que sería con Nectium. Next. Y hago la configuración. El name que damos en

00:26:15.880 --> 00:26:19.980
que era análisis, underscore, si tú quieres dejar espacio en blanco,

00:26:21.460 --> 00:26:30.580
estructural, underscore, chinú. Y el propósito es analizar la estructura,

00:26:33.900 --> 00:26:43.420
estructura de la base de datos de chinú. Le das el nombre, por favor, ahí de propósito.

00:26:43.500 --> 00:26:47.940
Bueno, ya si tú quieres describir más, pues sería más recomendable que describieras eso.

00:26:49.980 --> 00:26:57.400
Le damos aquí next. Y ahora en los metadatas te va a aparecer entonces la conexión hacia chinú,

00:26:57.580 --> 00:27:05.600
¿cierto? Esa es la que vas a coger. Le das next. Pregunta si desea filtrar algo, ya sea una

00:27:05.600 --> 00:27:10.720
tabla o una vista que tú desees. De todos modos, si no te acuerdas con vista, hay un

00:27:10.720 --> 00:27:14.360
ejercicio que sí o sí hay que hacer una vista aquí. Ya te voy a decir por qué después.

00:27:14.880 --> 00:27:17.980
Pero bueno, en este caso no vamos a hacer ningún tipo de filtro, entonces le vamos a

00:27:17.980 --> 00:27:27.920
dar finish aquí y te debería aparecer entonces el análisis debajo de la carpeta. Cuando te

00:27:27.920 --> 00:27:34.380
crea el análisis, si te das cuenta, te configura, te hace una ventana del lado derecho para que

00:27:35.020 --> 00:27:42.140
definas y otremíes de configurar como tal el análisis. Entonces, primero expande la parte

00:27:42.140 --> 00:27:49.520
de metadata que viene siendo pues la parte donde definimos el nombre, la descripción. Aquí puedo

00:27:49.520 --> 00:27:56.060
cambiar, si quiero nuevamente, pues ya sea el nombre o ya sea o le agrego o le quito propósito

00:27:56.060 --> 00:28:01.020
de descripción, ya lo que tú desees. Vamos siguiente con los parámetros de análisis.

00:28:04.700 --> 00:28:11.680
Listo. Como esto va a ser una conexión a la base de datos, esto lo que hace es que define

00:28:11.680 --> 00:28:16.860
el número de conexiones hacia esa base de datos para hacerlo más eficiente. Me

00:28:16.860 --> 00:28:22.900
explico de esta forma. Entonces, ¿cómo sería? Sería de esta manera. Permítame aquí,

00:28:23.480 --> 00:28:32.420
hago el gráfico. Tú tienes la base de datos que se llama Chinook. Entonces,

00:28:33.660 --> 00:28:38.180
ese número de conexiones lo que va a hacer entonces es que acá tienes el talent data

00:28:38.180 --> 00:28:46.180
el TDQ. Vamos a colocarlo un poco más grande. Y entonces te dice cuántas conexiones deseas

00:28:46.180 --> 00:28:52.040
hacia esta base de datos. El número de conexiones lo que va a hacer es que va a definir N hilos,

00:28:52.100 --> 00:28:56.900
dependiendo de las conexiones que tenga. O sea, 5 serían 5 hilos de conexión. Y los

00:28:56.900 --> 00:29:02.440
5 de conexión lo que harían es que cuando tienes muchos datos, entonces cada hilo jala

00:29:02.440 --> 00:29:06.160
un dato diferente o una colección de datos diferente de tal forma de que sea más rápido

00:29:06.160 --> 00:29:13.140
cargar los datos. Para este tipo de análisis carece de sentido hasta la cantidad de 5,

00:29:13.420 --> 00:29:17.100
porque te vas a dar cuenta en que el análisis no está a nivel de la data,

00:29:17.820 --> 00:29:22.600
sino a nivel de la estructura de la base de datos. Pero es para que sepas para qué es esa

00:29:22.600 --> 00:29:27.640
parte de las conexiones. Entre mayores conexiones, abro comillas doble aquí,

00:29:29.440 --> 00:29:34.660
hay una probabilidad de que mejore el tiempo de respuesta. Pero no necesariamente cuando

00:29:34.660 --> 00:29:43.860
yo incremento, posiblemente puedes incrementar el tiempo de respuesta. Porque eso depende de

00:29:43.860 --> 00:29:49.180
muchos factores. Entre los factores es la parte física de tu equipo, porque si vas a crear 5 hilos

00:29:49.180 --> 00:29:54.080
indica que tendrías que tener 5 cores para por lo menos ejecutar concurrentemente. Entonces

00:29:54.080 --> 00:29:59.020
cuando yo incremento el número de cores, el número de hilos no significa que vaya a

00:29:59.520 --> 00:30:05.580
incrementar el tiempo de respuesta. O sea, hacerlo menos lento. O sea, hacerlo más rápido,

00:30:05.660 --> 00:30:12.460
poner otra palabra. Es para eso exactamente. Este análisis pues ya no necesita más nada,

00:30:12.800 --> 00:30:15.020
este hay algunos contextos que pueda mandar de confesión de los datos,

00:30:15.080 --> 00:30:20.560
nunca he trabajado con esta parte, siendo sincero. Pero aquí no hay que configurar más

00:30:20.560 --> 00:30:24.580
nada comparado con otro análisis. Simplemente lo que vamos a hacer es vamos a ejecutar el

00:30:24.580 --> 00:30:29.620
análisis. Donde lo hace, entonces vayas aquí donde está el play y le das a ejecutar.

00:30:34.360 --> 00:30:39.960
Note por favor que cuando lo ejecutó, pasó, en la parte de abajo tiene dos pestañas. Una

00:30:39.960 --> 00:30:44.660
pestaña de resultados y una pestaña de configuración de la análisis. Y puede navegar

00:30:44.660 --> 00:30:52.160
entre cada una de ellas para hacer algún cambio. Acá bajito lo pueden ver. Una está la de

00:30:52.160 --> 00:31:01.620
configuración y la otra es la de resultado. Note que como su nombre lo dice, lo que vamos a

00:31:01.620 --> 00:31:08.880
analizar es netamente la estructura de la base de datos. Y vea entonces que te está mostrando

00:31:08.880 --> 00:31:14.160
aquí. Te muestra entonces en una tabla, ve que te lo muestra como la palabra catálogo. Para

00:31:14.160 --> 00:31:19.360
el MySQL el catálogo es una base de datos. Y vea lo que te aparece ahí. En la primera

00:31:19.360 --> 00:31:26.040
parte te aparece el número o la cantidad de registro que tiene la base de datos. Como tenemos

00:31:26.040 --> 00:31:33.840
la misma imagen, debería aparecer el mismo número. 15.607. Te aparece el número de tablas,

00:31:35.000 --> 00:31:40.500
el número de proporción de filas por tabla, el número de vistas, en este caso cero,

00:31:40.980 --> 00:31:45.900
el número de proporción de filas con vista y te aparece el número de índices en total

00:31:45.900 --> 00:31:52.880
que tiene la base de datos. Entonces, la pregunta que uno empieza a formularse es

00:31:52.880 --> 00:31:56.980
¿qué puedo hacer con esta información que me presenta este tipo de análisis? Bueno,

00:31:57.120 --> 00:32:01.080
este tipo de información, aclaro nuevamente que esto va más para un ingeniero de datos,

00:32:02.200 --> 00:32:08.280
pero esto es información que le puede servir también y transmítesela al DBA de tu base

00:32:08.280 --> 00:32:13.200
de datos. ¿Qué pasa con el número de filas? Con el número de filas tú puedes hacer un

00:32:13.200 --> 00:32:18.160
análisis interesante que es un análisis de frecuencia y analizar cómo, digamos,

00:32:18.460 --> 00:32:23.740
cómo incrementa o quizás decrementa el número de filas en cierto periodo de tiempo.

00:32:24.960 --> 00:32:30.100
Cuando tú haces eso significa que bueno, en el mes pasado tenía tantos registros y en este mes

00:32:30.100 --> 00:32:35.320
tengo tantos registros. Analizas el cambio y puedes determinar el nivel de crecimiento que

00:32:35.320 --> 00:32:41.580
va a tener tu base de datos en los próximos meses o en los próximos años. Eso te va a

00:32:41.580 --> 00:32:47.180
permitir a ti tomar varias ediciones. Primero, determinar si el espacio que tengo a nivel de

00:32:47.180 --> 00:32:53.960
disco me va a servir para el escalamiento de los datos. Es decir, para ver si entonces me toca

00:32:53.960 --> 00:33:00.320
pensar en agregar un nuevo disco o quizás pasar esta base de datos a una máquina que

00:33:00.320 --> 00:33:05.700
tenga un disco más grande, hacer cualquier labor de migración y me va a permitir entonces

00:33:05.700 --> 00:33:12.460
analizar y definir para ver ese escalamiento como tal. Ahora, ese escalamiento aparte de

00:33:12.460 --> 00:33:18.940
definirte a futuro cómo va a crecer tu base de datos y determinar entonces cómo te va a afectar

00:33:18.940 --> 00:33:24.140
ese escalamiento porque hay que tener algo que cuando tu base de datos crece en tamaño vas a

00:33:24.140 --> 00:33:28.360
tener un problema de tiempo de respuesta. Porque es sencillo, no es lo mismo buscar

00:33:28.360 --> 00:33:34.420
un registro en un millón que buscarlo en 15 millones de registros. No es lo mismo. Entonces,

00:33:34.420 --> 00:33:39.680
cuando tú incrementas en tamaño la cantidad de registro, entonces tú tienes que empezar en

00:33:39.680 --> 00:33:44.920
políticas. ¿Qué vas a hacer para mejorar los tiempos de respuesta? Políticas que van en

00:33:44.920 --> 00:33:50.660
definir, por ejemplo, si voy a definir particiones, si voy a incrementar el número de índices. Si,

00:33:50.720 --> 00:33:55.540
por el contrario, de pronto tú dices, mira, hay algunos que tienen la siguiente política.

00:33:55.840 --> 00:34:02.660
Te pongo el caso de una empresa de Colombia que se llama Olímpica. Esa Olímpica es un

00:34:02.820 --> 00:34:06.460
supermercado, una caña supermercado a nivel de Colombia. Tú lo vas a encontrar en cualquier

00:34:06.460 --> 00:34:11.640
parte de Colombia. De pronto tú tengas la posibilidad de ir allá en México. Entonces,

00:34:13.340 --> 00:34:21.460
esos señores están produciendo diariamente alrededor de 5 millones de registros. Diariamente,

00:34:22.320 --> 00:34:26.780
eso es una cifra que tú en el tiempo, tú vas sumando 5 millones, 5 millones, 5 millones,

00:34:26.840 --> 00:34:31.840
y eso te cuesta en el tiempo. Entonces, ¿qué hacen los señores? Mira, los señores

00:34:31.840 --> 00:34:37.340
se los siguen deteniendo de datos. Una base de datos que es la neta nacional donde tienen,

00:34:37.560 --> 00:34:41.900
por ejemplo, solamente del último año o de los últimos meses, significa que esa base de datos

00:34:41.900 --> 00:34:47.500
no está grande. Y tienen una base de datos donde tienen el histórico. ¿Por qué no tienen esa

00:34:47.500 --> 00:34:53.200
forma? Porque normalmente a nivel de ventas, de la forma del negocio en que está, en la

00:34:53.200 --> 00:34:57.640
forma del negocio en que está, tú solamente tienes lo que tienes actualmente en stock.

00:34:58.240 --> 00:35:02.440
Entonces, carece de sentido tener muy raro que tú consultes el dato histórico. Muy, muy raro.

00:35:03.360 --> 00:35:06.460
Entonces, ¿qué hace la política de ellos? Bueno, lo voy a dividir en dos. Una base de datos que

00:35:06.460 --> 00:35:10.880
tengo pocos datos y va a ser los datos actuales que puede ser del último mes o del último año

00:35:10.880 --> 00:35:15.520
y tengo una base de datos histórica. Esa se histórica ya es para tomar decisiones y es la

00:35:15.520 --> 00:35:20.200
que consulto cuando de pronto voy a hacer un data warehouse, por ejemplo. Entonces, va en

00:35:20.200 --> 00:35:28.220
esas políticas de crecimiento y va también en otras políticas. Y esto es un poco más técnico

00:35:28.220 --> 00:35:33.560
y es para que de pronto tú lo entiendas y para qué te puede servir, digamos. Resulta que cuando

00:35:34.580 --> 00:35:41.460
tú creas una base de datos, dependiendo del motor, el motor, digamos, que planifica de

00:35:41.460 --> 00:35:45.820
forma diferente cada uno de ellos. Ahí viene que cada DBA es diferente. No es lo mismo un DBA

00:35:46.420 --> 00:35:52.460
ahora con un DBA de server, porque cada arquitectura puede ser diferente de muchas cosas. Hay

00:35:52.460 --> 00:35:57.080
motores que hacen lo siguiente. Tú entenderás que, y es claro porque solamente para recordarle,

00:35:57.500 --> 00:36:02.440
cuando yo tengo una tabla, esa tabla lo que hace es que me guarda los datos al final de un

00:36:02.440 --> 00:36:06.980
archivo, porque un sistema operativo guarda un sistema de ficheros. O sea, la base de datos,

00:36:07.020 --> 00:36:11.000
cuando tú guardas una fila, te guardas un archivo. Esos archivos son los que ellos

00:36:11.000 --> 00:36:14.980
llaman data files o archivos de datos y entonces hay motores de base de datos que

00:36:14.980 --> 00:36:21.660
definen data files para un conjunto de objetos. O sea, digamos, tú tienes tres tablas, cinco

00:36:21.660 --> 00:36:25.340
tablas y esas cinco tablas se pueden guardar en un solo data files, nada más en uno.

00:36:26.300 --> 00:36:31.880
Entonces el problema es, como yo sé cómo es el crecimiento a futuro de mi dato,

00:36:32.380 --> 00:36:37.680
yo puedo configurar el data file a un tamaño predilecto, porque hay dos cosas. Si el

00:36:37.680 --> 00:36:41.640
data file lo define muy corto, y te lo voy a decir gráficamente, es decir, de tamaño muy

00:36:42.200 --> 00:36:47.200
corto, vas a tener un pequeño inconveniente en que esos data files te van a quedar muchos

00:36:47.200 --> 00:36:52.560
data files desplegados. Y no necesariamente estos data files te van a colocar aquí,

00:36:52.780 --> 00:37:00.640
DB1 como data file 1, DB2 como data file 2 y DB3 como data file 3. Aquí digamos que tienen

00:37:00.640 --> 00:37:05.880
datos de la tabla empleada de los clientes y tienen muchos tablas. Si esto es muy corto,

00:37:05.880 --> 00:37:11.960
forza al sistema a que te cree muchos data files. Y el problema de tener muchos data files es que

00:37:12.580 --> 00:37:20.920
si tú haces un full scan, un full scan que es hacer la consulta esto, hacer un select asterisco

00:37:20.920 --> 00:37:26.680
from employee, esto hace un full scan, porque tú te vas a traer todos los datos que tiene la

00:37:26.680 --> 00:37:33.740
tabla. O peor todavía, si tú tienes un where, tú colocas un where, where name sea igual a

00:37:33.740 --> 00:37:39.340
que va a pasar aquí. Si el name no es un índice, tiene que ser full scan. Un full scan al final es

00:37:39.340 --> 00:37:46.020
lo que más cuesta a un motor y uno trata de evitarlos en lo máximo posible. ¿Qué es un full

00:37:46.020 --> 00:37:51.240
scan? Un full scan es que el motor sabe dónde están sus data files, tiene que buscar sus data

00:37:51.240 --> 00:37:55.340
files y de cada data file tiene que subir los datos de memoria principal para poderte los

00:37:55.340 --> 00:38:00.360
mostrar a ti. Entonces si estos data files hay muchos y normalmente no están adyacentes,

00:38:00.360 --> 00:38:05.180
no son contiguos, porque recuerda que este disco duro o disco solido puede estar grabando

00:38:05.180 --> 00:38:09.580
muchas personas, te va a quedar en espacios separados, cuenta fragmentados, entonces tienes

00:38:09.580 --> 00:38:15.500
que recuperar cada fragmento y después subirlo de memoria principal y eso te cuesta. Entonces

00:38:15.500 --> 00:38:21.540
al final esa análisis de frecuencia de lo que es, de lo que es como incrementa,

00:38:21.840 --> 00:38:26.100
le puede permitir a un DBA hacer lo que uno llama técnicamente el tuning o la puesta a

00:38:26.100 --> 00:38:30.960
la base de datos, de colocar la base de datos con características específicas para la aplicación

00:38:30.960 --> 00:38:36.400
que quiere ejecutar. Y más específicamente sería con esto un data file con el tamaño

00:38:36.400 --> 00:38:44.020
de sus data files. Aclaro, ¿qué es mejor, pequeño o grande? Depender. Ahí no hay un,

00:38:44.960 --> 00:38:48.300
depende de lo que tú vayas a hacer. Si lo colocas muy grande, entonces te queda un

00:38:48.300 --> 00:38:52.260
data file ahí que ocupa un espacio que de pronto para llenarlo demora mucho tiempo.

00:38:52.260 --> 00:38:59.400
O sea, no hay una panacea, una fórmula matemática que nos diga cuál es mejor.

00:39:00.860 --> 00:39:05.380
Si te fijas entonces, eso es lo que podías hacer con esa parte. Ahora, si vas nuevamente a la

00:39:05.920 --> 00:39:10.220
herramienta, date cuenta que ahora te está dando la información por cada una de las

00:39:10.220 --> 00:39:15.360
tablas. Cuando seleccionas aquí la base de datos, te das cuenta ahora que ahora te lo está

00:39:15.360 --> 00:39:20.280
diciendo la misma información por cada tabla. Te está diciendo, por ejemplo, que la tabla

00:39:20.280 --> 00:39:29.380
actualmente tiene 347 filas. Tiene una clave y tiene dos índices. Entonces, aquí aplicas

00:39:29.380 --> 00:39:34.320
lo mismo pero de forma particular en tablas. ¿Qué pasa ahora? ¿Para qué me sirve estos datos?

00:39:35.000 --> 00:39:40.800
Ahora, puedo hacer un análisis de frecuencia, pero por tabla. ¿Y de qué me sirve? La misma

00:39:40.800 --> 00:39:44.120
teoría que te dije, el data file te sirve ahora para lo mismo. ¿Por qué? Porque hay

00:39:44.120 --> 00:39:49.000
motores que hacen lo siguiente. No tienen un data file para endos objetos. Sino lo que

00:39:49.000 --> 00:39:56.060
hace el motores es que te crea un data file por cada tabla. ¿Que si es bueno o malo? Sí,

00:39:56.340 --> 00:39:59.520
como todo en la vida, tiene ventajas y desventajas. Te crea un data file,

00:39:59.780 --> 00:40:03.300
significa que tengo la tabla de álbum, álbum se guarda en un data file. Entonces,

00:40:03.460 --> 00:40:13.020
yo puedo definir de igual forma el mismo análisis diciendo que si veo que me está

00:40:13.020 --> 00:40:16.260
creciendo mucho esa tabla en el tiempo, voy a crear un data file mucho más grande.

00:40:16.260 --> 00:40:23.660
Si de pronto la tabla no crece, voy a colocar un data file mucho más pequeño y te aplica lo

00:40:23.660 --> 00:40:28.660
mismo que vas a tener a nivel de lo que es el full scan. Cuando yo consulto eso,

00:40:29.020 --> 00:40:34.240
si tengo muchos data files separados, entonces me demora más tiempo. Y te aclaro que lo que

00:40:34.240 --> 00:40:40.120
más desgasta a un motor es bajar a memoria secundaria, porque entendemos que la memoria

00:40:40.120 --> 00:40:44.140
RAM es mucho más rápida. Eso es lo que más desgasta un motor. Entiendo que con los discos

00:40:44.230 --> 00:40:51.170
es mucho más rápido, pero es lo que más cuesta un motor. Y la mayor parte de motores lo que

00:40:51.170 --> 00:40:56.010
buscan es tenerte la mayor cantidad de datos de memoria principal, de tal forma en que no

00:40:56.010 --> 00:41:00.830
bajes a memoria secundaria. Y eso mismo te aplica el sistema operativo. Mira,

00:41:01.870 --> 00:41:06.830
tú Windows, te voy a colocar con Windows, es más un devolvador de recursos. Tú montas

00:41:06.830 --> 00:41:13.730
un Windows y tienes 8 GB y vamos a suponer que por defecto cuando tú montas el Windows

00:41:13.730 --> 00:41:19.530
con todo lo que tienes, te ocupa 5 GB, uno podría creer que si yo subo a 16 GB,

00:41:20.110 --> 00:41:23.250
ese bendito Windows me va a ocupar los mismos 5. No te ocupo los mismos 5,

00:41:23.790 --> 00:41:28.750
te ocupo más memoria. ¿Y tú irás por qué? Porque el sistema operativo aplica lo mismo. Dice,

00:41:28.870 --> 00:41:32.410
voy a tratar de subir la mayor cantidad de servicios arriba, memoria principal,

00:41:32.890 --> 00:41:36.950
de tal forma de que si tú lo vas a ejecutar, pues sea lo más rápido posible. Entonces,

00:41:37.170 --> 00:41:41.530
ese mismo principio que tiene el sistema operativo, lo replicas acá con el concepto

00:41:41.530 --> 00:41:47.930
de motores de base datos. La mayor cantidad de datos por registro lo tiene más arriba,

00:41:48.190 --> 00:41:53.050
que apartamos el hecho. La mínima unidad de datos que tiene uno base datos es un registro.

00:41:53.270 --> 00:41:58.570
Si uno sube una columna, tiene que subir la tabla, o sea, el registro, perdón, la tabla.

00:41:59.790 --> 00:42:05.170
A menos en que cambies el tipo de motor. Entonces, cuando tú hablas de un motor

00:42:05.830 --> 00:42:09.750
columnar, ah, la cosa es diferente. No es lo mismo que un motor relacional,

00:42:09.750 --> 00:42:14.190
no es lo mismo. Mientras que allá la mínima unidad de información es la columna, acá la

00:42:14.190 --> 00:42:17.710
mínima unidad de información es el registro. Entonces, tú lo que subes es un registro. Aunque

00:42:17.710 --> 00:42:21.350
vayas a usar una columna de registro, hay que subir el registro completo. Ni modo. Hay

00:42:21.350 --> 00:42:27.890
que hacerlo así. Listo. Entonces, puedes aplicar el mismo concepto de crecimiento,

00:42:27.990 --> 00:42:32.670
como está la tabla. Ahora, si le das clic derecho aquí sobre esta tabla, por ejemplo,

00:42:32.670 --> 00:42:39.070
álbum, dale donde dice view keys, por favor, y te debe abrir una pestaña.

00:42:44.650 --> 00:42:49.650
Mira que te abre una ventana de este lado y puedes ver la tabla que te da la información,

00:42:49.690 --> 00:42:55.150
por ejemplo, de la tabla álbum. Por ejemplo, voy a empezar aquí de la primera que dice column.

00:42:56.830 --> 00:43:02.070
Empezamos con column, acá bajito. Se está diciendo, mira, esa tabla tiene tres columnitas,

00:43:02.070 --> 00:43:09.950
y te dice el tipo de datos. Ese tipo de datos, aunque tú no creas, yo entiendo que hoy en día uno

00:43:09.950 --> 00:43:15.670
no se preocupa con el tipo de datos. Pero entienda un poco más mi punto de vista,

00:43:15.890 --> 00:43:21.090
porque yo vengo de una generación, seguramente mucho más antigua que ustedes son. Yo asumo

00:43:21.090 --> 00:43:28.370
que ustedes son muy jóvenes. Entonces, allá a ahorrarse un datico o unos bytes, pues uno

00:43:28.370 --> 00:43:32.330
estaba muy pendiente. Hoy en día, pues en realidad el almacenamiento secundario es lo más barato.

00:43:32.450 --> 00:43:38.250
Si tú te vas a un cloud, el cloud, lo más barato es secundario y lo que más te cobran es

00:43:39.150 --> 00:43:44.250
memoria RAM y te cobran procesamiento, es lo que más te cobran. Pero tú dices, por ejemplo,

00:43:45.010 --> 00:43:50.790
bueno, voy a definir el tipo de datos. No es lo mismo definir un integer de cuatro bytes a

00:43:50.790 --> 00:43:55.450
un integer de seis bytes. ¿Por qué? Porque cuando el vinito de datos es numérico,

00:43:55.450 --> 00:43:59.990
el mando ocupa los cuatro y seis bytes. Pero tú vas a guardar solamente uno, dos, tres, cuatro,

00:44:00.150 --> 00:44:03.630
nada más un número muy pequeño. Entonces, si tú vas a guardar un número muy pequeño,

00:44:04.010 --> 00:44:08.330
ajusta el tipo de datos a lo que vayas a hacer. ¿Por qué? Si es una base de datos,

00:44:08.530 --> 00:44:11.930
digamos. Tú dices, no, pero es que el base de datos que yo tengo no pasa mucho,

00:44:12.210 --> 00:44:15.870
él no crece. No, pero es que estamos hablando quizás de base de datos que tengan 15, 20,

00:44:16.090 --> 00:44:20.290
100 millones de registros. O sea, son base de datos sumamente grandísimos y esos bytes te

00:44:20.290 --> 00:44:23.690
cuestan en almacenamiento. Entonces, no es lo mismo decir, porque cuando yo defino un integer

00:44:23.690 --> 00:44:28.790
de cuatro bytes, me ocupa los cuatro bytes, aunque el número que vaya a guardarse a uno.

00:44:29.470 --> 00:44:34.950
Cosa diferente como cuando tengo un varchar, ¿verdad? El varchar es más dinámico y el

00:44:34.950 --> 00:44:37.750
varchar tú define un varchar. Por ejemplo, aquí es como tengo un varchar de 160,

00:44:37.990 --> 00:44:43.730
pero tú tienes 40, él nada más te ocupa los 40, ¿cierto? Y tú dices, no, el mando ocupa.

00:44:43.910 --> 00:44:50.130
Sí, pero hay un pequeño problema a nivel de recursos, que es el siguiente. Mira lo que pasa,

00:44:50.690 --> 00:44:58.150
te voy a pintar gráficamente. Suponte esa tabla que se llama álbum, listo, y voy a seguir el

00:44:58.150 --> 00:45:03.570
esquema siguiente. Tengo la tabla álbum y ahora este motor va a ser lo siguiente. Por

00:45:03.570 --> 00:45:07.370
cada álbum que tenga, por cada tabla voy a tener un datafile, que al final es un bloque

00:45:07.370 --> 00:45:14.870
de memoria. Este datafile piensa en lo siguiente, piensa en que tú puedas hacer un update de

00:45:14.870 --> 00:45:21.230
tus datos. Entonces imagínate lo siguiente, tú guardaste el nombre del artista, te ocupó 40 bytes,

00:45:22.030 --> 00:45:27.810
pero hiciste un update y ese update te ocupa 20 bytes. Ese motor se tiene que preocupar por eso,

00:45:27.850 --> 00:45:32.950
por lo siguiente. Porque si en ese datafile no cabe esa información, él no se puede dar

00:45:32.950 --> 00:45:38.270
el lujo de coger ese registro y mandarlo para otro datafile. Eso le cuesta mucho.

00:45:39.310 --> 00:45:43.430
Mira, le cuesta tan programación y también le va a costar a nivel de lo que es tiempo de

00:45:43.430 --> 00:45:48.410
cuesta. Entonces, ¿qué hace el motor? Esto es claro que todos deberían ser igual,

00:45:49.090 --> 00:45:55.490
la técnica no sé cuál sería, pero todos serían iguales. Es decir, entonces por aquí te guarda

00:45:55.490 --> 00:46:02.130
un pequeño espacio, el datafile, fíjate que aquí te guarda, que aquí no está ocupado. Ese

00:46:02.130 --> 00:46:08.330
que no está ocupado es por si acaso tú haces un update y, digamos, vas a incrementar el

00:46:08.330 --> 00:46:12.630
espacio y por si acaso hoy tengo como que un colchón de seguridad de espacio por los updates

00:46:12.630 --> 00:46:17.390
que tengas tú. Entonces, si tú defines un varchar de 1000 y al final está ocupando solamente 20,

00:46:17.770 --> 00:46:21.790
date cuenta que aunque no lo estés usando, el motor tiene que reservar esa memoria,

00:46:21.970 --> 00:46:25.650
ese espacio de memoria, por si acaso tú haces un update que ahora ocupaba 20,

00:46:25.910 --> 00:46:31.170
pero ahora quiere ocupar los 1000. La moralidad es lo siguiente, es analiza entonces tus tipos

00:46:31.170 --> 00:46:36.670
de datos y verifica que vayan de acuerdo entonces a lo que tú que desees almacenar.

00:46:37.630 --> 00:46:41.450
Entonces, no te traslímites todo porque de pronto te está afectando mucho. Al final sé

00:46:41.450 --> 00:46:46.210
que de pronto tú tienes mucho espacio, pero al final te puede afectar en lo que el motor como

00:46:46.210 --> 00:46:53.290
configura internamente. Ya lo demás pues ahí no veo algo como que interesante para decirte y

00:46:53.290 --> 00:46:57.150
para tener en cuenta con este tipo de estudios que tú haces. Date cuenta que este estudio va

00:46:57.150 --> 00:47:02.110
un poco más dirigido, más técnico hacia una persona que conoce de base de datos o de

00:47:02.110 --> 00:47:07.530
motor de base de datos, perdón. Bueno, aquí pues pasa la siguiente pestaña que te dice info,

00:47:07.530 --> 00:47:13.030
te da información general, pues básicamente el nombre de la tabla y no hay ningún poder

00:47:13.030 --> 00:47:19.950
de decisión ahí pues o algo que analizar. Seguidamente pues te da un preview de los datos,

00:47:20.050 --> 00:47:24.250
no te trae todos los datos que tengas, te hace un preview de 80, 100 datos, solo puedes

00:47:24.250 --> 00:47:30.550
configurar ahí en los parámetros de cuánto preview vas a hacer. Quizás puedas ver el

00:47:30.550 --> 00:47:34.530
contenido que tengas y quizás puedas ver algún dato inconsistente en ese contenido.

00:47:34.530 --> 00:47:40.870
Tal vez lo ves, porque si tienes un millón, 20 millones, 30 millones de registros, pues la

00:47:40.870 --> 00:47:44.470
muestra que te está colocando aquí es muy pequeña para poder hacer un análisis, por ejemplo,

00:47:44.630 --> 00:47:50.250
por lo menos visual de qué puede estar mal ahí. Aquí este rowcon ya te había mencionado,

00:47:50.290 --> 00:47:54.870
pero para qué sirve, digamos para definir ese data file, el tamaño, cómo es, cómo está

00:47:54.870 --> 00:48:02.010
creciendo en el tiempo esa tabla. Y si crece en el tiempo, cuál va a ser mi política para

00:48:02.010 --> 00:48:08.330
hacerla más rápido. Entonces de pronto hago petición de tabla, de pronto agrego más índices

00:48:08.330 --> 00:48:13.590
a la tabla, que también tiene otro problema con los índices. Primariquín, bueno,

00:48:13.790 --> 00:48:18.370
primariquín sí puede ser, pues puedes analizar para ver cuáles son las columnas

00:48:18.370 --> 00:48:23.390
que pertenecen o si la tabla no tiene primariquín. Ya te había colocado un

00:48:23.390 --> 00:48:29.310
caso ejemplo en que el caso de tal auditorías carece de sentido en que normalmente pues le

00:48:29.310 --> 00:48:35.570
colocó una llave primaria y carece todavía más del sentido en que le crea una secuencia y le

00:48:35.570 --> 00:48:40.130
cree la llave primaria para la secuencia, a veces todavía más de sentido esa parte. Aquí

00:48:40.130 --> 00:48:43.470
normalmente lo que podías verificar es si las tablas que tienes, por lo menos tiene llave

00:48:43.470 --> 00:48:47.610
primaria, están las que son primordiales en tu negocio. Por ejemplo, te encuentras una tabla

00:48:47.610 --> 00:48:50.430
cliente y dices, bueno, ¿cómo así que cliente no tiene llave primaria? Pues eso es muy raro

00:48:50.430 --> 00:48:57.050
que sucede hoy en día, pero quizás puede ser. Yo te aclaro que yo tengo una historia

00:48:57.050 --> 00:49:03.490
de esas anécdotas que pasaron cuando yo empecé con esta parte de freelance. Yo creo que fue el

00:49:03.490 --> 00:49:11.250
segundo contrato que yo tuve. En ese segundo contrato que tuve trabajé para un español.

00:49:11.450 --> 00:49:18.970
Ese español me mandó a hacer un software que era un webcrawler, un escrapeador. El

00:49:18.970 --> 00:49:23.670
señor lo que quería era que él colocaba una URL de un periódico y yo me traje a todos

00:49:23.670 --> 00:49:30.330
los artículos del periódico. Esa solución no quedó tan estable porque por muchas cosas

00:49:30.330 --> 00:49:37.170
de formato de cada uno de los periódicos. Pero eso al final es ilegal en algunos países.

00:49:37.590 --> 00:49:41.930
O sea, escrapear datos de una página depende directamente del país. Yo me enteré fue después.

00:49:42.290 --> 00:49:47.830
No sabía, estaba muy privíparo. Yo recuerdo que el español una vez me muestra su pantalla

00:49:47.830 --> 00:49:53.370
para explicarme algo que quería agregar en el software. Y yo recuerdo que las tablas

00:49:54.590 --> 00:50:02.290
teníamos una tabla que se llamaba violaciones. Una tabla que se llamaba asesinatos. Y a mí me

00:50:02.290 --> 00:50:06.730
causó un poco, yo como voy a un país sumamente complejo, entonces esas palabras ya están

00:50:06.730 --> 00:50:12.510
marcadas en mi cabeza. Y ya a mí me dio miedo esa parte. Entonces yo le pregunto a él,

00:50:12.510 --> 00:50:17.470
disculpa, y tú esas tablas, ¿por qué las tienes? Él se enojó mucho y me dijo,

00:50:17.550 --> 00:50:21.190
¿para qué te interesa eso? A usted no le interesa lo que yo le mandé. Entonces me

00:50:22.130 --> 00:50:26.410
asustó mucho. Pero al final, cuando él me pregunta por qué me interesa, yo me di una

00:50:26.410 --> 00:50:31.550
cuenta de una particularidad de las tablas. Las tablas no tenían foreign key. Entonces yo

00:50:31.550 --> 00:50:35.430
disparo y me dije, no, no, es que me da curiosidad, es que ¿por qué las tablas no

00:50:35.430 --> 00:50:40.590
tienen foreign key? Entonces ese foreign key me dice él, no, lo que pasa es que,

00:50:40.850 --> 00:50:45.890
y tiene razón, tiene razón técnicamente el señor, lo que pasa es que yo hago mucho,

00:50:45.890 --> 00:50:52.490
mucha subida de datos a través de procesos de batch o de bool. El batch es que tú lo

00:50:52.490 --> 00:50:57.310
haces normalmente, lo divides en partes y lo ejecutas, no necesariamente en tiempo

00:50:57.310 --> 00:51:01.250
real. El bool nada más tiene un solo archivo y lo ejecutas normalmente en tiempo real,

00:51:01.350 --> 00:51:04.290
son las diferencias que hay con lo respecto. Lo que hace es que cuando tienes mucho foreign

00:51:04.810 --> 00:51:09.670
key te hace más lento subir la información. Claro, ya te explico por qué. Bueno,

00:51:10.010 --> 00:51:13.250
si de cuando te interesa, te sube más lento, se le quita las llaves primarias,

00:51:13.250 --> 00:51:17.510
entonces él pierde integridad de datos, claro, integridad referencial, porque él no

00:51:17.510 --> 00:51:22.130
asegura, no puede asegurar muchas cosas ahí, pero él gana velocidad. Al final siempre

00:51:22.130 --> 00:51:27.310
quedé con la duda de qué hacía el señor con eso y qué guardaba ahí. Ahí estaba. Bueno,

00:51:27.330 --> 00:51:32.650
pero al final esto te va a permitir pues definir si tienes llave primaria o no llave

00:51:32.650 --> 00:51:38.810
primaria. Entonces aquí te va a definir entonces en el porte key es hacia qué,

00:51:38.890 --> 00:51:44.190
cuál de las tablas, cuál columna de las tablas hacen referencia a otras. Por ejemplo,

00:51:44.290 --> 00:51:48.950
esta tabla hace referencia a la tabla que se llama Track C, al NUNAID,

00:51:49.210 --> 00:51:55.650
hace referencia a la tabla Track. Importe key es quién me referencia a mí.

00:51:56.790 --> 00:52:02.210
Ahí podías analizar por eso si de pronto tienes una ciudad de tablas y si te hace

00:52:02.210 --> 00:52:09.610
falta alguna. Y aquí sí viene algo y te explico por qué y esto va con relación a lo que te dije

00:52:09.610 --> 00:52:14.630
el día de ayer en que te dije, piensa muy bien cuando voy a hacer un Join con una herramienta

00:52:15.250 --> 00:52:21.190
ETL. Por muchas razones, porque primero la base de datos está preparada para esos Join.

00:52:22.850 --> 00:52:28.670
Y además la base de datos, los datos están locales, mientras que para el proceso de Join

00:52:28.670 --> 00:52:33.870
con un ETL te toca coger los datos, pasarlas por una red y llevarla al equipo donde tengas

00:52:33.870 --> 00:52:39.390
el job o el workflow o el pipeline, lo que tú quieras ver. Entonces,

00:52:39.390 --> 00:52:45.410
fíjate que la tabla tiene dos índices. El índice que se crea por defecto,

00:52:45.530 --> 00:52:50.650
y te voy a abrir comillas dobles aquí, creería que todas las bases de datos hacen

00:52:50.650 --> 00:52:55.250
exactamente lo mismo. ¿Por qué dar las comillas dobles? Porque me

00:52:55.250 --> 00:53:01.090
aseguraste eso. Pero normalmente cuando tú, creo que tú en la universidad y en lo que

00:53:01.090 --> 00:53:06.390
ya te he dicho siempre, mira, trata de buscar por ya de primaria porque te hace más rápida

00:53:06.390 --> 00:53:11.470
las búsquedas. Sí señor, efectivamente eso es. ¿Y eso por qué se hace? Porque entonces

00:53:11.470 --> 00:53:16.870
normalmente la mayoría, pues la forma puede variar, pero en el fondo hacen lo mismo. Entonces

00:53:16.870 --> 00:53:20.690
digamos que este bloque de memoria es de álbum, pero este álbum puede tener varios

00:53:20.690 --> 00:53:26.350
data files, varios bloques de memoria por muchas razones de esta señora acá. Entonces,

00:53:26.410 --> 00:53:31.310
cuando tú creas y defines la base de datos, defines una ya de primaria, la base de datos lo

00:53:31.310 --> 00:53:38.270
que hace internamente es que crea para ese señor álbum un bloque de memoria donde guarda

00:53:38.790 --> 00:53:44.990
índices. ¿Qué hace el índice? Lo que hace el índice, lo que hace es que, por ejemplo,

00:53:44.990 --> 00:53:50.950
si tu índice es tu número de identificación, entonces él guarda en dos partes. Guarda en la

00:53:50.950 --> 00:53:56.370
tabla de índices y guarda en el bloque de memoria que le tocó a ese registro. Cuando tú

00:53:56.370 --> 00:54:01.290
buscas por ese índice, en este caso por la ya de primaria, él primero busca en el índice y

00:54:01.290 --> 00:54:07.010
el índice le dice en qué bloque de memoria, no en qué parte de la memoria, sino en qué

00:54:07.010 --> 00:54:12.010
bloque de memoria se encuentra el registro que estás buscando y el motor nada más sube ese

00:54:12.010 --> 00:54:17.390
bloque de memoria y te busca el registro de memoria principal. El algoritmo es fácil buscar

00:54:17.390 --> 00:54:20.930
para ver si el número que estás buscando coincide con los números que subió de memoria

00:54:20.930 --> 00:54:27.650
principal. Ya tú aseguras que vas a subir el bloque donde está. Si no usas ya de primaria,

00:54:27.750 --> 00:54:32.650
te hace full scan, te sube todos los bloques de memoria y si tienes poca memoria te hace

00:54:32.650 --> 00:54:37.990
swapping. Es decir, entonces te comienza a bajar los bloques de memoria que no usas,

00:54:37.990 --> 00:54:44.010
la secundaria y ese swapping que va haciendo te retarda entonces la búsqueda. Eso es lo que

00:54:44.010 --> 00:54:49.070
hace el índice al final, te mejora la búsqueda pero un pequeño problema con el índice. Porque

00:54:49.070 --> 00:54:53.450
tú pensarás, todo aquí tiene ventaja y de ventaja, no ayudo que no tenga. Tú dirás,

00:54:53.550 --> 00:54:59.690
pero ven acá. ¿Pero esto significa en qué? Por ejemplo, yo hago mucha búsqueda por nombre

00:54:59.690 --> 00:55:04.830
de usuario, por nombre de cliente, perdón. Y eso está lento, claro, entonces tú empiezas

00:55:04.830 --> 00:55:10.090
a crecer en datos, te quedan muy dispersos los tu data files, tienes que subir esos bloques de

00:55:10.090 --> 00:55:14.830
memoria a primaria y eso te retarda el tiempo y vas a buscar los nombres que tú quieras. Ahora,

00:55:14.870 --> 00:55:19.610
tienes un order by más complicado todavía, un order by cuando es más grande. Eso hay que

00:55:19.610 --> 00:55:24.970
pensarlo bien. Pero es inteligente eso, pero tú dices, ah no, entonces tú dices, piensa,

00:55:25.150 --> 00:55:28.990
Eva, ¿qué hago yo? Entonces lo que voy a hacer es lo siguiente, voy a agregar un índice

00:55:28.990 --> 00:55:33.910
para name y significa ahora que ahora va a ser más rápida la consulta por nombre. Sí señor,

00:55:33.910 --> 00:55:39.830
le hace más rápida la consulta por nombre. Claro que sí, pero hay un problema que cuando tú ganas

00:55:39.830 --> 00:55:44.810
algo normalmente pierdes otra cosa. Si tú tienes un índice, los índices ¿qué haces? Te mejoran las

00:55:44.810 --> 00:55:50.390
búsquedas, pero te retardan la actualización y borrado. Porque quizás cuando tú borras,

00:55:50.410 --> 00:55:55.230
tienes que borrar en el data file y borrar entonces donde tienes los índices. Entonces

00:55:55.230 --> 00:55:58.630
tienes que hacer dos operaciones y todas esas actualizaciones, por ejemplo, sobre la

00:55:58.630 --> 00:56:01.630
llave primaria, te toca actualizar que normalmente uno no lo hace, pero lo puede hacer.

00:56:02.750 --> 00:56:05.490
Normalmente uno por standard no lo hace, pero es claro que uno lo puede hacer.

00:56:06.990 --> 00:56:11.490
Entonces yo, ¿qué pasa? Te tengo que actualizar en el índice y en el registro del data files.

00:56:11.650 --> 00:56:18.930
Entonces, ¿qué pasa? Que si yo tengo mucho índice como tal, me va a incrementar la búsqueda,

00:56:19.090 --> 00:56:25.270
pero me retarda la actualización de ML, específicamente más la de update y la de delete,

00:56:25.270 --> 00:56:31.910
en el caso que te mencioné. Entonces, yo he visto muchos casos, había un joke,

00:56:32.550 --> 00:56:36.850
a mí me gusta mucho la parte de Philan, porque por lo menos, aunque no vaya a participar en

00:56:36.850 --> 00:56:40.590
un trabajo, me doy cuenta de los problemas que tienen muchas empresas o alguien en particular.

00:56:41.490 --> 00:56:46.150
Alguien decía que tiene una tabla, en ese caso tenía 15 millones de registros,

00:56:47.070 --> 00:56:55.750
perdón, 150 millones de registros. La tenían Postgres. Y la tabla para una consulta en

00:56:55.750 --> 00:57:02.830
particular le demoraba 10 segundos y él quería bajarla a 5. Yo recuerdo que él decía,

00:57:03.070 --> 00:57:09.190
bueno, aquí quiero que la persona que vaya a hacer esto me indique qué va a hacer. Ya la

00:57:09.190 --> 00:57:13.790
tabla tiene actualmente 16 índices. Ya no soporto un índice más porque tengo unos

00:57:13.790 --> 00:57:18.030
problemas a nivel de inserción y atresiones. Quiero que me definan una solución para poder

00:57:18.030 --> 00:57:22.650
mejorar las búsquedas. Entonces ya no solamente, entonces de pronto puedes partir la tabla y hacer

00:57:22.650 --> 00:57:27.630
muchas cosas dependiendo del motor en que estés. Es interesante los problemas que se

00:57:27.630 --> 00:57:32.930
forman ahí. Entonces no siempre tú tiras un índice, porque a veces puedes tratar otras cosas.

00:57:34.790 --> 00:57:38.870
Y vete a lo siguiente aquí. Mira ahora lo que te había comentado el día de ayer de por qué

00:57:38.870 --> 00:57:43.530
es más rápido el join a cada nivel de base de datos. Les te cuento lo siguiente. Aquí se

00:57:44.170 --> 00:57:49.450
genera un índice a nivel de foreign key. O sea, genera un índice por defecto. Creo que la

00:57:49.450 --> 00:57:55.090
mayoría, vuelvo y repito, que haya uno que no te lo haga y venga, pero bueno. Pero la mayoría

00:57:55.090 --> 00:57:59.670
de motores cuando tú haces un foreign key te tira un índice. Este índice no es igual al

00:57:59.670 --> 00:58:08.850
de primary key. No es igual. Este índice entonces lo que hace es lo siguiente. Este

00:58:08.850 --> 00:58:15.250
te mejora las búsquedas a nivel de join. ¿Qué sería? Que cuando tú haces un join sobre dos tablas,

00:58:16.570 --> 00:58:20.850
que habría que entender un poco más esa parte de join, porque recuerda que un join termina

00:58:20.850 --> 00:58:28.310
siendo un producto cartesiano. Pero es entendible que por ejemplo cuando tú tengas lo siguiente,

00:58:28.390 --> 00:58:37.470
tienes por ejemplo un select, el join lo puede hacer a nivel del front aquí o lo

00:58:37.470 --> 00:58:45.510
tienes en tabla A, en tabla B. Bueno, perdón. Condición A, en condición B. Para que me

00:58:45.510 --> 00:58:53.650
entiendan mejor hagamos customer C, pedidos. Listo. Entonces tú tienes, por ejemplo,

00:58:53.990 --> 00:58:58.410
si lo haces a nivel de Word, ya depende como tú quieras, por ejemplo CID igual a PID,

00:58:58.530 --> 00:59:03.350
siguiente. Y supongamos que arreglas una nueva tabla aquí. ¿Qué te digo yo?

00:59:04.070 --> 00:59:16.190
De evoluciones, no sé. Listo. Entonces vamos a suponer que sea C.ID igual a D.ID client.

00:59:19.010 --> 00:59:23.070
Entonces todo esto de base de datos va hasta con la forma en que tú hagas el Word,

00:59:25.630 --> 00:59:30.850
porque aunque él intenta hacer lo siguiente, normalmente él se da cuenta en que subir todos

00:59:30.850 --> 00:59:36.230
registros de memoria principal le puede costar. Entonces primero une estas dos tablas y a partir

00:59:36.230 --> 00:59:40.910
del filtro de estas dos tablas tira un producto cartesiano con la tabla restante. O sea, aquí

00:59:40.910 --> 00:59:46.630
en la primera parte él haría esta parte primero, sube customer y sube pedidos. Hace full scan

00:59:46.630 --> 00:59:51.890
ahí dependiendo de muchas cosas. Pero entonces ya después con los registros que me quedan

00:59:51.890 --> 00:59:57.070
aquí, hago entonces producto cartesiano aquí. En pocas palabras, quizás no es lo mismo tirar

00:59:57.070 --> 01:00:01.170
este man primero así, te da el mismo resultado, pero a nivel de tiempo de respuesta puede que no

01:00:01.170 --> 01:00:12.730
te dé. A revés puede hacerlo, digamos, a revés. O sea, no es lo mismo, no es como que se llama

01:00:12.730 --> 01:00:16.490
acumulativo a nivel de tiempo de respuesta. Entonces tú tienes que analizar que vas a tirar

01:00:16.490 --> 01:00:19.990
ahí si tiras primero al izquierdo o derecho. Lo que sí es seguro es que el motor te tira

01:00:19.990 --> 01:00:32.010
un índice para ya de primaria. Perdón, listo, vamos a ver qué termina ya esta parte. Bueno,

01:00:32.110 --> 01:00:39.850
aquí ya viene siendo privilegios que tengas. Quizás en el estándar y no te lo da,

01:00:40.170 --> 01:00:44.630
te lo todavía da el gerente de datos, definir quiénes podían acceder a ese campo.

01:00:46.030 --> 01:00:49.970
Porque si hay personas que no pueden acceder al campo, entonces podías pensar en una vista,

01:00:49.970 --> 01:00:56.630
definir una vista para eso. Los privilegios que tenga la columna y ya listo. Bueno, eso es lo que

01:00:56.630 --> 01:01:02.850
podía hacer con este análisis, pues es más, digamos, técnico con respecto a tu base de datos

01:01:02.850 --> 01:01:09.210
como tal. Ya aquí podías ver de forma general todas las tablas, mirar si alguno

01:01:09.210 --> 01:01:13.650
tiene ya de primaria, decidir si hay que agregarla, no agregarla o cambiarla. Bueno,

01:01:13.810 --> 01:01:18.630
muchas cosas que pueden. O sea, si hacemos un pequeño break de 10 minutitos y seguimos

01:01:18.630 --> 01:01:27.110
con el siguiente análisis. Bueno, ok. Bien, volvimos nuevamente, pues espero que hayan tomado algo

01:01:28.230 --> 01:01:34.870
y hayan descansado un poco. A veces más duro cuando la sesión es. De pronto para uno que

01:01:34.870 --> 01:01:39.930
es el, digamos, el instructor creo que a veces un poco más fácil porque de pronto uno se cansa,

01:01:40.410 --> 01:01:45.030
se distrae menos, pero de pronto seguramente tiene allá problemas de la oficina o lo

01:01:45.030 --> 01:01:50.090
que se llama y quizás de pronto es un poco más complejo. Bueno, retomamos nuevamente aquí esta

01:01:50.090 --> 01:01:55.050
parte. Se me escapaba algo en los ejercicios que estoy haciendo aquí. Yo los voy a compartir en

01:01:55.050 --> 01:02:00.490
una presentación. Aquí están las fuentes de datos que vamos a tomar para acá y aquí están

01:02:00.490 --> 01:02:04.770
cada uno de los ejercicios en el orden de lo que vamos a hacer. Entonces yo los voy leyendo y

01:02:04.770 --> 01:02:09.450
los voy explicando. De todos modos ahí les especifica el ejercicio y qué es lo que se busca

01:02:09.450 --> 01:02:14.610
con cada uno de los análisis y qué anomalías va a encontrar o que puede contar con cada uno de

01:02:14.610 --> 01:02:18.610
los equipos de análisis. Entonces yo me estoy siguiendo esto. De todos modos esto se lo voy a

01:02:18.610 --> 01:02:24.510
entregar. Tanto el instalador, los recursos, tutoriales, que eso lo hace directamente. Bueno,

01:02:24.590 --> 01:02:28.110
eso lo va a ser Jimena, pero si alguna cosa no lo comparte ella, pues me avisa y yo con

01:02:28.110 --> 01:02:33.410
mucho gusto les comparto esa parte. No se lo olvide alguna cosa. Sigo entonces con la

01:02:34.750 --> 01:02:41.970
herramienta. Listo, entonces voy a cerrar aquí. Voy a cerrar acá, listo.

01:02:45.830 --> 01:02:50.890
Para finalizar el tema ese de las análisis estructurales, note que entonces ya le había

01:02:50.890 --> 01:02:58.450
comentado que aquí hay tres opciones, que es catálogo, esquema y connection. Al final es

01:02:58.450 --> 01:03:03.310
lo mismo, exactamente lo mismo. La única diferencia, principalmente con el esquema,

01:03:03.370 --> 01:03:07.210
porque con catálogo no conseguí decir un motor que me ayude, pero con esquema es que no

01:03:07.210 --> 01:03:11.610
lo hago a toda la base de datos, sino al esquema en particular. Pero las estadísticas

01:03:11.610 --> 01:03:15.970
que les mostré son exactamente las mismas, o sea, las que voy a mostrar. No va a cambiar

01:03:15.970 --> 01:03:20.010
en nada. Lo que te cambia es el alcance mientras connection va a ser a toda la base de datos,

01:03:20.790 --> 01:03:24.090
esquema va a ser a una parte de esa base de datos que sería el esquema que tú hayas

01:03:24.090 --> 01:03:29.070
escogido. De ahí no hay más nada. Vamos entonces a lo siguiente, vamos a cambiar,

01:03:29.170 --> 01:03:36.810
vamos a crear, ahora sí, vamos a crear una nueva carpeta ahí en AXA y la vamos a llamar

01:03:40.450 --> 01:03:47.910
columnares. O sea, vamos a hacer análisis columnares ahora. Le quedaría la estructura de esta forma,

01:03:50.510 --> 01:03:55.410
quedaría entonces, tengo análisis estructural y voy a hacer N columnares ahora, a ver si

01:03:55.410 --> 01:04:02.850
tengo alguna duda, columnares. Acto seguido entonces, vamos ya, este análisis ya es, bueno,

01:04:03.070 --> 01:04:06.830
no es tan técnico, pero a veces hay que meter cosas técnicas.

01:04:06.850 --> 01:04:14.170
Vamos a lo siguiente, se va entonces a la carpeta columnares y vamos a crear un nuevo análisis.

01:04:18.610 --> 01:04:22.530
Acto seguido, va a buscar la sección de column análisis.

01:04:26.710 --> 01:04:36.210
Y aquí hay muchos. Vamos a iniciar con el basic. Entonces vamos aquí a basic column análisis.

01:04:38.530 --> 01:04:45.630
Entonces vamos a llamar entonces, análisis, un momento, busco el ejercicio, lo deje acá,

01:04:45.870 --> 01:04:51.170
este no es, perdón, un momento, busco el ejercicio, voy a ver que es el dos, listo.

01:04:55.330 --> 01:05:04.150
Análisis columnar, nombre, análisis columnar. Customers, bueno, está en inglés la tabla,

01:05:04.150 --> 01:05:08.890
bueno, lo colocamos en español porque después decimos un ingleñol ahí. Análisis columnar,

01:05:09.030 --> 01:05:18.570
clientes, underscore chinu. Sí, sí, ese exactamente, ese exactamente. Y el nombre

01:05:18.570 --> 01:05:24.030
del análisis lo vamos a colocar como análisis columnar clientes chinu. Vamos a analizar la

01:05:24.030 --> 01:05:32.370
tabla customer. Por propósito, analizar la tabla, bueno, se llama customer en realidad.

01:05:34.150 --> 01:05:47.850
Y encontrar posibles anomalías. Entonces, ya después que tenga el nombre, el propósito y si

01:05:47.850 --> 01:05:53.730
desea pues la descripción, que sería lo más aconsejable, vamos a darle aquí entonces finish.

01:05:54.530 --> 01:06:02.550
Y debería abrir una ventana similar a la que tenemos. Cambian un par de cositas porque

01:06:02.550 --> 01:06:08.730
el tipo de análisis es un poco diferente. Note entonces que le aparecen las dos mismas

01:06:08.730 --> 01:06:15.030
pestañas, un análisis de setting y uno de resultados. Te va a cambiar un poco,

01:06:15.430 --> 01:06:19.650
los metadatas siguen siendo igual, cuando expando aquí, aquí puedo cambiar lo que yo

01:06:19.650 --> 01:06:24.070
quiera a nivel del nombre o el propósito y agregar cualquier descripción o cambiar el

01:06:24.070 --> 01:06:30.530
status si desea. Ese no es el caso. Vamos entonces a la parte de configuración de

01:06:30.530 --> 01:06:36.310
este tipo de análisis. El otro no era de esta forma. En primer lugar entonces tiene que definir

01:06:36.310 --> 01:06:40.690
la conexión. Ahora, este tipo de análisis lo puedo hacer sobre los dos metadatos que permite

01:06:40.690 --> 01:06:46.290
la herramienta. O lo hago sobre un archivo CSV o lo hago sobre archivos de base de datos,

01:06:46.470 --> 01:06:51.910
sobre conexiones de base de datos. En caso particular que te tocó analizar un JSON y

01:06:51.910 --> 01:06:55.850
vas a usar la herramienta, pues ni modo. Te toca pasar el JSON a CSV. Te toca usar el

01:06:55.850 --> 01:07:01.270
data integration o cualquier herramienta que ya tu conozcas. Ya es ni modo. Entonces,

01:07:01.490 --> 01:07:06.690
por defecto, aquí aparecen los metadatos donde dice connection. Aquí solamente aparece una,

01:07:07.070 --> 01:07:11.930
pero aquí si hubiesen varias conexiones, ya sea a bases de datos o archivos CSV,

01:07:12.090 --> 01:07:17.970
van a aparecer en este convoco de aquí. Listo. Ahora, ¿qué hay que hacer? Lo siguiente,

01:07:18.650 --> 01:07:24.370
hay que definir hacia qué tabla, como estoy conectado a una base de data, hacia qué tabla

01:07:24.370 --> 01:07:29.750
deseo el análisis. Ya en el nombre ya he dicho que le íbamos a hacer sobre customer. Entonces,

01:07:29.890 --> 01:07:38.110
vaya a donde dice select column y debería aparecerle la conexión con que está en el

01:07:38.110 --> 01:07:42.970
combo voz. Solamente debemos una, pero dependiendo de los cambios que tenga,

01:07:43.110 --> 01:07:48.630
te va a aparecer la que tú hayas escogido. Expande y te van a aparecer las estructuras,

01:07:48.630 --> 01:07:54.510
dos estructuras a nivel de tablas y a nivel de vistas. Quizás, y te voy a colocar un

01:07:54.510 --> 01:08:01.430
pequeño caso, te va a tocar recordar o por lo menos tener el conocimiento claro de cómo crear

01:08:02.150 --> 01:08:06.210
vistas y por lo menos saber cuándo debo crearlas para este tipo de análisis. Yo te

01:08:06.210 --> 01:08:11.370
voy a colocar un caso en que vas a ver, y abro comillas dobles, muy sencillamente,

01:08:11.670 --> 01:08:15.970
por qué debía crear una vista. Pero hasta el momento no hay vistas en la base de datos,

01:08:15.970 --> 01:08:21.070
solamente hay tablas, entonces expandimos tablas. Y aquí debes escoger una tabla,

01:08:21.110 --> 01:08:25.670
no puedes escoger varias, aunque sea un checkbox, te va a salir un error porque nada más tienes que

01:08:25.670 --> 01:08:32.770
coger columnas de una tabla, nada más. Aquí creo que gráficamente, como la mayoría aquí

01:08:32.770 --> 01:08:36.770
de pronto somos desarrolladores, creo que ese checkbox se equivocó, hubiese colocado mejor

01:08:36.770 --> 01:08:43.130
un radiobutton. El checkbox uno lo asocia en que va a coger varios. Acá el radiobutton,

01:08:43.130 --> 01:08:48.130
uno entiende que radiobutton, aunque a nivel de programación puede ser lo mismo,

01:08:48.590 --> 01:08:51.610
pero ya uno ni el usuario se da cuenta. Bueno, si es radiobutton es que va a coger uno,

01:08:51.690 --> 01:08:58.390
pero bueno, está así. Escojamos la tabla customer aquí, seleccione. Cuando seleccione,

01:08:58.530 --> 01:09:03.230
si no le aparecen las columnas, dele click en el nombre de la tabla, si,

01:09:03.230 --> 01:09:10.590
dele click en customer y debería aparecer las columnas. Acto seguido entonces,

01:09:10.590 --> 01:09:17.350
vamos a hacer lo siguiente. Podemos escoger todas las columnas, pero normalmente,

01:09:18.930 --> 01:09:24.210
como tú vas a ser ingeniero de datos y hay una particular contigo, es que aunque seas ingeniero

01:09:24.210 --> 01:09:30.850
de datos, al tener la tabla de datos, tú tienes un bagaje del modelo de negocio que vas

01:09:30.850 --> 01:09:38.210
a probar. Por ende, ya tú debes determinar en este punto qué columnas sería interesante

01:09:38.210 --> 01:09:45.390
de analizar. Si deseas, vamos a montar todas un momento para ver. Ya después,

01:09:45.690 --> 01:09:52.030
ya con la experiencia que tú tengas y más más, la escogencia no a nivel técnico,

01:09:52.290 --> 01:09:59.510
sino a nivel de negocio y a nivel de, digamos, de ese sexto sentido en determinar

01:09:59.510 --> 01:10:03.170
para ver cuáles columnas pueden tener problemas de calidad. Para este caso en

01:10:03.410 --> 01:10:13.150
todas, pero es claro en que en un análisis real, escoger todas puede ser muy tedioso,

01:10:13.690 --> 01:10:18.830
hay columnas que carecen significado. Por ejemplo, la columna customer ID,

01:10:19.550 --> 01:10:29.750
esa columna ya es ya de primaria. Entonces, normalmente un módulo de hacer datos te va

01:10:29.750 --> 01:10:33.670
a funcionar bien a nivel de que la de primaria, o sea, no se va a equivocar. Entonces, por

01:10:33.670 --> 01:10:37.350
ejemplo, no, que quiero verificar para ver si hay un nudo en la llave primaria. No,

01:10:37.450 --> 01:10:40.830
carece de sentido eso porque si está definida ya de primaria, a menos que sea un error de

01:10:40.830 --> 01:10:45.470
programación del motor, que creo que ninguno te lo va a hacer hoy en día, pues tendría

01:10:45.470 --> 01:10:48.230
sentido, pero hay cosas que no tienen. En este caso vamos a escoger todas, vamos a

01:10:48.230 --> 01:10:56.330
decirlo ok. Y te aparece un pequeño preview, donde ese preview, el límite del número de

01:10:56.330 --> 01:11:00.750
configuras aquí, por defecto está 50, pero tú puedes cambiar el límite que tú quieras y puede

01:11:00.750 --> 01:11:06.190
hacer de pronto una revisión de los datos como están. No te trae todos, sino hace un preview

01:11:06.190 --> 01:11:16.210
del número que tú configures. Listo, sigamos. ¿Sabes que nunca lo he probado ese límite?

01:11:20.490 --> 01:11:24.250
No, no sabría decirle, pero déjame y te investigo porque no, esa pregunta nunca me lo

01:11:24.250 --> 01:11:30.190
he hecho, pero nunca lo he investigado, pero no sé. Por ejemplo, la herramienta si tiene un par de

01:11:30.190 --> 01:11:35.210
límites, más que todo para export, pero no recuerdo que tenga un límite para el número de

01:11:35.210 --> 01:11:41.730
filas y como la cantidad de filas es bastante pequeña, carecería sentido que lo colocara

01:11:41.730 --> 01:11:46.330
un millón o dos millones porque al fin y al cabo, pues nada más hay como 250 registros,

01:11:47.570 --> 01:11:52.370
pero si deseas permíteme y te averiguo para ver si de pronto en el tutorial te

01:11:52.370 --> 01:11:58.210
especifica es un límite para eso. Quería que no, quería que no por acá en mi ignorancia por acá.

01:12:00.770 --> 01:12:07.610
Dile lo siguiente, automáticamente cuando, cuando usted escoge las columnas que puede

01:12:07.610 --> 01:12:12.790
coger las que usted quiera, él ya sabe el tipo de datos. ¿Por qué? Porque viene la tabla,

01:12:12.850 --> 01:12:16.730
entonces si te das cuenta en la parte de abajo, aquí te dice cuáles son las columnas que vas

01:12:16.730 --> 01:12:24.190
a analizar. Entonces aquí estaría, entonces aquí no te muestra dudas. Ahora configuramos esta

01:12:24.190 --> 01:12:30.250
parte. Si le das clic aquí te va a mostrar el resto de columnas. Mira aquí, da clic aquí,

01:12:30.510 --> 01:12:38.250
city, state, country y etcétera. Ahí te aparecen todas las filas. Pero aquí vamos a lo siguiente.

01:12:40.910 --> 01:12:45.950
Resulta que te había comentado también del que viene el talent data integration.

01:12:46.730 --> 01:12:52.270
Cuando tú tienes un CSV, un JSON, un XML, tú no tienes tipo de datos. Entonces él asume el

01:12:52.270 --> 01:12:57.590
tipo de datos a partir de los datos que estén ahí. ¿Qué hace él internamente? Hace lo que

01:12:57.590 --> 01:13:05.390
llama una minería de texto. Según él, pues ahí es una minería de texto. Bueno, lo que sí es

01:13:05.390 --> 01:13:11.410
seguro es que la herramienta, cuando tú despandes aquí el combo voz, te aparecen

01:13:11.410 --> 01:13:20.430
cuatro tipos de datos. Te aparece un tipo de datos nominal, interval y texto no estructurado

01:13:20.430 --> 01:13:28.270
y uno que dice others, que ese era un tipo de datos especial que se iba a sacar. Pero como

01:13:28.270 --> 01:13:36.370
la herramienta, pues no hay nuevas versiones, quedó ahí en other. Eso era como ese mismo

01:13:36.370 --> 01:13:42.090
caso de muy popular de Oracle. Oracle tiene el Varchar y el Varchar 2. Uno espera que Varchar 2

01:13:42.090 --> 01:13:46.010
dice, no, que Varchar 2 viene con un tipo especial de datos. Pero bueno, al final no sé

01:13:46.010 --> 01:13:49.570
por qué se trató de un tipo como Oracle. Pero recuerdo que cuando trabajaba en los 2000,

01:13:49.690 --> 01:13:53.850
por allá 2004-2005 por allá, esperando que el Varchar 2 fuera algo diferente,

01:13:53.930 --> 01:13:58.030
pero al final era lo mismo. Nunca dijeron que era lo diferente. Acá pues nunca vino

01:13:58.030 --> 01:14:04.290
este cambio. Debes entender entonces qué es cada uno de ellos. Entonces,

01:14:04.290 --> 01:14:10.810
para esta parte vamos a numerar los tres tipos. Entonces los tres tipos son los siguientes y es

01:14:10.810 --> 01:14:16.490
la recomendación que te da. Tienes un tipo de datos nominal. Este dato nominal lo vas a usar

01:14:17.390 --> 01:14:24.070
cuando el dato pertenece a una clase. O sea, cuando el valor del dato está en una

01:14:24.070 --> 01:14:31.550
clasificación. Forma sencilla. Por ejemplo, el clima. El clima está establecido en una

01:14:31.550 --> 01:14:39.810
clasificación, verdad? El color de una prenda. Ese color pertenece a un rango de colores que

01:14:39.810 --> 01:14:44.870
tú lo tienes clasificado. Pero entonces este nominal, hay que entenderlo, que el nominal

01:14:46.030 --> 01:14:54.050
no solamente aplica a Varchar. Un nominal aplica hacia un campo numérico también. Normalmente,

01:14:54.410 --> 01:15:01.110
cuando un campo numérico debe ser nominal, cuando el campo numérico carece de sentido,

01:15:01.110 --> 01:15:07.710
puede sacarle un promedio. ¿Cómo así? El caso típico es el de código postal. El código postal

01:15:07.710 --> 01:15:11.530
carece de sentido en que yo saque un promedio de los códigos postales de una región. Porque

01:15:11.530 --> 01:15:17.610
¿Qué hago con eso? Nada. Entonces, en realidad el código postal debería ser un campo nominal.

01:15:18.090 --> 01:15:24.050
¿Por qué? Porque ese campo como tal pertenece a un conjunto valores preestablecidos. Entonces,

01:15:24.050 --> 01:15:31.110
es un caso de decir, en pocas palabras, el nominal puede ser o Varchar o puede ser numérico.

01:15:31.170 --> 01:15:35.630
Vamos con el siguiente, que es interval. Normalmente, cómo sé cuando yo tengo un

01:15:35.630 --> 01:15:41.470
dato en que el promedio sea interesante, un lado interesante de analizar. Promedio

01:15:41.470 --> 01:15:46.970
de duración de algo. Interesante, más o menos. Este interval, hay que entender que el

01:15:46.970 --> 01:15:53.550
interval puede ser numérico o también puede ser un poco Varchar. O sea, perdón,

01:15:54.690 --> 01:16:00.710
alfanumérico. Numérico, ¿Qué puede ser? Por ejemplo, el peso. El peso de las personas.

01:16:00.830 --> 01:16:05.310
Entonces, yo puedo sacar el peso promedio de una ciudad. Podía decir entonces que,

01:16:05.470 --> 01:16:12.790
partiendo del peso promedio, hay un problema de sobrepeso de la población. Típico en Estados

01:16:13.470 --> 01:16:19.270
Unidos, Canadá, del lado de Toronto, porque más de Estados Unidos, están acostumbrados

01:16:19.270 --> 01:16:26.910
más a comida rápida. Yo creo que el caso de nosotros, los latinos, no tenemos así tanto promedio

01:16:28.130 --> 01:16:32.030
de, bueno, de obesidad comparado con los gringos, evidentemente. Entonces, te puedes

01:16:32.030 --> 01:16:35.970
sacar el dato promedio y dice, bueno, ¿En qué momento puede ser un dato alfanumérico?

01:16:36.430 --> 01:16:41.810
No, lo que pasa es que tú puedes tener de pronto algo así, guardar unos baseatos. Un día,

01:16:42.290 --> 01:16:47.890
dos semanas, y entonces aquí puedo hacer algún proceso en lo cual el promedio de eso

01:16:47.890 --> 01:16:52.170
me sirve para algo. Claro que es un, carece de sentido en que yo guardo un dato así,

01:16:52.290 --> 01:17:00.910
pero te lo encuentras. Ese carece de sentido, particularmente yo que he trabajado con

01:17:00.910 --> 01:17:08.170
diferentes países, principalmente, bueno, tengo experiencia con Estados Unidos, con Australia,

01:17:09.370 --> 01:17:14.610
con Inglaterra, aunque claro, yo no domino el inglés fluido, sino que, bueno,

01:17:14.610 --> 01:17:17.490
de la casualidad que hay unos, hay unos requerimientos que están muy claros,

01:17:18.330 --> 01:17:22.210
pero a veces uno cree que esa persona sabe más que el latino, pero en realidad no crea,

01:17:23.970 --> 01:17:28.870
no crea ese uno, esos gringos deben saberla todas, pero no, no, tú encuentras uno de

01:17:28.870 --> 01:17:32.570
errores teóricos que un estudiante de ingeniería no lo hace y te lo hace un

01:17:32.570 --> 01:17:38.710
profesional de allá. Es más, la mayor parte de esos países, por ejemplo, Estados Unidos,

01:17:38.710 --> 01:17:44.270
buscan mucho latino, porque latino tiene algo muy particular, el latino es leal,

01:17:45.810 --> 01:17:53.050
como dice que leal, el, por ejemplo, el canadiense llega a una empresa y se encuentra un trabajo

01:17:53.050 --> 01:17:59.850
que le pagan más ceba inmediatamente, el latino no, el latino sigue en esa empresa y es leal a

01:17:59.850 --> 01:18:04.390
esa empresa durante mucho tiempo y buscan el latino porque eso, y además porque si haces

01:18:04.390 --> 01:18:09.430
freelance te pagan al cambio de dinero, pues a ti te dan mucho, pero el cambio de ello,

01:18:09.530 --> 01:18:15.550
el cambio de ayer allá es poco comparado con lo que le pagan un profesional allá,

01:18:16.250 --> 01:18:20.430
pero bueno, uno encuentra una cantidad de cosas ahí sobre esta parte. Y lo último sería el texto

01:18:20.430 --> 01:18:25.910
no estructurado, por ejemplo, una descripción, pero, por ejemplo, tú puedes tener un,

01:18:27.890 --> 01:18:33.130
puedes tener una dirección y la dirección tiene una estructura, por ejemplo, supongamos

01:18:33.130 --> 01:18:37.730
que tu dirección tú la guardas como acá en Colombia, son barrio, ciudad, departamento,

01:18:37.810 --> 01:18:43.150
no sé cómo se llaman las de acá, o calle y carrera, entonces si tú tienes una estructura,

01:18:43.450 --> 01:18:47.290
entonces no es un texto no organizado, entonces lo puedes definir como nómina,

01:18:48.390 --> 01:18:52.410
pero si es texto no estructurado, donde simplemente no hay una estructura como su

01:18:52.410 --> 01:18:57.990
nombre lo dice, pues lo defines como no estructurado, la herramienta en teoría pues te

01:18:58.530 --> 01:19:05.710
clasifica, pero puede que esto te pueda cambiar algunas cosas, esto más que todo es para algo,

01:19:08.010 --> 01:19:11.230
para un proyecto que tenían ellos para esta herramienta de hacer minería textual,

01:19:11.670 --> 01:19:15.390
pero no lo alcanzaron a agregar, eso es lo que más te afecta el tipo de datos,

01:19:15.810 --> 01:19:21.130
pero hay cosas de algunos tipos de análisis en que realidad da lo mismo cómo lo coloques,

01:19:21.410 --> 01:19:26.910
porque pronto no te afecta el tipo análisis. Si intentas ejecutar actualmente el análisis,

01:19:26.910 --> 01:19:32.050
va a salir un error porque hay que definir qué es lo que quiero hacer sobre cada una de las

01:19:32.050 --> 01:19:37.770
columnas, muy pendiente a lo siguiente, cada columna que yo escoja, tengo que definir qué

01:19:37.770 --> 01:19:41.750
quiero hacer con la columna, es decir, tengo que definir el indicador que deseo,

01:19:43.310 --> 01:19:47.650
entonces el indicador lo puedes agregar a cada columna en dos partes, o lo agregas acá arriba,

01:19:47.870 --> 01:19:51.930
o lo agregas acá abajo, decide dónde desee, al final te va a mostrar ahí una ventana,

01:19:52.010 --> 01:19:55.750
dale clic por favor, y te va a mostrar esta ventana que está aquí.

01:19:58.930 --> 01:20:08.130
Seguidamente notarás que hay gran cantidad de tipos de análisis, vamos a hacer un caso para

01:20:08.130 --> 01:20:11.350
cada tipo, para que vea el alcance y lo que puedo hacer con cada uno de ellos.

01:20:12.430 --> 01:20:18.030
Vamos con el primero que es el más sencillo que se llama simple estadística,

01:20:19.990 --> 01:20:28.290
espande por favor el árbol ese, el de simple estadística, estadísticas,

01:20:29.710 --> 01:20:34.710
y vamos entonces que estadística te está presentando aquí, bueno analicemos un poco,

01:20:34.930 --> 01:20:38.430
estas son las básicas y esta es la que vas a encontrar en cualquier herramienta de análisis

01:20:38.430 --> 01:20:44.130
de datos. Primero tienes para contar el número de filas, tú dirás pero para qué sirve eso,

01:20:44.130 --> 01:20:48.110
lo que pasa es que el número de filas te va a permitir hacer proporciones, por ejemplo,

01:20:48.270 --> 01:20:52.970
proporción de nulos, proporción de datos vacíos, entonces es importante contar el número de filas.

01:20:54.890 --> 01:21:01.190
Vamos con el null con, o sea el número de valores nulos, ya te había dicho que ese es un

01:21:01.190 --> 01:21:04.710
es un problemita a nivel de base de datos si no tienes documentado por qué el valor es

01:21:04.710 --> 01:21:09.290
nulo, hay valores nulos que carecen sentido y valores que no, te coloco un caso de la

01:21:09.290 --> 01:21:15.010
cantidad, cantidad nula puede que carezca de sentido, pero de pronto tú que manejas seguro

01:21:15.010 --> 01:21:21.050
tienes un campo que se llama fecha de fallecimiento y el campo está nulo, ah es claro entonces que

01:21:21.050 --> 01:21:27.390
porque está nulo es porque el señor pues no se ha muerto, vamos de esa forma. Sigue el

01:21:27.390 --> 01:21:34.170
campo distinct count y el campo unit count, ahora que ejecute te voy a hacer las diferencias

01:21:35.210 --> 01:21:42.530
tengo la cantidad de duplicados, la cantidad de blancos y la cantidad, la cantidad ojo de

01:21:42.530 --> 01:21:48.390
elementos que tienen el valor por defecto, recordarás que a nivel de base de datos tú

01:21:48.390 --> 01:21:53.330
puedes definir un constre que se llama default, que en caso por ejemplo que la base de datos,

01:21:53.350 --> 01:21:57.970
que el campo sea nulo, tome el valor por defecto, por ejemplo, puedes configurar esa

01:21:57.970 --> 01:22:04.690
parte, a eso se refiere el default, eso para que al final termina, de pronto tú diciendo lo que

01:22:04.690 --> 01:22:08.530
pasa es que yo estoy me doy cuenta que el 90% de mi datos tiene valor por defecto, eso es

01:22:08.530 --> 01:22:13.490
netamente raro, eso es porque de pronto al digitador le está dando flujera a preguntar

01:22:13.490 --> 01:22:18.990
ese dato o quizás en la interfaz gráfica la cree muy mal y ese dato no se alcanza a

01:22:18.990 --> 01:22:23.290
ver y el señor no le pregunta y le da a guardar, bueno muchas cosas que pueden pasar con

01:22:23.290 --> 01:22:30.490
respecto a eso. Notarás entonces que esta sería esta parte y en la parte de arriba te vas a

01:22:30.490 --> 01:22:36.890
encontrar con la columna que escogiste, aquí tienes la columna customer, tienes first name,

01:22:36.970 --> 01:22:42.410
last name y vas a tener una columna por cada tipo de, por cada columna que tú escogiste,

01:22:44.790 --> 01:22:50.090
ahí está y tienes una columna que simplemente enumera, que es importante para la selección

01:22:50.090 --> 01:22:59.090
ya te digo para qué, mira lo siguiente, en primer lugar aquí tienes row com y aquí tienes

01:22:59.090 --> 01:23:08.990
varias cosas, en primer lugar si tú quieres por ejemplo contar el número de filas del customer

01:23:08.990 --> 01:23:17.230
id, entonces tú te vas aquí a customer id que es, perdón, este de aquí y le das click,

01:23:17.230 --> 01:23:23.110
eso para seleccionar un solo indicador, ese indicador aplica nada más que para esa columna

01:23:23.110 --> 01:23:30.990
customer id solamente va a contar el row com. Si tú quieres seleccionar que todas las columnas

01:23:30.990 --> 01:23:37.330
que tienes ahí vayan a contar row com, le das click donde está este espacio en blanco de aquí,

01:23:37.330 --> 01:23:40.890
al darle click aquí es coger toda la fila,

01:23:44.310 --> 01:23:53.210
se me quedó, aquí está, ahí está, se me quedó. Esto que hace, selecciona todas las

01:23:53.210 --> 01:23:57.450
filas significa que todas las columnas que están aquí, les voy a contar el row com,

01:23:57.850 --> 01:24:03.610
si quieres pues le das selección o coges de manera particular.

01:24:06.010 --> 01:24:12.750
Si quieres ahora seleccionar todos los indicadores para todas las columnas le

01:24:12.750 --> 01:24:18.770
da click en la primera columna de la primera fila, este de aquí, click aquí y eso selecciona

01:24:18.770 --> 01:24:24.170
todo. La pregunta después, tengo que seleccionar todo, no, lo que pasa es que si haces esto así

01:24:24.990 --> 01:24:30.930
el problema que vas a tener es que vas a tener mucho dato, entonces de pronto te complica

01:24:30.930 --> 01:24:38.110
más analizar muchos dados, al final tú decides que deseas hacer entonces. Para el caso particular

01:24:38.110 --> 01:24:42.610
déjala esa forma, entonces vamos a seleccionar todos los indicadores para todas las columnas,

01:24:43.790 --> 01:24:52.230
analiza algo, en el caso del default column, este que está aquí, por qué no pudo seleccionar,

01:24:52.590 --> 01:24:57.890
porque seguramente ninguna de esas columnas tiene un constrain default. Solamente se

01:24:58.140 --> 01:25:03.800
explicaría si el constrain de la columna tiene un default, si no, no aplica. Si te das cuenta,

01:25:04.280 --> 01:25:10.420
si, ah perfecto, listo, si está en esta en esta sección hay dos formas, o le das

01:25:10.420 --> 01:25:14.260
select indicator aquí abajito, o select indicator acá abajo, acá arribita,

01:25:14.420 --> 01:25:21.860
dale click por favor para ver, dale click por favor, si, listo, voy a darle click aquí,

01:25:25.340 --> 01:25:29.360
expando simple statistic y voy a seleccionar todos los indicadores para todas las columnas,

01:25:29.540 --> 01:25:34.620
como es la primera columna de la primera fila y me selecciono a todo. Les decía que el default

01:25:34.620 --> 01:25:39.460
aparece desactivado porque seguramente ninguna ninguna columna tiene constrain default y

01:25:39.460 --> 01:25:48.260
analice que el caso de simple statistic, el black count aparece desactivado para el

01:25:48.260 --> 01:25:53.720
constrain default. ¿Por qué? Porque seguramente esa columna tiene un nonnul, un nonnul que no le

01:25:53.720 --> 01:25:59.860
deja por lo menos colocar el blanco. Bueno, listo, entonces vamos a lo siguiente. Dale aquí ok por favor

01:26:03.980 --> 01:26:12.100
y espere un momento, en que al parecer está agregando los, está un poco lento, listo, vea

01:26:12.100 --> 01:26:16.980
que para cada fila le agrego un par de elementos, es decir, los indicadores que usted

01:26:16.980 --> 01:26:24.040
elegió. Si hay una fila que no se señaló, si hay una columna que no le agrega identificador,

01:26:24.180 --> 01:26:29.740
te sale un error porque todos los columnas tienen que tener a lo mucho o por lo menos

01:26:30.640 --> 01:26:35.620
un indicador. Listo, después de esto que ya he configurado los indicadores, procede el paso

01:26:35.620 --> 01:26:39.140
entonces ya a ejecutar ese análisis.

01:26:47.440 --> 01:26:52.060
Y listo, te va a generar entonces una gráfica. Vamos a analizar entonces la gráfica que nos

01:26:52.060 --> 01:26:58.980
genera. Por favor, note lo siguiente, si usted baja, puede que no alcance a ver todos los

01:26:58.980 --> 01:27:02.520
indicadores porque seleccionó muchas columnas. Si quiere ver varios, entonces en la parte de

01:27:02.520 --> 01:27:09.560
abajo puede navegar a diferentes pestañas. En la parte de abajo, listo, alto seguido,

01:27:09.620 --> 01:27:13.840
entonces vamos a hacer una parte de configuración. Quizás a usted no le gusta ver todo en esas

01:27:13.840 --> 01:27:18.200
pestañas. Quizás quiera ver todos los datos en una sola pestaña. Bueno, para esta parte

01:27:18.200 --> 01:27:32.060
entonces vamos a lo siguiente. Vaya a donde dice Windows, Preferences, Profiling, Editor.

01:27:40.320 --> 01:27:49.360
Y acá en la parte de abajo le quiere decir cuántos sitios aparecen para las pestañas

01:27:49.360 --> 01:27:55.740
de resultados. Voy a colocar aquí 15 y cuánto a nivel de reglas de negocio. A usted lo ajusta

01:27:55.740 --> 01:28:02.040
como usted quiera. De pronto a usted le gusta en diferentes páginas o le gusta

01:28:02.940 --> 01:28:09.040
y por favor vuelve a ejecutar nuevamente el análisis y debería cambiar la forma en que

01:28:09.040 --> 01:28:16.040
vas a ver los datos. Deberías verlo en una sola pestaña. Ah, perdón, creo que me toca cerrar

01:28:16.040 --> 01:28:32.020
y volver a abrir. Un momento, para que tome la configuración. Doble clic aquí. Creo que me

01:28:32.020 --> 01:28:47.980
gusta. Voy a ejecutar nuevamente. No sé si ya los muestra para ver. No, listo. Solamente

01:28:47.980 --> 01:29:02.000
es cerrar y volver a abrir. No hay que volverlo a ejecutar. Solamente es cerrar y volverlo a

01:29:02.000 --> 01:29:07.620
abrir. Es una pestaña crucial. Digamos que es la básica que en todo proyecto Nice tiene que

01:29:07.620 --> 01:29:14.800
tenerlo en cuenta por lo menos. Listo entonces. Note que para cada columna tiene una gráfica

01:29:16.260 --> 01:29:20.460
y tiene una tabla. Entonces, por ejemplo, aquí en mi pantalla estoy viendo los datos de

01:29:20.460 --> 01:29:25.340
customer ID, pero más abajito tengo lo de false name. Cada uno, cada columna va a mostrar

01:29:25.340 --> 01:29:30.200
los indicadores que usted haya seleccionado. Para este caso cogimos todos para todas las

01:29:30.200 --> 01:29:35.280
columnas. Significa que las tablas y las gráficas se van a parecer iguales a nivel de

01:29:35.280 --> 01:29:43.100
columnas de lo que va a mostrar. Vamos al caso entonces, por ejemplo, del customer ID. Acá si

01:29:43.100 --> 01:29:46.320
lo quieres ver gráficamente o a nivel de tabla, te está diciendo lo siguiente. Mira,

01:29:46.360 --> 01:29:53.920
ven acá. El número de filas que tenemos actualmente es 59. El número de registros

01:29:53.920 --> 01:30:02.140
distintos son 59 y de único son 59. Tiene sentido porque ese señor es ya de primaria.

01:30:02.460 --> 01:30:06.840
Es decir, ahí no hay ningún tipo de duplicado. Por eso decía, ahí de pronto

01:30:06.840 --> 01:30:11.420
carece sentido uno analizarla ya de primaria porque al fin y al cabo te va a dar prácticamente

01:30:11.420 --> 01:30:17.320
la misma estadística. Vamos ahora con el false name y analicemos un par de cosas entonces.

01:30:18.660 --> 01:30:25.520
False name. Mira, ven acá. Date cuenta que hay 59 registros. Listo, perfecto. ¿Cuántos nulos hay?

01:30:25.600 --> 01:30:32.700
No hay ninguno. Si tú tienes un nulo ahí, tú puedes decir, mira, te dice, mira, vamos a hacer

01:30:32.700 --> 01:30:38.540
una campaña en el cual vamos a mandarle una felicitación el día del cumpleaños a mis

01:30:38.540 --> 01:30:43.380
clientes. Si tú no tienes el false name, ya tienes un problema porque ya no podía hacer

01:30:43.380 --> 01:30:49.200
ese mensaje tan personalizado. Entonces, tú tienes que analizar cómo el nulo afecta una

01:30:49.200 --> 01:30:55.040
decisión en particular que tenga la empresa. Pero dese cuenta de algo. El número de distintos

01:30:55.040 --> 01:31:03.220
que hay, hay 56. El número de únicos hay 53 y el número de duplicados hay 3. Entonces,

01:31:03.240 --> 01:31:08.500
lo que hay que entender que llama el único, que llama distinto y cómo cuenta los duplicados.

01:31:08.500 --> 01:31:15.520
Entonces, vamos a lo siguiente. Te lo voy a mostrar acá a nivel de un archivito. Entonces,

01:31:15.560 --> 01:31:19.960
voy por aquí. Voy a abrir acá. Supongamos lo siguiente ahora. Tienes los siguientes registros.

01:31:20.280 --> 01:31:27.080
Tienes clientes. Tienes uno y tienes el nombre del cliente. Perdón, tienes el código del

01:31:29.280 --> 01:31:34.760
cliente y tienes el nombre del cliente. Tienes aquí uno y tienes el cliente, por ejemplo,

01:31:34.760 --> 01:31:42.980
que se llama Ana. Tienes dos. Tienes el cliente que se llama, por ejemplo, Alberto. Tienes

01:31:42.980 --> 01:31:49.520
tres aquí. Voy a colocar entonces Jesua que es aquí. Cuatro. Voy a repetir aquí Ana.

01:31:51.960 --> 01:31:59.800
Cinco. Voy a repetir aquí Alberto. Entonces, vamos a contar el número de row con aquí.

01:31:59.800 --> 01:32:05.440
¿Cuál sería? Pues sencillo. Sería el número de filas. En este caso, row con tuyo sería 5.

01:32:07.540 --> 01:32:16.320
El número de elementos distintos. Distintos en nombre. Entonces, ¿qué es lo que hacen

01:32:16.320 --> 01:32:22.880
internamente? Si hay duplicados, se lo cuenta una vez. Queriendo decir lo siguiente. Aquí

01:32:22.880 --> 01:32:29.180
tengo Ana. Tengo Alberto. Tengo Jesua. Lleva tres. Ana lo tengo aquí. Ya no

01:32:29.180 --> 01:32:33.540
cuento porque está duplicado. Alberto no lo vuelvo a contar porque está duplicado. Quiere

01:32:33.540 --> 01:32:39.420
decir que el número de distintos es igual a tres. O sea, en pocas palabras, cuenta los

01:32:39.420 --> 01:32:45.180
duplicados independiente del número una vez. Es decir, aquí me daba lo mismo si aquí hay un

01:32:45.180 --> 01:32:50.020
seis, por ejemplo, Ana, porque el número distinto me seguía igual. Los duplicados los

01:32:50.020 --> 01:32:54.880
cuentan a más una vez. El otro es los únicos. Para él los únicos son aquellos

01:32:54.880 --> 01:33:00.140
elementos que no tienen repetición. No tienen repetidos. Entonces, Ana no lo puedo contar

01:33:00.140 --> 01:33:05.480
porque Ana tiene una repetición en el registro cuatro. Pero puedo contar. Alberto tampoco lo

01:33:05.480 --> 01:33:12.420
puedo contar. Solamente contaría Jesua. Jesua entonces me indica que es uno. Es decir,

01:33:12.800 --> 01:33:19.520
de los registros nada más tengo uno que no se repite. Los demás se repiten. ¿Y cuántos

01:33:19.520 --> 01:33:26.680
duplicados tengo? Entonces, cuento los duplicados. Digamos, no cuento lo original. Por ejemplo,

01:33:26.720 --> 01:33:31.340
no contaría este Ana si no cuenta cuántas veces repite Ana a partir de aquí. Ana se repite

01:33:31.340 --> 01:33:37.920
una vez y Alberto una vez. Duplicados igual dos. Y de esa forma entonces es que haces el

01:33:37.920 --> 01:33:43.540
cálculo a nivel de duplicados, únicos y cada uno de los elementos. Entonces, la herramienta,

01:33:43.640 --> 01:33:48.060
mira cómo te funciona la herramienta. Vamos por acá. La herramienta te hace lo siguiente.

01:33:49.720 --> 01:33:54.440
Voy a cerrar aquí un momento para concentrarme. Aquí voy a colapsar

01:33:54.440 --> 01:34:01.020
a este señor para concentrarme en Farsen. Distinct Count. Entonces tú vas o de este lado

01:34:01.020 --> 01:34:05.900
o de este lado. Voy a ir de este lado que me parece más sencillo. En la gráfica que yo quiero

01:34:05.900 --> 01:34:09.380
analizar le doy clic derecho. En este caso quiero analizar los distintos. Click derecho.

01:34:09.460 --> 01:34:16.240
Y esta opción te dice ver los valores que son distintos. Entonces yo doy clic aquí y aquí

01:34:16.240 --> 01:34:25.980
va a aparecer. Hace una consulta contra la base de datos que está demorando y me

01:34:25.980 --> 01:34:35.360
debería aparecer los valores. Qué raro. No sé si es que está a alguno le pareció.

01:34:35.520 --> 01:34:40.040
A mí no me pareció. Qué raro. Vamos aquí a lo siguiente. Voy a ir nuevamente. Qué raro.

01:34:40.130 --> 01:34:41.890
Click derecho. Ver valores.

01:34:47.450 --> 01:34:52.690
Bueno, aquí debe aparecer. Yo creo que está ejecutando. Creo que hay un problema de memoria aquí.

01:34:57.710 --> 01:35:01.290
Alguno le apareció. Sí, hay algunos que le apareció, pero a mí no me apareció.

01:35:04.530 --> 01:35:08.930
Bueno, si coges custom ID, te debe mostrar las filas. Aquí debería mostrar las filas.

01:35:11.170 --> 01:35:17.010
Es decir, las filas las saca de esta consulta. Pero qué raro que no lo haya hecho.

01:35:20.530 --> 01:35:23.370
Sí, le muestra el nombre. Debería mostrar el nombre, pero qué raro. De pronto es que

01:35:23.370 --> 01:35:29.530
está lento. Pero voy a quitar este 5010 para ver. Está desactivado este señor que está acá.

01:35:29.930 --> 01:35:34.270
Eso sí es sumamente raro. Voy a ser al ingeniero. Voy a cerrar este señor de acá.

01:35:36.030 --> 01:35:44.350
Y voy a volver a abrir aquí. Intentar ver las filas que son, en este caso los valores que

01:35:44.350 --> 01:35:50.950
son distintos. Veo que está funcionando muy lento. Voy aquí nuevamente.

01:35:55.470 --> 01:35:56.910
La fila que vamos a escoger es first name.

01:35:59.910 --> 01:36:09.230
De este señor, clic derecho, ver valores. Bueno, aquí no sé qué raro. Voy a intentar

01:36:09.230 --> 01:36:13.790
ejecutar nuevamente el análisis para ver si de pronto ahí cambia.

01:36:17.510 --> 01:36:20.990
First name es que está muy lento también para subir las gráficas.

01:36:23.710 --> 01:36:26.230
Me va a tocar subir memoria aquí a esta máquina virtual para ver.

01:36:28.130 --> 01:36:30.910
Bueno, aquí está, clic derecho, ver valores.

01:36:34.230 --> 01:36:38.990
Esta consulta que está aquí es la que debería sacar para mostrarme los valores. Aquí debería

01:36:38.990 --> 01:36:46.750
mostrármelo, pero aclaro que no sé por qué no lo hace. No le veo ningún error aquí. Voy a

01:36:46.750 --> 01:36:52.130
dejarlo aquí abierto entonces por si acaso. Bueno, sigo entonces de todo modo. Ahí no sé,

01:36:52.130 --> 01:36:57.030
tengo que analizar más internamente qué pasó aquí. Aquí también puedo hacer los

01:36:57.030 --> 01:37:02.330
ver valores y aquí esta opción me permite ver los valores y la fila completa. Voy a cambiar

01:37:02.330 --> 01:37:09.830
valores por View Rows para ver si una muestra. Tampoco me la está mostrando a ninguno de las

01:37:09.830 --> 01:37:13.590
muestras. Bueno, a alguno de las muestras, ¿Verdad? Creo que el único que no las muestra es a mí.

01:37:16.110 --> 01:37:18.210
Sí, bueno, tengo que analizar qué pasó con el caso mío.

01:37:20.370 --> 01:37:25.250
Listo, miren, entonces aquí esto es para todos. Vamos entonces, vamos a analizar un poco. Voy a

01:37:25.250 --> 01:37:33.310
buscar columna interesante. Voy a buscar la columna, por ejemplo, del postal code. Por favor,

01:37:33.550 --> 01:37:44.850
busque entonces la columna postal code. Postal code. Creo que aquí está postal code. Vamos a ver.

01:37:49.150 --> 01:37:56.190
Aquí está postal code. Por ejemplo, digamos que tú quieres mandar unos paquetes. Digamos que tú

01:37:56.190 --> 01:38:03.350
empieces de paquetes. Si te das cuenta, el postal code tiene cuatro, tiene cuatro columnas,

01:38:04.010 --> 01:38:08.670
en cuatro regitos en que la columna es nulo. Entonces ahí vas a tener un problema porque

01:38:08.670 --> 01:38:14.130
quizás a esas cuatro personas no le va a llegar lo que tú decías mandar. Si tú le das,

01:38:14.130 --> 01:38:21.710
normalmente le das click aquí. Bureau. Debería, bueno, mostrar también. No sé por qué no debe

01:38:21.710 --> 01:38:27.550
mostrar. Me va a mostrar las filas en las cuales ese señor es nulo. Ahí quizás tú mandas

01:38:27.550 --> 01:38:32.430
un reporte de análisis a decir que esa columna está nula y ver para ver cómo hacemos para

01:38:32.430 --> 01:38:40.450
llenar de datos esa parte. Llenar datos puedes hacerlo con curación social. Básicamente en

01:38:40.450 --> 01:38:44.650
esta curación social lo que tú haces es que le ayudas a alguien que sabe de negocio a que

01:38:44.650 --> 01:38:51.050
te ayude a completar los datos. Vamos a buscar por ejemplo la de correo. Bueno, aquí tengo

01:38:51.050 --> 01:38:56.070
city y digamos que cada una puede tener un contexto diferente. Date cuenta lo siguiente,

01:38:56.410 --> 01:39:10.430
solamente tienes, por lo menos tienes diez, diez registros en los cuales hay clientes que

01:39:10.430 --> 01:39:15.390
estado, por ejemplo, lo que tienes tienen que tus clientes, por lo que está diciendo la gráfica,

01:39:16.570 --> 01:39:20.350
es que hay cuatro, bueno cuatro duplicados, pues significa que hay cuatro registros que

01:39:20.350 --> 01:39:25.030
están a nivel, al final terminas ocho clientes que puede estar viviendo en la misma región.

01:39:25.770 --> 01:39:31.230
Voy a buscar entonces al final la que me interesaba que era el de el de teléfono,

01:39:31.230 --> 01:39:37.070
el de perdón, el de email, mira el de email, búsquete de email.

01:39:40.550 --> 01:39:46.890
Email te está diciendo, por ejemplo, en que ahora todos los correos que tienes ahí son

01:39:46.890 --> 01:39:54.610
diferentes y digamos si tú estás pensando en que tu user ID sea un correo electrónico y

01:39:54.610 --> 01:40:00.010
aparece uno que está duplicado, epa es una alarma, tengo dos clientes con el mismo correo,

01:40:00.010 --> 01:40:04.830
está sumamente raro. En este caso, supongamos que tú tienes una aplicación en el cual

01:40:05.350 --> 01:40:09.970
tengas el correo como user ID, significa que cada usuario tiene un correo diferente y es lo

01:40:09.970 --> 01:40:16.870
que debería ser. Búsquete por ejemplo phone, teléfono, ¿cómo estamos a nivel de teléfono

01:40:16.870 --> 01:40:22.270
para ver si hago campañas de mercadeo por teléfono? Creo que lo pasé. Se llama phone,

01:40:22.270 --> 01:40:31.610
ese fax se envió y eso no se usa. Por ejemplo, phone me está diciendo y voy a leerlo ahora

01:40:31.610 --> 01:40:39.730
a nivel de porcentaje, me dice que el 1.79% de los datos en total son nulos. En pocas palabras,

01:40:39.970 --> 01:40:46.170
si hablamos a nivel de cantidad, tengo un cliente en el cual no tengo su teléfono. Por

01:40:46.170 --> 01:40:51.930
ende, activar una campaña de mercadeo lo que puede llevar es que el 1% de esas personas que

01:40:51.930 --> 01:40:58.270
están como clientes míos no le llegue como tal ese mensaje. Y de esa forma entonces es que

01:40:58.270 --> 01:41:02.970
empiezas a analizar cada uno de los aspectos que le toca entonces. Normalmente la herramienta,

01:41:02.990 --> 01:41:08.150
así como está, si es que la vas a usar, vas a hacer entonces dos cosas. Una cosa es

01:41:08.150 --> 01:41:13.510
a detectar anomalía y otra cosa es documentar anomalía. En el caso particular de que tú

01:41:13.510 --> 01:41:18.150
no seas el ingeniero de datos o la persona encargada de solucionar la limpieza, te

01:41:18.150 --> 01:41:22.270
tocaría mandar ese reporte al ingeniero correspondiente para que solucione la anomalía

01:41:22.270 --> 01:41:28.770
como tal. Listo, y esto entonces lo puedes ver. Puedes analizar entonces ahí varias cosas.

01:41:30.630 --> 01:41:36.690
Listo, entonces vamos a hacer otro pequeño análisis, pero voy a restringirlo para que se

01:41:36.690 --> 01:41:47.530
vea mucho mejor, para que le queden los dos ejemplos entonces. Quiero activar una regla de

01:41:48.310 --> 01:41:53.030
negocio. Entonces aquí la estás visualizando, pero de grados que tú quieras. Oye, venga acá,

01:41:53.430 --> 01:42:00.490
si los nulos están por encima del 10%, por favor, activen una alerta. Y con esa alerta,

01:42:00.610 --> 01:42:05.490
pues ya yo es más fácil visualizar. No me toca ir gráfica por gráfica y ver para ver que está

01:42:05.490 --> 01:42:10.290
pasando. Entonces para esto voy a hacer lo siguiente. Entonces vamos a crear aquí,

01:42:11.170 --> 01:42:12.510
cerremos este señor de acá.

01:42:17.530 --> 01:42:26.590
Cerremos este señor de acá. Y ahora, sí, dígame. Liliana me dio, ¿verdad? Sí, me dio Liliana.

01:42:28.250 --> 01:42:38.650
OK, así. Normalmente esto es clic en análisis colundar, pero en el análisis. No en la carapela,

01:42:38.730 --> 01:42:46.970
doble clic ahí, perfecto. Ahora, váyase donde está la casita de la barra del menú.

01:42:48.610 --> 01:42:56.130
Spanda ahí, dele clic. Y ahora dele doble clic donde dice DQ Repositorio. Ahí dice, en la parte

01:42:56.130 --> 01:43:02.690
de arriba, DQ Repositorio. En la parte de arriba del menú, más arriba. Ahí está la casita,

01:43:02.950 --> 01:43:09.190
doble clic. Dere nuevamente doble clic. Esto es de clic C. En final, normalmente doble

01:43:09.190 --> 01:43:16.070
clic para expandir y doble clic para dejar como está. Bueno, hagamos entonces lo siguiente

01:43:16.070 --> 01:43:28.270
ahora. Voy a crear análisis colundar. Vamos a colocar aquí un basic column. Y coloque

01:43:28.270 --> 01:43:39.830
lo siguiente entonces. Análisis. ¿Era con qué? ¿Con font o con fax? Dejé de ver el ejemplo

01:43:39.830 --> 01:43:48.250
para ver. Bueno, análisis, colundar. El fax que ya casi no lo usan, pero bueno, colundar,

01:43:48.910 --> 01:44:00.190
fax. Voy a colocar al final alerta. Propósito, generar, generar. Aquí se me fue el enter. Voy

01:44:00.190 --> 01:44:13.010
a cambiarlo entonces aquí. Generar una alerta de cumplimiento para el fax. La columna fax,

01:44:14.410 --> 01:44:26.430
perdón. Sí, lo terminé ahí porque sí, básico. Sí, señor. Efectivamente, así

01:44:26.430 --> 01:44:31.130
como te dice. Listo. Ya después que terminaste aquí, entonces debe quedar más o menos así.

01:44:31.370 --> 01:44:36.130
La pestaña. La conexión sigue siendo la misma. Vamos a escoger la misma tabla,

01:44:36.170 --> 01:44:39.910
pero no vamos a escoger nada más una sola columna, la de fax. Se voy aquí a select column.

01:44:42.930 --> 01:44:49.750
Voy entonces aquí donde dice tabla. Y voy entonces donde dice la tabla que se llama customer

01:44:49.750 --> 01:44:58.710
y voy a escoger fax. Perdón, selecciono aquí. Ya seleccioné. Nada más. Nada más una columna.

01:44:59.690 --> 01:45:06.470
Le damos aquí, ok. Si intento ejecutar esto que está aquí, por ejemplo, intento ejecutar

01:45:07.130 --> 01:45:13.670
aquí. Dice, hay un error, ¿por qué? Porque todavía no le ha asignado un indicador a la

01:45:13.670 --> 01:45:17.110
columna. Todas las columnas en una análisis tienen que tener por lo menos un indicador.

01:45:18.010 --> 01:45:21.330
Listo, entonces ahora aquí lo que voy a hacer lo siguiente es select indicator

01:45:24.170 --> 01:45:31.130
y voy a escoger todo lo de simple, esta indica simple. Simplemente le doy click aquí y para

01:45:31.130 --> 01:45:37.610
esa columna van a aplicar todos esos indicadores. Damos entonces aquí, ok.

01:45:38.590 --> 01:45:42.610
Y te voy a agregar entonces cuáles son los indicadores que tú escogiste aquí.

01:45:44.070 --> 01:45:49.790
Si deseas, vamos para ver, para decirte entonces, porque normalmente estos indicadores o estas alertas

01:45:49.790 --> 01:45:56.110
que tú vas a colocar, se las vas a configurar según el estándar de calidad que tengas en tu

01:45:56.110 --> 01:46:00.310
empresa. Normalmente, como te he dicho varias veces, lo hacen de gobierno de datos. Él

01:46:00.310 --> 01:46:05.010
decide qué elementos mínimos tienen que existir en los datos para definir que son de calidad,

01:46:05.570 --> 01:46:10.970
ok. Entonces ejecuta inicialmente aquí por favor, te voy a pasar solamente una gráfica.

01:46:17.890 --> 01:46:23.710
Bueno y aquí la configuración ya viene un tipo sí, más o menos. Mira lo siguiente, a ti te dicen,

01:46:23.710 --> 01:46:35.470
mira, si la cantidad de datos nulos supera los 40, entonces hazme el favor y manda una alerta.

01:46:36.550 --> 01:46:42.990
Bueno, perdón, mandar no, muestra una alerta. Ah, ok, listo. Significa, date cuenta aquí que

01:46:42.990 --> 01:46:50.010
tengo null cone que es 47. Si está por encima de esto significa entonces que debo decir,

01:46:50.010 --> 01:46:56.290
hay un problema, hay que revisarlo. Esos datos no pasan, no pasan la calidad. Ah,

01:46:56.310 --> 01:47:01.030
listo, entonces ¿cómo hacemos eso? Listo, ya tú sabes porque el departamento de gobierno

01:47:01.030 --> 01:47:08.530
de datos te definió esa calidad. Vas aquí entonces, análisis setting y aquí en el

01:47:08.530 --> 01:47:13.710
elemento que tú quieres alertar, lo buscas. En este caso quiero los null cone. Le das

01:47:13.710 --> 01:47:24.750
doble clic por favor y te va a aparecer una pequeña ventanita. Y aquí la ventana te permite

01:47:24.750 --> 01:47:32.290
generar alertas ya sea por cantidad o por porcentaje. Aclaro que la mejor forma es

01:47:32.290 --> 01:47:37.510
por porcentaje. ¿Por qué? Porque normalmente pues la mayoría se coge por el porcentaje,

01:47:37.570 --> 01:47:41.210
no por la cantidad, la proporción de datos que cumplan o no cumplan algo. Entonces

01:47:41.210 --> 01:47:48.730
normalmente la mayoría te coge porcentaje. Pero quizás, quizás, quizás de pronto te toque

01:47:48.730 --> 01:47:53.730
por cantidad. Entonces vamos a hacer los dos ejemplos. Primer ejemplo, entonces mira que está

01:47:53.730 --> 01:47:58.910
acá. Aquí las alertas las disparas ¿cómo? Si cumplen la condición que está por debajo o

01:47:58.910 --> 01:48:05.670
que está por encima. Entonces voy a generar la alerta por encima. Es decir, si está por

01:48:05.670 --> 01:48:10.750
encima de cuarenta significa que me debe mostrar una alerta. Esto es un sí, sí, no. Si está por

01:48:10.750 --> 01:48:18.710
encima de cuarenta, vamos a darle aquí finish en uppers por encima. Perfecto, perfecto, listo.

01:48:19.590 --> 01:48:22.870
Date cuenta que acá tienes los diferentes columnas entre los diferentes indicadores,

01:48:23.470 --> 01:48:27.470
¿Verdad? En este caso quiero generar alerta por el null cone. Dale doble clic aquí en

01:48:27.470 --> 01:48:34.470
el engranaje null cone, doble clic y te va a aparecer entonces esta esta interfaz. ¿Sí

01:48:34.470 --> 01:48:39.530
te apareció? Ahí está. Listo, en este caso entonces tú disparas la alerta si está por

01:48:39.530 --> 01:48:45.570
debajo o si está por encima. Vuelvo, repito, no depende de ti porque tú no eres el que sabe

01:48:45.570 --> 01:48:50.230
los datos, tú eres el que los procesas, tú eres el que los verificas, no depende de ti.

01:48:50.550 --> 01:48:56.210
Si te tocó pues ni modo. Aquí en Colombia le decimos todero. Todero es que te toca

01:48:56.210 --> 01:49:03.090
hacer de todo en la verita empresa. Bueno, aquí entonces en el upper vamos a colocar cuarenta,

01:49:03.090 --> 01:49:10.110
ya lo había colocado pero lo borré. Vamos a darle finish y por favor ejecuta porque creo

01:49:10.110 --> 01:49:14.570
que esto no actualiza porque me tocaría nuevamente ejecutar el análisis. Ah no,

01:49:14.850 --> 01:49:19.750
automáticamente ya estaba ejecutado, no hay que volverlo a ejecutar. Si te marca y date cuenta

01:49:19.750 --> 01:49:31.450
que te marcó, te marcó un cuarenta y siete ahí. ¿Qué va a pasar? En que tú llevarías

01:49:31.450 --> 01:49:38.510
si tú no eres el de limpieza, te tocaría hacer un informe y mandárselo de la limpieza. El de

01:49:38.510 --> 01:49:43.990
limpieza soluciona el problema y tú vuelves a ejecutar con los nuevos datos para ver si pasó

01:49:43.990 --> 01:49:49.850
el umbral de calidad. Si lo pasó pues perfecto, si no pasó pues reenvía nuevamente el

01:49:49.850 --> 01:50:01.430
comunicado diciendo oye todavía esos datos no cumplen el umbral que tiene que ser mayor a

01:50:02.770 --> 01:50:08.930
alerta si el número de únicos es menor a 10. Entonces primero ¿cómo se hace? Oh ya tú sabes

01:50:08.930 --> 01:50:12.910
porque te identifica el número único menor a 10. Entonces me voy aquí al setting,

01:50:15.750 --> 01:50:21.870
voy a Unicom que es donde quiero la alerta y digo oye ven acá dame un favor si tú eres

01:50:21.870 --> 01:50:29.670
menor a 10 por favor, aquí en la pestaña menor a 10, por favor dispara y colócame una

01:50:29.670 --> 01:50:37.350
alerta para saber que no cumple con la condición de calidad. Le das aquí finish perfecto aquí

01:50:39.050 --> 01:50:43.810
y listo. Entonces vas por acá y la pregunta del millón es ¿Será que debe aparecer o no debe

01:50:43.810 --> 01:50:53.190
aparecer? ¿Será que aparece o no aparece? Menor a 10, no debería porque la condición

01:50:53.190 --> 01:50:59.050
estoy en 12 y solamente se dispara si la condición es menor a 10. Hagamos ahora por

01:50:59.050 --> 01:51:06.210
porcentaje y ayúdenme en esa parte. Quiero que el número de duplicados sea cero,

01:51:06.510 --> 01:51:14.170
que el número de duplicados sea cero, o sea si es decir que el 100% de los datos no

01:51:14.170 --> 01:51:23.170
tenga ningún duplicado. Pero porcentaje ¿Cómo lo haríamos? ¿Cómo se lo ocurre? Si lo

01:51:23.170 --> 01:51:27.710
ocurre, tú quieres que el 100% de tus datos cumplan y que no haya ningún duplicado o sea que

01:51:27.710 --> 01:51:33.230
si está por encima de cero entonces el alerta tiene que dispararse. Entonces aquí muy bien,

01:51:33.510 --> 01:51:39.150
no sé quién respondió pero excelente. Entonces aquí tengo duplicate con y yo digo ven acá lo

01:51:39.150 --> 01:51:43.850
que hace como porcentaje o que también funcionaba con cantidad. Yo digo oye ven acá

01:51:43.850 --> 01:51:48.390
si esto está por encima del cero por ciento mandame una alerta porque eso no es lo que

01:51:48.390 --> 01:51:57.950
yo pedí a nivel de calidad. Y vas acá entonces y ahí lo tienes y ahora te lo muestra el porcentaje.

01:52:00.870 --> 01:52:04.490
Bueno al final es un juego de decir si no, si es mayor o si es menor para que te dispare o

01:52:04.490 --> 01:52:12.510
no te dispare. Normalmente la mayoría se da por proporción, casi raro que alguien se

01:52:12.510 --> 01:52:19.550
da por cantidad. Porque la proporción es mejor. Estadísticamente es mucho mejor. No mayor,

01:52:19.910 --> 01:52:25.550
buena pregunta, no no tiene igual. O sea mayor. Ya que se nota que somos programadores.

01:52:30.670 --> 01:52:35.810
Vamos entonces a hacer lo siguiente, vamos a cambiar un poco de de tablas,

01:52:35.910 --> 01:52:40.390
vamos a hacer el mismo. Pero analicemos a ver qué puede usted encontrar dependiendo de

01:52:40.390 --> 01:52:50.690
estas cosas. Por ejemplo, un nombre duplicado quizás no es tan relevante para ti. Porque es

01:52:50.690 --> 01:52:55.990
común en que los nombres se encuentren duplicados. Eso es lo más común que hay. Pero entonces

01:52:55.990 --> 01:52:59.770
vamos a hacer lo siguiente ahora. Vamos a crear un nuevo análisis columnar pero lo vamos a

01:52:59.770 --> 01:53:11.410
hacer sobre la tabla, ya le digo cuál. Lo que es album. No, un momento. Este de aquí. No, es track.

01:53:16.130 --> 01:53:24.030
Listo, vamos con lo siguiente entonces. Vamos a hacer un nuevo análisis columnar por favor y

01:53:24.030 --> 01:53:30.190
vamos a escoger la sobre la la la tabla que se llama track que sea pista o canción en inglés.

01:53:33.390 --> 01:53:39.870
Acá pista normalmente llaman pista de baile. Pista donde usted va a la discoteca y y baila

01:53:39.870 --> 01:53:45.230
ahí, entonces lo llaman pista. Pero en otros países creo que la pista la llaman en la

01:53:45.230 --> 01:53:49.550
canción como tal. Bueno, y la edad nuevamente sigue siendo columnar.

01:53:51.990 --> 01:54:00.510
Next. Listo. Y entonces en este análisis que está aquí voy a colocar análisis columnar.

01:54:03.550 --> 01:54:06.630
Track. Bueno, aquí voy a colocarlo en inglés. Track.

01:54:07.230 --> 01:54:15.190
Y no. Propósito entonces analizar los.

01:54:18.390 --> 01:54:29.630
Sí, sí, basic. Todo lo que estamos haciendo son basic column. Analizar los nombres de canciones

01:54:35.740 --> 01:54:43.840
y duplicados y perdón y compositores. Te pidieron hacer ese análisis. Hay análisis

01:54:43.840 --> 01:54:48.300
que te pueden llevar a hacer que quizás el gobierno no lo tiene claro en definir.

01:54:49.120 --> 01:54:55.320
Entonces te puede hacer una una una tarea de rastreo. Es típica. Aclaro que este perfil

01:54:55.320 --> 01:55:00.180
de de todo lo que tenga que ver datos es un perfil de una persona que es curiosa,

01:55:00.300 --> 01:55:05.200
está muy pendiente de los detalles, se da cuenta cuando lee un texto que si falta una

01:55:05.200 --> 01:55:11.060
coma o no falta una coma. Vean, yo hice un que también es una habilidad que tiene que

01:55:11.060 --> 01:55:15.840
tener tester. Últimamente las empresas lo que están haciendo es que le colocan

01:55:15.840 --> 01:55:24.420
un examen de verdad de exames técnicos, pero se los compran otra empresa. Y para ser

01:55:24.420 --> 01:55:29.840
tester, ustedes te colocan, por ejemplo, ok, te colocan dos frases. Ahí es la cantidad de

01:55:29.840 --> 01:55:35.420
diferencias que hay en dos frases. Mi hermano, si tú estás mal de la vista. Esa de ser lo vas

01:55:35.420 --> 01:55:40.000
a perder ese examen. No hay que le falte una coma, hay dos espacios blancos que están

01:55:40.000 --> 01:55:46.740
pegados. Pero bueno, ese es el perfil normalmente. Le damos finish aquí. Por favor. Y vamos

01:55:46.740 --> 01:55:52.740
ahora a hacer lo mismo, pero vamos a escoger, vamos a ver si lo memorizamos. No lo voy a

01:55:52.740 --> 01:55:57.520
decir yo. Si se queda, después lo hago. Bueno, hágalo para intentarlo hacer. Intente escoger

01:55:57.520 --> 01:56:03.340
la tabla track y va a escoger dos columnas, una que se llama name y una que se llama

01:56:03.340 --> 01:56:08.920
compositor. Compositor, creo que no acuerdo con eso. Y después agregue todos los

01:56:08.920 --> 01:56:17.580
indicadores a esa, a esa columna. Si no se acuerdan, entonces me siga a mí. Seleccólo,

01:56:19.120 --> 01:56:28.420
expando y busco la tabla que me interesa que se llama track. Selecciono aquí y voy

01:56:28.420 --> 01:56:36.640
a seleccionar aquí compositor y el nombre de la pieza. Creamos un nuevo análisis,

01:56:36.700 --> 01:56:43.940
ya lo hizo. Vamos a desear la tabla track. Sí lo creo. Listo. Seguidamente entonces

01:56:43.940 --> 01:56:50.040
vamos a escoger la tabla, las columnas compositor y name de la tabla track, que es la que quiero

01:56:50.040 --> 01:56:53.600
analizar. A modo informativo, recuerden que no puedo hacer análisis sobre dos

01:56:53.600 --> 01:56:56.380
talas diferentes, o sea, columnas que tengan dos talas diferentes. No lo puedo hacer.

01:56:57.740 --> 01:57:01.880
Es un limitante que tiene herramienta y creo que, pues, tampoco tiene mucho sentido

01:57:01.880 --> 01:57:07.160
de pronto ver ese análisis. Si hay un, bueno, estos colunares, pero si hay análisis en que

01:57:07.160 --> 01:57:12.060
puedo hacer un cross table, ya lo voy a mostrar que es sumamente interesante y más

01:57:12.060 --> 01:57:17.360
específicamente cuando tenga referencias. Es sumamente interesante. Veamos, ok, aquí.

01:57:20.240 --> 01:57:29.020
En la tabla me perdí un momentito. ¿Quién me habló, Liana? Analizadis. Ahí debes

01:57:29.020 --> 01:57:34.560
escoger la conexión, pero la conexión no. Esa es una forma de hacerlo, pero ya lo tiene

01:57:34.560 --> 01:57:41.520
este lado ya. Del lado donde tiene ahí el mouse, escoja select columns, escoja la tabla

01:57:41.520 --> 01:57:46.380
y la forma en que usted lo hacía es directamente con la tabla, que también me da lo mismo. Y ahí,

01:57:46.560 --> 01:57:51.200
por favor, seleccione nada más. Creo que deseleccione track mejor primero y ahora

01:57:51.200 --> 01:57:57.760
seleccione nada más, que salía más rápido. Seleccione ahora composer y name, que es lo que

01:57:57.760 --> 01:58:04.120
quiero analizar. Ahora, por favor, después que de ok, seleccione todos los indicadores para

01:58:04.120 --> 01:58:16.980
esas dos columnas. En simple statistic, si quiere la expande y aquí puede escoger los dos.

01:58:17.920 --> 01:58:25.000
Vamos a darle entonces aquí ok. Vamos a darle aquí entonces ya tengo la configuración que

01:58:25.000 --> 01:58:38.440
tengo. Voy a darle aquí room. Listo. El caso de Jesu, ¿Qué te pasó? Muestra a Jesu.

01:58:39.860 --> 01:58:45.000
Ah, te faltó escoger los indicadores. Dale en select indicator, Jesu. Select indicator. Listo.

01:58:45.620 --> 01:58:50.680
Expande. A ver, te faltó los indicadores para la columna 2. Si quieres, le da click

01:58:50.680 --> 01:58:57.540
a eso ahí. Perfecto. Porque desde por lo menos uno. Listo. Y dese cuenta que aquí vienen unos

01:58:57.540 --> 01:59:03.940
casos que preocupan entonces, por lo menos. Entonces, usted pensaría, bueno,

01:59:05.480 --> 01:59:12.160
tengo un par de problemas aquí. Tengo 978 canciones que no tienen compositor.

01:59:14.300 --> 01:59:18.540
Y eso puede ser un problema legal, más que todo, por ejemplo, en este caso del país.

01:59:18.540 --> 01:59:23.840
Porque normalmente cuando usted vende música, usted tiene que darle regalías a la persona que

01:59:23.840 --> 01:59:27.680
es dueña de la canción y a otra persona, bueno, un conjunto de personas. A los músicos que

01:59:27.680 --> 01:59:33.940
participaron en eso. Pero de entrada ya hay una inconsistencia con respecto a eso porque me

01:59:33.940 --> 01:59:38.720
encuentro que hay canciones que no tienen compositor. Sí sé que hay unas canciones que

01:59:38.720 --> 01:59:43.520
de pronto ya son más en el mercado de la música que de pronto son anónimas. Pero ahí,

01:59:43.720 --> 01:59:47.400
cuando son anónimas, normalmente se les debe pagar el Estado. En el caso de Colombia,

01:59:47.400 --> 01:59:51.220
no sé en otros países cómo será. Si usted quiere, bueno, esperemos que me muestra ahora aquí.

01:59:51.360 --> 01:59:58.020
Voy a ver las filas que están en nulas. Y no aclaro, no sé por qué aquí no me está

01:59:58.020 --> 02:00:03.260
mostrando esta parte ahora. Ahora reinicio la herramienta para ver qué pasó. Por favor,

02:00:03.460 --> 02:00:17.380
vea, narice. No, no me da. No, aquí hay algún problema de actualización, no sé. Es

02:00:17.380 --> 02:00:25.540
no nada. Bueno, vamos para ver entonces. Ahora, aquí yo podría entonces qué hacer, sacar los

02:00:25.540 --> 02:00:30.800
nombres de canciones. Y aquí hay algo en particular. Voy a tomar aquí la imagen de

02:00:30.800 --> 02:00:36.420
alguien porque no me sale. Mira cómo sería en este caso. Voy a, Antonio, atribuidamente voy a

02:00:36.420 --> 02:00:42.480
mostrar tú en pantalla. En este caso está mostrando cuáles de esas filas no tienen

02:00:42.480 --> 02:00:46.900
compositores. Están compositores nulos. Ahí le aparece null. Entonces, si esto es preocupante

02:00:46.900 --> 02:00:51.980
para ti, lo máximo que podías hacer es un, digamos, un reporte diciéndole mira, averíguate

02:00:51.980 --> 02:00:56.760
por qué estas canciones no están en null. Entonces, aquí la herramienta tiene un pequeño

02:00:56.760 --> 02:01:01.560
limitante porque es open source. Antonio, si ya le das clic derecho sobre la posición en

02:01:01.560 --> 02:01:05.180
que está el mouse, por favor. Y ahí hay un export, por favor, dale clic derecho.

02:01:07.360 --> 02:01:11.620
Ahí en la tabla esa, por favor, clic derecho. No está apareciendo. Clip derecho,

02:01:11.620 --> 02:01:17.840
no. No te aparece ahí una sesión que dice export, no. Ah, listo. Ahí te dice export. Dale donde

02:01:17.840 --> 02:01:24.380
dice export. Ahí lo puedes exportar a diferentes formatos. Escoge SSV que es el más, uno de los

02:01:24.380 --> 02:01:28.280
más usados, por favor. SSV, el primero. Aquí puedes hacer la configuración si quieres

02:01:28.280 --> 02:01:32.420
hider cuál es de pronto el carácter de separación que tú quieres. Escoge, por favor,

02:01:32.640 --> 02:01:35.960
la ubicación y el nombre del export para decir cuál es el problema que vas a tener.

02:01:35.960 --> 02:01:38.940
¿Quieres? Colócalo en, no sé, en cualquier ubicación del disco.

02:01:41.980 --> 02:01:46.100
Bueno, le adelanto. El limitante de la herramienta es que solamente le permite,

02:01:46.920 --> 02:01:52.880
creo que 50 filas. 50 filas. La herramienta, pues, entre el país no lo permite. Ahora,

02:01:55.240 --> 02:01:59.680
eso es un limitante para ti, para tu informe. Si se da cuenta, la herramienta, lo que le

02:01:59.680 --> 02:02:04.580
está mostrando en la parte de arriba es la consulta SQL que sacó para poder tomar los

02:02:04.580 --> 02:02:09.940
datos. Entonces, ¿qué deberías hacer? Dale safe ahí. Bueno, cuando puedas, le das safe. Y listo,

02:02:09.940 --> 02:02:12.640
le das ok. ¿Qué puedes hacer? Si se da cuenta, la parte de arriba está usada el

02:02:12.640 --> 02:02:16.480
carterisco. Entonces, tú puedes tomar la consulta y la llevas a la base de datos y

02:02:16.480 --> 02:02:19.920
sacas los registros y haces un export directamente en la base de datos porque ahí no vas a tener

02:02:19.920 --> 02:02:24.320
problemas del limitantes. Si es el caso, ese es la consulta y la llevas a la base de

02:02:24.320 --> 02:02:29.140
datos y me da. Esa consulta es sumamente sencilla, no hay ningún problema. Si quieres,

02:02:29.140 --> 02:02:34.620
nuevamente al análisis, por favor, análisis colunar ese que está ahí. Vamos a analizar

02:02:34.620 --> 02:02:39.720
algo, por ejemplo, con respecto a los nombres. Me doy cuenta en que hay nombres que están

02:02:40.600 --> 02:02:48.500
repetidos. Hay 206, pero sería 512. O sea, aparece por lo menos dos veces lo que aparece

02:02:48.500 --> 02:02:54.680
ahí. Si tú le das clic derecho, dame el favor, clic derecho, ver valores inicialmente. Ese

02:02:54.680 --> 02:02:59.500
valor es lo que voy a mostrar. ¿Cuáles son? Las que están repetidas. Entonces dice Angel

02:02:59.500 --> 02:03:03.820
Perfect está repetida, pero bueno, para hacer un análisis más profundo, por lo menos puede

02:03:03.820 --> 02:03:11.480
que la canción sea igual, pero que el álbum sea diferente. Entonces, ¿qué pasa? Puedo hacer

02:03:11.480 --> 02:03:15.500
un análisis a nivel de analizar la canción con el álbum. Vete entonces al análisis de

02:03:15.500 --> 02:03:21.260
Columns, por favor, análisis nuevamente, análisis nuevamente y dale clic derecho en

02:03:21.260 --> 02:03:27.620
el álbum, por favor. Y ahora muestra la fila completa. Deschulea, por favor, el limit row

02:03:27.620 --> 02:03:31.800
que aparece en cien porque hay doscientos y dice no, va a ser limit row, en la parte de

02:03:31.800 --> 02:03:38.980
arriba tienes un limit row, hay, deschulea, deschulea esa parte. Vuelve a ejecutar la

02:03:38.980 --> 02:03:46.060
consulta en el play, en el play. Ok, ahora dale clic en el name para que te obtena por

02:03:46.060 --> 02:03:51.360
nombre, dale clic ahí. Y por ejemplo, ya aquí me aparece, me dice, bueno, oye, la canción que

02:03:51.360 --> 02:03:57.340
se llama dos minutos en la noche aparece repetida seis veces, me parece a mí, pero

02:03:57.340 --> 02:04:02.680
analizamos para ver si primero el compositor es igual. Me doy cuenta que en la, en el uno y

02:04:02.680 --> 02:04:06.960
en el tres el compositor es igual. Ahora date cuenta si el álbum es diferente. Ah, no,

02:04:06.960 --> 02:04:13.640
si es diferente. En la primera está en el álbum con código 95 y en el otro 104. Eso

02:04:13.640 --> 02:04:18.660
normalmente es cuando no vas a, no te piden algo específico si no te dice, mire, analiza para

02:04:18.660 --> 02:04:23.620
ver si de pronto hay errores partiendo de cómo están los datos en la base de datos, en este

02:04:23.620 --> 02:04:28.800
caso en particular. Ahí está interesante. Ahí está, ahí está interesante. Bueno, en primer

02:04:28.800 --> 02:04:33.980
lugar, tengo seis veces el nombre repetido. Tengo, en los seis veces tengo cinco veces

02:04:33.980 --> 02:04:39.120
del mismo género y un género diferente que es el uno. Tres veces el tres, bueno, cinco

02:04:39.120 --> 02:04:46.000
veces el uno y me doy cuenta en que las canciones están en álbum diferente. Están en álbum

02:04:46.000 --> 02:04:53.560
diferente pues es lógico que podía que podía ser el mismo nombre, pero no sé si es posible

02:04:53.560 --> 02:04:59.680
en que tú tengas el mismo nombre de la canción dos veces en un mismo álbum. Quizás pueda ser

02:04:59.680 --> 02:05:04.720
posible porque puedas tener una versión rock, no sé, una versión cumbia para una,

02:05:04.960 --> 02:05:08.740
no hay una canción y no hay versión rock en el mismo álbum. Eso es raro, pero quizás al final

02:05:08.740 --> 02:05:12.980
no sé dónde quiero llegar, que depende de la realidad y esa actitud de los datos de tu

02:05:12.980 --> 02:05:17.680
empresa, de cómo lo manejas. Pero lo que es que la herramienta te puede fácilmente ayudar y

02:05:17.680 --> 02:05:21.760
encontrar relaciones que de pronto puedas encontrar un error específicamente. Es más

02:05:21.760 --> 02:05:30.480
que todo eso. Bueno, sigamos entonces, hagamos algo en particular. Ahora sí me voy nuevamente

02:05:30.480 --> 02:05:37.980
y para hacer un pequeño brillao después vamos a agregarle un pequeño patrón. Un patrón

02:05:38.740 --> 02:05:45.360
para que veas los datos. Entonces, voy nuevamente aquí y para no tener que hacer un nuevo análisis,

02:05:45.620 --> 02:05:50.420
por favor. Bueno, voy a cerrar todos estos señores que están aquí. Voy a abrir el primer

02:05:50.420 --> 02:05:54.720
análisis que era el del cliente.

02:05:55.180 --> 02:06:00.080
El del cliente.

02:06:00.500 --> 02:06:05.780
Expande, por favor, la columna email si son tan amables.

02:06:10.720 --> 02:06:15.920
Bueno, aquí hay muchos. Bueno, aunque tampoco era necesario, no sé para qué pena. No era necesario

02:06:15.920 --> 02:06:21.080
ampliarla. Pero bueno, si la tienes ampliada, lo mismo al final. Nota entonces que en cada una

02:06:21.080 --> 02:06:26.000
de las columnas te aparece el data meaning, que ya te he explicado para qué era, y te aparecen

02:06:26.000 --> 02:06:34.960
dos cosas. El patrón y un UDI. Ese UDI son indicadores de usuario. Vamos a agregarle un

02:06:34.960 --> 02:06:42.700
patrón entonces al correo. Dele click por favor donde dice pattern, doble click por favor,

02:06:43.100 --> 02:06:55.160
y te aparece una ventana. Expande la ventana y vas a tener dos tipos de patrones. Los

02:06:55.160 --> 02:07:00.720
patrones vamos a hacer uno cada uno para cada tipo. Pero al final el patrón Reyes

02:07:00.720 --> 02:07:07.340
termina siendo una opción regular y el patrón SQL termina siendo un like en SQL.

02:07:07.920 --> 02:07:10.640
Expande Reyes, por favor.

02:07:14.100 --> 02:07:17.560
Y no veo por aquí.

02:07:19.260 --> 02:07:19.980
Perdón.

02:07:21.520 --> 02:07:26.660
Mira si hay uno de correo aquí que no lo alcanzó a ver. No vi el de correo aquí.

02:07:27.920 --> 02:07:33.720
Perdón, lo tienes a nivel de patrón SQL, qué pena. Lo busca ese en SQL.

02:07:39.320 --> 02:07:43.440
Aclaro, si se da cuenta aquí en SQL, que me confundí, pensé que estaba en Reyes,

02:07:43.580 --> 02:07:51.660
está en SQL, quiero validar ese correo con un formato Reyes. Tú puedes aplicar tantos

02:07:51.660 --> 02:07:56.900
patrones tú quieras. Entonces, por ejemplo, yo puedo aplicar este patrón aquí y este

02:07:56.900 --> 02:08:01.440
patrón significa que va a validar los dos patrones. Pero eso te puede causar una

02:08:02.560 --> 02:08:08.280
confusión. Por favor, nada más deja que valide los correos de tipo Yahoo. A ver

02:08:08.280 --> 02:08:17.660
qué pasa. Nada más déjale email Yahoo. Le das OK por favor y vuelves a ejecutar

02:08:17.660 --> 02:08:27.460
porque ese cambio no estaba. Vamos a ejecutar aquí. No sé si ejecutó. Este máquina

02:08:27.460 --> 02:08:38.240
mía está seguramente lenta, no sé por qué. ¿De qué? No, no, no hay ningún.

02:08:39.160 --> 02:08:44.760
Y te debió crear una nueva estadística, lo que es que tenemos muchos campos aquí

02:08:44.760 --> 02:08:56.200
y eso a veces da mucho ruido. Aquí la tienes SQL Pattern. Está de penúltima y mira

02:08:56.200 --> 02:09:02.980
lo que está diciendo la estadística. Está diciendo cuántos de los registros que

02:09:02.980 --> 02:09:07.840
están en la tabla cumplen con el patrón. Para el caso particular, como tenemos los

02:09:07.840 --> 02:09:13.220
mismos datos y yo dando las mismas estadísticas, lo está diciendo que el

02:09:13.220 --> 02:09:21.500
29% de los datos no cumplen con el patrón que tú definiste y el 38%, 30% de los

02:09:21.500 --> 02:09:26.060
datos si los cumple y aplicar lo mismo. Puedes darle entonces clic derecho y

02:09:26.060 --> 02:09:31.300
puedes ver cuáles son los válidos y cuáles son los inválidos. Entonces, si yo quiero

02:09:31.300 --> 02:09:34.220
ver los valores válidos, le doy clic aquí y me va a mostrar cuáles cumplen

02:09:34.960 --> 02:09:40.260
esa condición, ese patrón que tú definiste. Y esto cuando lo creas,

02:09:40.260 --> 02:09:45.380
nuevamente cuando el de gobierno te dice, mira ve, los correos de mis clientes tienen

02:09:45.380 --> 02:09:51.120
el siguiente formato. Entonces tú defines un patrón para que te verifique eso. Aquí

02:09:51.120 --> 02:09:56.640
cuando ejecuto esto no pasa el umbral, a menos que te hayan dicho, bueno ve acá,

02:09:56.920 --> 02:10:01.900
por lo menos que el 30% no los cumpla o si los cumpla y ahí tú defines una

02:10:01.900 --> 02:10:05.460
alerta con respecto a eso que está ahí. Si me permite entonces hacemos un pequeño

02:10:05.460 --> 02:10:08.860
bray de 10 minutos para descansar un poco la garganta y también usted

02:10:09.360 --> 02:10:12.920
descanse y volvemos entonces en 10 minutos para hacer más ejemplos. Ahora sí

02:10:12.920 --> 02:10:15.800
vamos a hacer un patrón nosotros. Listo, entonces nos volvemos en 10

02:10:15.800 --> 02:10:21.540
minutos. Gracias. Bueno, regresamos nuevamente. Creo que me tomé dos

02:10:21.540 --> 02:10:29.780
minutos más, disculpe por eso. Seguimos entonces. Voy a poner el

02:10:29.780 --> 02:10:35.220
siguiente caso. Voy a mostrar un momento, por favor, haga lo siguiente.

02:10:36.360 --> 02:10:40.840
Aquí yo instalé una herramienta de administración de MySQL que se llama

02:10:40.840 --> 02:10:46.100
el Worldbench. No es muy buena, pero claro yo he trabajado con MySQL, pero esta

02:10:46.100 --> 02:10:51.580
cuestión académica no es necesario un motor tan grande, pero acceda aquí a

02:10:51.580 --> 02:10:57.600
MySQL Worldbench. Si están amables, denle doble clic. Si están amables a MySQL

02:10:57.600 --> 02:11:07.880
Worldbench. MySQL Worldbench. Y por favor, inmediatamente aparece una conexión

02:11:07.880 --> 02:11:13.000
que se llama local, distancia local, denle doble clic a esa conexión por favor.

02:11:15.640 --> 02:11:21.000
El power es root y salve el password para que no tener que

02:11:21.680 --> 02:11:27.140
que digitarlo nuevamente. Root, el mismo que hemos usado y estamos en la casa

02:11:27.140 --> 02:11:31.680
anterior. Aquí hay un pequeño guardia que continúe.

02:11:36.080 --> 02:11:42.860
Y le aparece entonces la ventana. Nota que en el título de acá arriba le

02:11:42.860 --> 02:11:51.500
dice esquemas, ¿Verdad? Entonces a este señor en esta herramienta llama a las

02:11:51.500 --> 02:11:55.240
bases de datos esquemas, pero esquemas en oral es una cosa diferente y esquemas

02:11:55.240 --> 02:11:58.920
en postal es una cosa completamente diferente. Es solamente para mencionar el

02:11:58.920 --> 02:12:02.640
problema conceptual que a veces nos toca todos los días en esta granita

02:12:04.020 --> 02:12:08.080
carrera. Bien, entonces mire, le pongo el contexto del problema.

02:12:09.100 --> 02:12:13.180
Supongo que es una empresa que vende, el caso de Chinu vende, en este caso

02:12:13.180 --> 02:12:20.940
vende canciones, pero hay un inconveniente a nivel de inventario.

02:12:21.920 --> 02:12:25.840
Es decir, la cantidad de elementos que tengo en inventario no cuadra o no

02:12:25.840 --> 02:12:31.840
cuadra la caja. Decir que la cantidad de ventas que están en el software no

02:12:32.520 --> 02:12:36.560
cuadra con la cantidad en efectivo que está en la caja, como se llama.

02:12:38.040 --> 02:12:45.160
Las ventas no cuadran. Entonces, para realizar esto entonces hay que hacer un

02:12:45.160 --> 02:12:50.020
poco más el modelo. Vamos a ver dónde se guarda la parte de las ventas.

02:12:50.560 --> 02:12:54.200
Entonces las ventas, la base de datos que me interesa es Chinu. Dele

02:12:54.200 --> 02:12:59.060
aquí Spanda, por favor, y Spanda Tables.

02:13:00.380 --> 02:13:04.720
Espere un momento y voy a intentar encontrar el esquema por acá, el esquema Chinu

02:13:04.720 --> 02:13:10.220
para mostrarlo de este lado mejor. Vamos a ver.

02:13:10.460 --> 02:13:13.820
Un momento por favor. Bueno, este, un momento.

02:13:15.380 --> 02:13:18.140
Este es el esquema mejor, este es el diagrama relacional.

02:13:19.460 --> 02:13:21.500
Entonces, este señor lo que hace es lo siguiente.

02:13:22.520 --> 02:13:25.820
Normalmente en las tablas de compra y venta tú las divides en dos, verdad?

02:13:25.940 --> 02:13:29.620
En un encabezado y en un detalle, ya eso está establecido.

02:13:30.800 --> 02:13:35.540
Y entonces tengo la tabla encabezado, se llama Invoice, y la tabla de detalles

02:13:35.540 --> 02:13:42.500
se llama Invoice Lite. Entonces hay un problema en que quizás el detalle

02:13:43.300 --> 02:13:46.740
no está cuadrando con el total que tengo en el invoice.

02:13:46.740 --> 02:13:53.140
Entonces, usted se cuenta lo siguiente, por una cuestión netamente de eficiencia,

02:13:54.040 --> 02:13:58.940
porque teóricamente no te da, es decir, de esta forma, tú seguramente pudiste ver

02:13:58.940 --> 02:14:03.520
o escuchar en la universidad, de pronto eso no lo ves tanto a nivel pragmático,

02:14:03.700 --> 02:14:07.700
a nivel práctico de proyectos, el concepto ese de normalización.

02:14:08.820 --> 02:14:11.920
Esa normalización lo que busca es minimizar la redundancia de datos,

02:14:12.480 --> 02:14:15.480
porque el problema de la redundancia de datos es que si tengo datos redundantes,

02:14:15.480 --> 02:14:18.480
entonces no sé cuál es la vista verdadera, cuál es el verdadero.

02:14:19.780 --> 02:14:21.700
Entonces él trata de minimizar esa redundancia.

02:14:22.480 --> 02:14:27.060
Entonces tú recordarás que tenías primera, segunda, tercera, cuarta y quinta forma normal.

02:14:27.980 --> 02:14:31.660
Eso tú lo veías a nivel de universidad y quizás tú dices, pero ven acá,

02:14:33.020 --> 02:14:37.320
porque eso que yo veo teórico en esa universidad, porque yo no lo estoy viendo

02:14:37.320 --> 02:14:40.620
a nivel pragmático, en el práctico allá, en los proyectos de mi base de datos.

02:14:40.620 --> 02:14:45.400
No, la historia es que no es que no sirva, sino que normalmente ya por unas cuestiones

02:14:45.400 --> 02:14:49.620
ya que tú has aprendido de memoria en el tiempo, de la forma en que tú haces tus diseños,

02:14:50.520 --> 02:14:53.200
normalmente tú haces un diseño donde defines primero las entidades

02:14:53.200 --> 02:14:58.000
y después define las columnas. A ese diseño se llama top-bottom.

02:14:58.140 --> 02:15:03.180
Hay uno que es bottom-top, es decir, yo defino primero las columnas, perdón, los atributos

02:15:03.180 --> 02:15:06.160
y defino a qué entidad va o a qué tal la va.

02:15:07.180 --> 02:15:11.460
Entonces, cuando tú siempre haces de arriba hacia abajo más unas cosas

02:15:11.460 --> 02:15:15.480
que has aprendido de la forma en que debería o no debería hacer las cosas,

02:15:15.980 --> 02:15:18.780
ese modelo que tú haces te queda por lo menos en tercera forma normal.

02:15:19.860 --> 02:15:23.740
Entonces, no es necesario aplicar rigurosamente la teoría porque si tú ya

02:15:23.740 --> 02:15:26.360
algunas características básicas, alguna información que ya tienes,

02:15:27.000 --> 02:15:31.360
las replicas te quedas en tercera forma normal, que es lo mínimo que debería estar

02:15:31.360 --> 02:15:35.760
un modelo para hacer, abro comillas, digamos, no eficiente,

02:15:36.280 --> 02:15:38.900
sino que minimice la mayor cantidad de redundancia posible.

02:15:40.240 --> 02:15:43.040
Ya la cuarta y quinta forma normal tú la aplicas normalmente en tablas

02:15:43.040 --> 02:15:46.280
como la tabla países, ciudades, bueno, no voy a meterme en ese detalle tampoco.

02:15:47.320 --> 02:15:51.060
Lo que sí es seguro es que hay algo teóricamente que no te funciona acá,

02:15:51.680 --> 02:15:55.100
es lo siguiente, que un modelo netamente normalizado es ineficiente.

02:15:57.060 --> 02:15:59.720
Entonces, tú necesariamente tienes que colocar redundancia

02:15:59.720 --> 02:16:05.000
a tu modelo, porque si lo haces netamente normalizado

02:16:05.000 --> 02:16:07.260
es ineficiente a nivel de tiempo de respuesta.

02:16:07.840 --> 02:16:11.420
Entonces, uno qué hace? Redunda cosas. ¿Dónde redunda cosas?

02:16:12.940 --> 02:16:15.920
Aquí este invoice no se ve, pero este invoice

02:16:15.920 --> 02:16:19.960
aquí tiene un total, un total que guarda la

02:16:19.960 --> 02:16:23.060
sumatoria de la multiplicación del unique por el quantity,

02:16:23.620 --> 02:16:28.000
hace la sumatoria de los productos que están aquí en esta factura y el total lo guarda de este lado.

02:16:28.480 --> 02:16:31.800
¿Para qué lo guardas? Sencillo, entonces imagínate el caso de la empresa

02:16:31.800 --> 02:16:36.020
que yo te estoy diciendo que tiene cinco millones de registros al día, por lo tanto tendría

02:16:36.020 --> 02:16:40.060
al mes 150 millones de registros. Si quisiera saber

02:16:40.060 --> 02:16:44.140
la ganancia, es lo que tiene que hacer, es un set ex sum, si no

02:16:44.140 --> 02:16:48.320
tiene el total en el encabezado, le tocaría sumar

02:16:48.320 --> 02:16:52.380
o multiplicar, bueno, multiplicar el unique por el quantity, sumarlo

02:16:52.380 --> 02:16:56.240
de los 150 millones de registros que tiene.

02:16:56.240 --> 02:17:00.360
Entonces, no le va a dar así.

02:17:00.460 --> 02:17:04.360
Entonces, ¿qué pasa? Yo eso lo tengo como, digamos, precalculado

02:17:04.360 --> 02:17:08.940
y lo que nada más sumo es el total y evidentemente los tiempos de respuesta superan ahí.

02:17:09.700 --> 02:17:12.520
Eso es algo que tú también aplicas a nivel de data warehouse,

02:17:12.980 --> 02:17:16.380
cuando haces tu data de hechos y la aplicas también cuando

02:17:16.380 --> 02:17:20.640
creas sus dimensiones, las creas desnormalizadas,

02:17:20.920 --> 02:17:24.060
mientras que cuando estás en un modelo transicional lo creas normalizado.

02:17:24.560 --> 02:17:27.800
Eso por una cuestión netamente de eficiencia. Pero

02:17:27.800 --> 02:17:32.060
el problema que se puede suceder, y a donde quiero llegar el problema para que me voy a

02:17:32.060 --> 02:17:35.860
solucionarlo es el siguiente, yo quiero verificar que la sumatoria

02:17:35.860 --> 02:17:39.600
de los productos que están acá es igual al total de acá.

02:17:40.880 --> 02:17:43.820
Quiero verificar eso. Si yo encuentro por lo menos

02:17:43.820 --> 02:17:47.900
un registro en que no coincida ese total del detalle

02:17:47.900 --> 02:17:52.280
con el del encabezado, hay un problema, no se guardó el registro,

02:17:52.900 --> 02:17:56.220
hubo un error en el software, muchas cosas que pudieron

02:17:56.220 --> 02:17:59.400
haber de por qué esto no funciona.

02:18:00.080 --> 02:18:04.020
Entonces la idea es que como eso puede ser repetitivo, es una empresa que vende mucho,

02:18:05.220 --> 02:18:08.300
en vez de hacer eso para un solo caso, voy a

02:18:08.300 --> 02:18:12.400
aplicar una regla y definir un patrón que cada mes en que me piden a mí

02:18:12.400 --> 02:18:16.280
verificar los datos, yo pueda, digamos, decir si eso funciona

02:18:16.280 --> 02:18:20.200
o no funciona y, digamos, mandar algún mensaje

02:18:20.200 --> 02:18:24.340
de error al ingeniero de datos encargado de la parte de corrección de datos.

02:18:25.820 --> 02:18:28.500
Esa es la idea entonces. Ahora, quiero comprobar

02:18:28.500 --> 02:18:32.040
que este total de acá sea igual al total de aquí.

02:18:33.540 --> 02:18:36.100
Entonces, bueno, este lo voy a hacer yo,

02:18:36.360 --> 02:18:40.240
acá, no es necesario, es solamente para mostrar que muchas veces hay que

02:18:40.240 --> 02:18:44.360
necesitamos conocimiento en SQL. Me voy ahora nuevamente a este señor

02:18:44.360 --> 02:18:48.440
que está aquí, voy a tratar de ampliar esto, no se ve, no se ve.

02:18:49.760 --> 02:18:51.700
Para seleccionar una base de datos es

02:18:52.180 --> 02:18:55.340
darle doble clic a la base de datos donde vas a ejecutar una sentencia SQL.

02:18:56.000 --> 02:19:00.320
Entonces, como acá quiero sobre la base de datos chinos, dale doble clic al chinos

02:19:00.320 --> 02:19:04.220
y te va a aparecer en negrita, diciéndole que estás conectado

02:19:04.220 --> 02:19:07.940
a esa base de datos. Significa que cualquier consulta,

02:19:08.180 --> 02:19:12.220
que sentencia SQL que coloque de este lado, se ejecutará sobre esta base de datos que está

02:19:12.220 --> 02:19:13.560
marcada en negrilla.

02:19:15.420 --> 02:19:17.900
Ahora, mire lo que voy a hacer de manera muy

02:19:17.900 --> 02:19:21.940
sencilla. Primero, voy a sacar el total de la

02:19:21.940 --> 02:19:24.820
tabla de talle. La tabla de talle se llama invoice line.

02:19:26.100 --> 02:19:29.440
¿Cómo haría para sacar el total por factura de esta tabla?

02:19:29.560 --> 02:19:33.620
Entonces, lo que voy a hacer es lo siguiente. Voy a hacer aquí un select

02:19:35.240 --> 02:19:37.720
que sume, que me saque primero

02:19:37.720 --> 02:19:41.260
el nombre de la factura,

02:19:41.260 --> 02:19:45.260
coma y me sume el unit price

02:19:46.700 --> 02:19:48.480
por el quantity

02:19:49.740 --> 02:19:52.560
from la tabla que se llama invoice line

02:19:53.260 --> 02:19:58.000
y voy a agrupar, voy a hacer aquí un group by por invoice line.

02:19:59.000 --> 02:20:00.660
Por este invoice line que está aquí.

02:20:01.920 --> 02:20:05.300
Y esto que me da el total de la factura, pero a nivel

02:20:05.300 --> 02:20:07.880
del detalle. Me voy a ejecutar aquí un momento.

02:20:09.280 --> 02:20:12.180
Y ahí me está dando que la factura uno

02:20:12.180 --> 02:20:15.960
fueron 1.98, la factura 2.396 y hay una,

02:20:16.180 --> 02:20:19.880
se nota que los datos son sintéticos, porque hay una

02:20:22.200 --> 02:20:23.540
una curva ascendente

02:20:24.400 --> 02:20:26.680
del valor de los datos. Si quiere se la mando

02:20:28.040 --> 02:20:31.940
o si la cansa a ver o esta es la primera.

02:20:32.280 --> 02:20:35.200
Consulta que hice. Voy a mostrarla acá mejor para que sea más grande.

02:20:35.200 --> 02:20:39.680
Y me dice si no le funciona nada. Un momento aquí.

02:20:42.400 --> 02:20:45.000
Voy a colocarla aquí.

02:20:47.960 --> 02:20:51.180
No, es interesante. No es interesante. MySQL

02:20:51.180 --> 02:20:55.360
ha sufrido diferentes cambios. MySQL por defecto

02:20:55.360 --> 02:20:59.340
antes en Windows era insensitivo, pero

02:20:59.340 --> 02:21:03.340
en Linux era sensitivo. Entonces ahora en la ultima

02:21:03.340 --> 02:21:07.340
versión es 8, por defecto está insensitivo, pero usted si desea lo puede cambiar a

02:21:07.340 --> 02:21:11.380
sensitivo. O sea aquí no hay problema con mayúscula y minúscula.

02:21:13.260 --> 02:21:14.500
Vamos a ver.

02:21:15.540 --> 02:21:17.280
¿Quién me habló? Disculpe.

02:21:18.200 --> 02:21:19.340
Vamos a ver.

02:21:24.200 --> 02:21:25.980
Dale a ejecutar para ver.

02:21:26.260 --> 02:21:30.960
Sí, ahora a nivel de sensitividad

02:21:30.960 --> 02:21:35.440
estamos hablando de la pregunta que usted me dice. Vamos a ver.

02:21:35.940 --> 02:21:38.780
Unit price. Creo que llevo underscore.

02:21:39.280 --> 02:21:43.240
No, no. Unit. Ah, le puse una E. Antes de la P

02:21:43.240 --> 02:21:46.740
le coloco una E. Antes de la P.

02:21:47.020 --> 02:21:50.960
Sí, unit. Ejecuta. Ok, la pregunta de ustedes es interesante

02:21:50.960 --> 02:21:54.340
desde el punto de vista siguiente. Es decir, el caso de algunos

02:21:54.340 --> 02:21:58.960
de MySQL cuando habló de sensitivo es en el nombre

02:21:58.960 --> 02:22:02.920
de la tabla. Por defecto, cuando yo consulto

02:22:02.920 --> 02:22:07.000
en MySQL un texto es no sensitivo, pero en Oracle

02:22:07.000 --> 02:22:10.840
por defecto es sensitivo, pero a nivel de stream.

02:22:12.300 --> 02:22:15.000
Y hay motores como el de MySQL que se crea complicar la vida

02:22:15.000 --> 02:22:19.280
en que entonces hay que colocar específicamente el nombre a tabla como estaba.

02:22:21.420 --> 02:22:23.040
Bueno, continuamos entonces. Sigo ahora.

02:22:23.200 --> 02:22:27.000
Esto me da el, me va a dar entonces

02:22:27.000 --> 02:22:31.000
el total de las facturas a nivel del detalle.

02:22:32.960 --> 02:22:35.040
Y ahora voy a hacer lo siguiente. Mira lo que voy a hacer aquí.

02:22:35.480 --> 02:22:38.780
Este señor. Así.

02:22:40.460 --> 02:22:43.000
Voy a socar el total ahora a nivel de

02:22:44.460 --> 02:22:47.260
del señor de la tabla

02:22:47.260 --> 02:22:51.340
encabezado que sería siguiente. Mejor hagamos la consulta así. Select.

02:22:53.180 --> 02:22:53.520
Select.

02:22:54.600 --> 02:22:57.280
Bueno, aquí la coloque en MySQL. No sé por qué se me fue

02:22:57.280 --> 02:23:01.480
el texto. Select. Voy a coger el nombre de la tabla Invoice. Si quiere

02:23:01.480 --> 02:23:05.580
doy doble clic aquí a la tabla y me dé a aparecer. Un momento, que será

02:23:05.580 --> 02:23:09.700
Fronkara. Le quiero llegar a lo siguiente. Select.

02:23:11.280 --> 02:23:13.660
Expanda acá las columnas y en vez de escribirle

02:23:13.660 --> 02:23:17.460
le da doble clic donde quiere que aparezca, así como hicimos en el talent data integration

02:23:17.960 --> 02:23:21.340
de las columnas cual. Invoice ID, doy doble clic, me aparece allá.

02:23:21.940 --> 02:23:24.420
Coma. Y quiero la columna total.

02:23:26.020 --> 02:23:29.480
Ve la tabla que modifique Invoice, doy doble clic

02:23:29.480 --> 02:23:33.400
y me va armando la columna ahí.

02:23:35.140 --> 02:23:36.580
Hay diferentes formas de hacer esto.

02:23:37.460 --> 02:23:41.620
Voy de la más fácil, quizás no es la más eficiente

02:23:41.620 --> 02:23:45.440
pero mira lo que voy a hacer aquí. Voy a hacer así de truco aquí. Voy a agregarle

02:23:45.440 --> 02:23:49.140
aquí un alias y voy a definir aquí y minúscula

02:23:49.140 --> 02:23:52.660
y voy a definir esto como si fuera una vista inline que llaman.

02:23:52.760 --> 02:23:56.840
Entonces voy a colocar esto entre paréntesis de aquí al ladito y esto se me va a comportar

02:23:56.840 --> 02:24:00.500
como si fuera una tabla. Esto que está aquí.

02:24:01.040 --> 02:24:05.080
Ve una tabla y como aparece una tabla, le voy a colocar

02:24:05.080 --> 02:24:09.400
un alias. Voy a colocar aquí

02:24:10.820 --> 02:24:11.480
Invoice Line.

02:24:12.680 --> 02:24:17.080
Y como tengo dos, voy a hacer entonces un join aquí.

02:24:17.080 --> 02:24:20.220
Por web. Voy a decir entonces

02:24:20.220 --> 02:24:25.080
I.InvoiceID sea igual a

02:24:28.540 --> 02:24:29.420
IL.InvoiceID

02:24:30.540 --> 02:24:32.800
Este que está aquí.

02:24:35.520 --> 02:24:36.940
Esto es lo que llaman. Bueno, seguramente la mayoría

02:24:36.940 --> 02:24:41.120
ya lo ha conocido de ser una vista inline. Es decir, hago una consulta y

02:24:41.120 --> 02:24:44.260
le hago creer al SELE que es como si fuera una tabla, pero

02:24:44.260 --> 02:24:48.320
bueno, eso me ha sacado de muchos problemas a veces para ciertas consultas

02:24:48.320 --> 02:24:51.880
que son complejas. El problema puede ser de punto de escalamiento.

02:24:53.260 --> 02:24:55.420
Entonces mire lo que deseo hacer ahora aquí.

02:24:56.200 --> 02:25:00.320
Para poder sacar este zoom, que es una fórmula matemática de una vista inline, voy a colocarle un alias aquí.

02:25:00.400 --> 02:25:04.580
Voy a colocarlo aquí como total. Y lo que voy a hacer es lo siguiente.

02:25:05.660 --> 02:25:08.260
Bueno, aquí como esta está repetida, voy a colocarla aquí y

02:25:09.880 --> 02:25:12.260
junto Invoice. Voy a dividir

02:25:12.260 --> 02:25:16.120
o lo siguiente. Voy a dividir el total del encabezado que sería

02:25:16.120 --> 02:25:18.680
I.Total

02:25:20.200 --> 02:25:24.500
sobre el total que me da el detalle y el total.

02:25:25.880 --> 02:25:28.260
Estos si son exactamente iguales debe

02:25:28.260 --> 02:25:32.340
darme uno. Si el valor es diferente a uno significa que

02:25:32.340 --> 02:25:36.160
hay un inconveniente. Hay un conveniente entre el detalle

02:25:36.160 --> 02:25:40.300
y el encabezado. Voy a ejecutar aquí antes para ver si sale la

02:25:43.080 --> 02:25:46.440
Listo, aquí está. Si desea, la mando por aquí por

02:25:46.440 --> 02:25:50.380
de todos modos por el grupo, por aquí por el chat

02:25:50.380 --> 02:25:54.240
para que la tenga ya entonces. Un momento, aquí me salió.

02:25:54.460 --> 02:25:58.260
Ahí la mandé. Si entiende la idea, es decir,

02:25:59.920 --> 02:26:01.860
esta fue la forma en que lo vi, no significa que sea la única.

02:26:02.860 --> 02:26:06.220
Si hago la división del total de que me da el encabezado sobre el total

02:26:06.220 --> 02:26:09.980
debe ser exactamente el mismo valor. Si no es el mismo valor

02:26:09.980 --> 02:26:14.360
significa entonces que el dato hay un problema.

02:26:14.700 --> 02:26:17.260
No me está dando el detalle con el encabezado.

02:26:18.680 --> 02:26:21.880
No sé si hay alguno que lo apoye en la consulta.

02:26:22.040 --> 02:26:26.340
Voy a ver para ver. Me termina y regálame cinco

02:26:26.340 --> 02:26:30.120
minutos para buscar un poquito de agua. Me termina por favor. Ya vengo, vengo enseguida.

02:27:04.780 --> 02:27:06.180
Bienvenido.

02:27:24.040 --> 02:27:24.600
Bienvenido.

02:27:24.680 --> 02:27:29.420
Bueno, volví nuevamente. Eh sí, nos dio la consulta,

02:27:29.420 --> 02:27:34.660
sí, nos dio, no nos dio, sí. Sí, le dio,

02:27:34.860 --> 02:27:37.280
alguno no le dio para revisar un momento.

02:27:39.580 --> 02:27:42.420
Perfecto, creo que la mayoría la tiene, Gerardo le falta por terminarla.

02:27:45.700 --> 02:27:47.080
OK. Bueno,

02:27:47.100 --> 02:27:50.260
de todos modos la mandé aquí en el grupo por si acaso.

02:27:51.180 --> 02:27:52.800
Ah, acá dice,

02:27:54.340 --> 02:27:58.200
con respecto a las máquinas, creo que el problema

02:27:58.200 --> 02:28:01.840
es el siguiente, con las máquinas. Usted tiene, usted tiene, disculpa un momentito

02:28:01.840 --> 02:28:05.340
antes para, para eso se llama el problema de las máquinas. Ustedes tienen

02:28:06.060 --> 02:28:10.120
portátiles, ¿qué? Portables, si tienen portables o no.

02:28:10.320 --> 02:28:14.020
O son máquinas de stock, máquinas perdón, PC. Permítame

02:28:14.020 --> 02:28:18.620
y el problema del símbolo puede ser el siguiente. Lo que pasa es que

02:28:18.620 --> 02:28:22.080
eh, tomemos un momento este símbolo porque creo que esta máquina

02:28:22.080 --> 02:28:24.840
no lo tengo. Lo que pasa es que este sistema,

02:28:24.840 --> 02:28:29.920
este sistema operativo eh el teclado lo tiene

02:28:29.920 --> 02:28:33.860
eh inglés. Y entonces si tu teclado está

02:28:33.860 --> 02:28:37.380
en el latinoamericano eh te va a tomar

02:28:37.380 --> 02:28:40.840
en los símbolos que nada. Intente de esta forma, vamos a ver. Eh

02:28:41.360 --> 02:28:45.180
creo que es keyboard por aquí, no es region,

02:28:45.240 --> 02:28:49.220
es region. Region setting.

02:28:50.500 --> 02:28:53.320
Un momento para él porque sí te puede causar.

02:28:53.320 --> 02:28:53.360
Eh

02:28:59.560 --> 02:29:01.320
aquí creo que por defecto no está

02:29:01.320 --> 02:29:04.640
español, hay que instalarlo. Ah vamos a ver.

02:29:05.740 --> 02:29:08.360
Instalo ese señor.

02:29:12.780 --> 02:29:14.700
Acá en lenguaje.

02:29:17.740 --> 02:29:18.060
Eh

02:29:18.060 --> 02:29:20.040
pero tocaría probarlo con uno de ustedes para ver.

02:29:20.040 --> 02:29:24.220
Es acá donde coloca region o

02:29:24.220 --> 02:29:27.860
lenguaje coloca acá lenguaje

02:29:27.860 --> 02:29:32.000
lenguaje aquí y entonces primero

02:29:32.000 --> 02:29:35.480
edición a un nuevo lenguaje eh adición español

02:29:36.040 --> 02:29:38.840
español mexicano español

02:29:41.700 --> 02:29:42.800
español

02:29:45.860 --> 02:29:47.220
español español

02:29:47.220 --> 02:29:50.680
España vamos a ver no pero yo creo que

02:29:50.680 --> 02:29:54.540
eso el problema es con los portables no sé

02:29:54.540 --> 02:29:57.240
eh porque yo tengo

02:29:58.720 --> 02:30:01.980
tengo un destoque acá entonces español y si

02:30:01.980 --> 02:30:05.100
perdí español de España no lo veo

02:30:05.100 --> 02:30:09.640
Ecuador México Nicaragua Perú Puerto Rico bueno aquí

02:30:09.640 --> 02:30:10.440
y después cambia el teclado a España.

02:30:12.800 --> 02:30:16.280
Next y después cambia el teclado lo instala y

02:30:16.280 --> 02:30:19.800
después cambia el keyboard este aquí a español

02:30:20.580 --> 02:30:24.240
y veamos para ver si funciona de pronto y

02:30:24.240 --> 02:30:26.340
cambiamos también la región

02:30:28.320 --> 02:30:31.520
sí porque es engorroso esta parte de

02:30:32.980 --> 02:30:33.600
configuración

02:30:34.500 --> 02:30:37.600
ah bueno está instalando ahí

02:30:43.680 --> 02:30:46.040
eh si no funcionó

02:30:46.040 --> 02:30:48.940
o no te funcionó perdón sí

02:30:49.600 --> 02:30:52.340
pero cambiaste el teclado ¿Verdad? O dejaste el teclado igual

02:30:52.340 --> 02:30:55.440
o solamente

02:30:57.740 --> 02:30:59.740
ah bueno listo

02:30:59.740 --> 02:31:03.840
eh bueno ahorita ya está instalando acá ¿Quién todavía necesita ayuda con respecto

02:31:03.840 --> 02:31:07.740
al a la consulta? Bueno te vuelvo nuevamente aquí a la consulta pues

02:31:09.120 --> 02:31:12.020
si todo está bien quiero crear una vista

02:31:12.020 --> 02:31:15.500
recuerden que una vista es lo que llaman algunos la tabla virtual

02:31:15.500 --> 02:31:19.760
porque al final una vista termina siendo una sentencia CQL

02:31:19.760 --> 02:31:23.740
entonces haga lo siguiente agreguele a esta sentencia

02:31:23.740 --> 02:31:27.820
lo siguiente create view

02:31:27.820 --> 02:31:29.880
vamos a llamarla

02:31:35.620 --> 02:31:36.740
ventas totales

02:31:37.620 --> 02:31:38.180
proporción

02:31:39.440 --> 02:31:43.860
y le voy a colocar aquí vista bueno el nombre fue un poquito largo le coloco

02:31:43.860 --> 02:31:47.900
as y voy a cambiarle voy a colocarle un alias

02:31:47.900 --> 02:31:51.980
a estas tablas voy a colocarle aquí identificador en español

02:31:51.980 --> 02:31:54.580
y voy a dejar esta como total

02:31:55.860 --> 02:31:58.840
le mando el

02:32:00.680 --> 02:32:02.560
el el la sentencia

02:32:02.560 --> 02:32:04.940
por acá por el chat

02:32:04.940 --> 02:32:07.880
ah muchas gracias acá

02:32:10.580 --> 02:32:14.440
acá me está diciendo Gerardo de las confecciones

02:32:14.440 --> 02:32:17.860
muy bien gracias eh voy a ejecutar para

02:32:17.860 --> 02:32:21.980
bueno no la ejecuté listo esto tuvo que haber creado

02:32:21.980 --> 02:32:25.980
acá una vista voy a refrescar aquí

02:32:27.920 --> 02:32:29.960
y aquí está la vista la vista se comporta

02:32:29.960 --> 02:32:34.200
como si fuese una tabla pero al final es una consulta CQL digamos

02:32:35.440 --> 02:32:35.900
dígame

02:32:38.580 --> 02:32:41.980
creo que nada más se debe seleccionar

02:32:43.480 --> 02:32:45.520
selecciona la la la consulta

02:32:45.520 --> 02:32:49.460
y le das en el rayito porque creo que el punto y coma acá no no

02:32:49.460 --> 02:32:53.800
no lo manejo mucho pero eh digamos solamente

02:32:53.800 --> 02:32:57.500
quiere colocar ejecutar una parte por ejemplo nada más quisiese ejecutar esta consulta

02:32:57.500 --> 02:33:01.460
aquí la selecciono y le doy aquí ejecutar aquí

02:33:02.660 --> 02:33:05.120
y me ejecuta nada más esa parte

02:33:06.660 --> 02:33:09.820
pero no sé con punto y coma

02:33:09.820 --> 02:33:13.460
creo que sí sabes no no no sé no sé no no lo he probado

02:33:14.460 --> 02:33:17.260
no lo he probado no lo he probado bueno sigamos entonces no sé si espero

02:33:17.260 --> 02:33:20.960
a que termina ya no sé voy a ver voy a entrar en mi room para ver si ya

02:33:20.960 --> 02:33:25.180
nos vamos a la herramienta si ya creo la vista o alguno tiene

02:33:25.180 --> 02:33:29.260
problemas con la creación de la vista porque recuerden que la herramienta a nivel de

02:33:29.260 --> 02:33:33.200
base de datos pues eh lee tablas y lee vistas entonces con esta vista

02:33:33.200 --> 02:33:37.400
ya la puedo recuperar allá a nivel de la herramienta bueno espero un momento

02:33:37.400 --> 02:33:40.920
que hay algunos que todavía no han terminado

02:33:43.740 --> 02:33:45.140
si ya la pudieron hacer

02:33:45.140 --> 02:33:49.420
para la herramienta voy a el alguno que todavía no creaba la vista

02:33:49.420 --> 02:33:52.680
ah listo y quién me habló? Eduardo entonces

02:33:54.200 --> 02:33:57.020
Eduardo del lado izquierdo está el panel

02:33:57.020 --> 02:34:00.900
de los esquemas dale refresh ya tienes el refresh ahí

02:34:00.900 --> 02:34:05.180
el botoncito que está ahí de ese y te debió

02:34:05.180 --> 02:34:09.260
crear allá view expande y ahí tienes la vista expande la vista ahí si tú quieres

02:34:09.260 --> 02:34:12.500
o la consulta ya eso como si fuese una tabla ahí está aquí aquí

02:34:12.500 --> 02:34:16.180
está bien pequeño bueno listo entonces

02:34:16.180 --> 02:34:21.600
vamos ahora a la herramienta

02:34:21.600 --> 02:34:25.500
y vamos a crear entonces un análisis

02:34:26.240 --> 02:34:29.140
ah perdón antes del análisis

02:34:29.140 --> 02:34:32.560
eh revise la conexión para ver si le aparece

02:34:32.560 --> 02:34:36.660
el debería eh creo clic derecho

02:34:37.520 --> 02:34:39.780
recargar lista de base de datos

02:34:39.780 --> 02:34:40.940
reload

02:34:44.800 --> 02:34:46.700
para recuperar la vista

02:34:46.700 --> 02:34:50.640
no sé si es en la conexión un momento a ver

02:34:50.640 --> 02:34:52.880
está embrando un poquito

02:34:58.960 --> 02:35:00.440
eh listo eh

02:35:00.440 --> 02:35:02.960
váyase a la conexión y le dice reload

02:35:03.780 --> 02:35:07.120
para que le cargue la vista

02:35:11.120 --> 02:35:14.200
debería aparecer entonces con el nombre que usted colocó allá

02:35:14.200 --> 02:35:18.960
y la estructura a nivel de columnas con los nombres que especificó

02:35:18.960 --> 02:35:21.720
no creo yo no leí

02:35:21.720 --> 02:35:24.540
para ver quién me dijo

02:35:25.540 --> 02:35:27.960
ah no pero no hicimos ningún cambio

02:35:29.940 --> 02:35:33.880
agregamos no cambiamos entonces va a seguir emocionando es más como un warning

02:35:33.880 --> 02:35:37.600
ahí creo que el mensaje está como muy exagerado

02:35:37.600 --> 02:35:42.160
listo entonces ahora vamos a crear un patrón

02:35:42.160 --> 02:35:45.660
de tipo SQL le da clic derecho y le dice new pattern

02:35:47.200 --> 02:35:47.840
por favor

02:35:49.500 --> 02:35:53.240
entonces el nombre del patrón vamos a llamarlo entonces

02:35:58.340 --> 02:35:59.620
verificar totales

02:36:00.640 --> 02:36:01.280
factura

02:36:01.280 --> 02:36:04.840
eh dale next por favor

02:36:05.440 --> 02:36:08.640
y ahí te pide el lenguaje

02:36:08.640 --> 02:36:12.940
que deseas más específicamente si da clic aquí puedes escoger

02:36:12.940 --> 02:36:16.500
de pronto alguna funcionalidad de algún motor pero este no es el caso

02:36:16.500 --> 02:36:20.820
eh vamos a usar el SQL estándar y entonces aquí en la

02:36:20.820 --> 02:36:24.600
expresión ojo lo siguiente lo que vas a colocar

02:36:25.280 --> 02:36:28.420
sí no no vamos primero a hacer el patrón

02:36:28.420 --> 02:36:32.420
que me habló analiza esto por favor entonces haga lo siguiente

02:36:32.980 --> 02:36:36.560
cierre la ventana esa de inicial todavía no hemos hecho análisis

02:36:36.560 --> 02:36:39.520
cierre la por favor cierre vayase

02:36:39.520 --> 02:36:44.160
cierre esa ventana de crear nuevo primero listo

02:36:44.160 --> 02:36:48.600
ahora en del lado del menú vertical la barra vertical vayase a

02:36:49.420 --> 02:36:52.420
patrones expande patrones ahí por ahí se quita

02:36:53.160 --> 02:36:56.400
ahí patterns ahí listo en SQL le da clic

02:36:56.400 --> 02:37:00.400
derecho y le dice crear nuevo patrón ahí verificaron del score proporción totales

02:37:01.440 --> 02:37:04.400
se llama el patrón verificar

02:37:05.180 --> 02:37:07.760
con del score proporción totales

02:37:07.760 --> 02:37:12.020
y aquí creamos aquí vamos por ahí

02:37:12.020 --> 02:37:16.420
y aquí en esta parte lo que va a hacer es lo siguiente

02:37:16.420 --> 02:37:19.460
se me perdió la conexión

02:37:20.400 --> 02:37:23.340
se me perdió a mí

02:37:23.340 --> 02:37:27.560
perdió la mía aquí está ahí lo que vas a

02:37:27.560 --> 02:37:31.800
colocar es la comparación del valor

02:37:31.800 --> 02:37:35.840
partiendo de lo que es el like de pronto para recordar

02:37:35.840 --> 02:37:39.660
aunque sé que la mayoría lo sabe recordará entonces que a nivel

02:37:39.660 --> 02:37:43.360
de base de datos se tiene en el operador que se llama like

02:37:43.360 --> 02:37:47.340
este para buscar por patrones entonces este operador like tiene dos

02:37:48.220 --> 02:37:51.560
dos modificadores un modificador que es el porcentaje y un

02:37:51.560 --> 02:37:54.320
un modificador que es el el under score

02:37:54.320 --> 02:37:59.480
este significa esta reemplaza

02:38:00.840 --> 02:38:03.340
cero o más caracteres

02:38:03.340 --> 02:38:07.560
y esta reemplaza un carácter por ejemplo

02:38:08.220 --> 02:38:11.400
si yo quisiera hazme el favor y muéstrame todos los

02:38:11.400 --> 02:38:14.420
nombres que empiezan por a entonces que hace esto entonces tiene

02:38:15.560 --> 02:38:19.040
nombre coloca nombre like que empiezan

02:38:19.040 --> 02:38:22.820
por una a y que después tengan lo que usted quiera

02:38:22.820 --> 02:38:26.900
cero o más caracteres mira quiero los que empiecen por a

02:38:26.900 --> 02:38:30.920
pero terminen por n entonces le coloco aquí n dice

02:38:30.920 --> 02:38:35.240
que empiecen por a que haya en el medio cualquier cosa y que termine en n

02:38:36.120 --> 02:38:38.920
y el otro es reemplazar un carácter dice

02:38:38.920 --> 02:38:42.900
quiero que en la segunda columna en la segunda perdón en el segundo

02:38:42.900 --> 02:38:47.040
valor tenga una a entonces que haces tú le dices lo siguiente le dices

02:38:48.660 --> 02:38:51.100
la primera de voy a ver cualquier cosa

02:38:51.100 --> 02:38:55.400
pero en la segunda tiene que haber una a alto seguido después de la

02:38:55.400 --> 02:38:59.200
puede haber cualquier cosa que quiero que en la tercera

02:38:59.200 --> 02:39:03.160
haya una a entonces reemplazas por cada carácter

02:39:04.220 --> 02:39:07.500
reemplazas el número de valores que tú quieras y de esa forma

02:39:07.500 --> 02:39:11.300
funciona el like listo de igual forma si yo hago nombre

02:39:13.120 --> 02:39:15.640
like igual aquí a an aquí por ejemplo

02:39:15.640 --> 02:39:18.820
esto es exactamente lo mismo que decir nombre

02:39:21.860 --> 02:39:23.860
igual solamente hay cambios

02:39:23.860 --> 02:39:26.800
cuando uso los operadores que es el porcentaje

02:39:27.800 --> 02:39:31.880
son los que hay nada más listo pero si te das

02:39:31.880 --> 02:39:35.780
cuenta y en realidad lo dice así no quise truncar el valor si te das

02:39:35.780 --> 02:39:39.880
cuenta en la vista voy a consultarla mejor acá en

02:39:39.880 --> 02:39:44.000
momento por favor voy a consultarla acá para que te des cuenta de algo

02:39:44.000 --> 02:39:47.840
si te das cuenta cuando consulto la vista

02:39:47.840 --> 02:39:49.980
que sería el valor este que está aquí

02:39:51.540 --> 02:39:55.720
la vista me tiene uno punto cero cero cero cero cero

02:39:55.720 --> 02:39:59.800
porque uno de los valores seguramente es float y me está volviendo el valor

02:39:59.800 --> 02:40:02.660
el float entonces ahí no lo quise truncar en realidad

02:40:03.320 --> 02:40:07.880
no lo quise truncar para lo siguiente voy por acá entonces

02:40:07.880 --> 02:40:12.000
y mira lo que voy a hacer nada más vas a especificar

02:40:12.780 --> 02:40:16.320
el valor a comparar nada más

02:40:16.320 --> 02:40:20.320
porque la columna como yo asocio la columna con el patrón

02:40:20.320 --> 02:40:24.220
el nombre de la columna sería cuando yo asocio esa columna con el

02:40:24.220 --> 02:40:28.220
patrón ya él sabe que la columna que va a buscar es de la asociación

02:40:28.220 --> 02:40:31.980
entonces voy a colocar lo siguiente como este like es

02:40:31.980 --> 02:40:35.800
string él va a hacer una conversión de ese numérico a string

02:40:35.800 --> 02:40:40.280
entonces voy a colocar entre comillas simples aquí va a colocar uno

02:40:40.280 --> 02:40:44.520
punto cero aquí puedo hacer lo siguiente coloco punto cero punto cero

02:40:44.520 --> 02:40:48.300
tanto cero o coloco cero porcentaje que haya cualquier

02:40:48.300 --> 02:40:51.760
cosa mira como me quedo aquí

02:40:52.280 --> 02:40:56.680
lo que dice fue que la expresión me quedo así

02:40:56.680 --> 02:41:00.360
es decir coloque el porcentaje porque no quería agregar todos los

02:41:00.360 --> 02:41:04.280
ceros eso entonces yo mira si es uno punto cero cero cero compararlo

02:41:04.280 --> 02:41:08.340
con ese valor él va a volver true or false

02:41:08.340 --> 02:41:11.420
si es true pues va contando si es false pues no cuenta

02:41:12.620 --> 02:41:16.780
si no cumple estoy por aquí te quedo así

02:41:16.780 --> 02:41:20.340
listo aquí no hay que hacer nada y le damos finish aquí

02:41:21.460 --> 02:41:24.340
y te debió agregar aquí

02:41:26.800 --> 02:41:28.560
una expresión sql aquí te debió

02:41:28.560 --> 02:41:32.420
agregar aquí el valor y puedes modificar si tú quieres pues la

02:41:32.420 --> 02:41:34.620
expresión que vas a comparar no hay ningún problema

02:41:35.460 --> 02:41:38.700
ahora vamos a usarla para usarla ahora sí

02:41:38.700 --> 02:41:42.660
vamos a crear el análisis entonces voy a crear

02:41:42.660 --> 02:41:46.800
aquí en columnar voy a crear aquí un nuevo análisis

02:41:46.800 --> 02:41:49.140
este va a ser basic column

02:41:51.520 --> 02:41:54.540
y voy a colocarle entonces aquí lo siguiente

02:41:54.540 --> 02:41:58.620
voy a colocarle aquí análisis totales

02:42:01.060 --> 02:42:01.720
factura

02:42:05.160 --> 02:42:05.720
propósito

02:42:06.560 --> 02:42:09.720
analizar si los totales

02:42:11.120 --> 02:42:13.220
del detalle

02:42:13.220 --> 02:42:17.720
son iguales a los del encabezado

02:42:23.880 --> 02:42:27.720
ese sería el propósito

02:42:29.400 --> 02:42:33.780
al final dele aquí un finish

02:42:37.140 --> 02:42:39.680
y ahora la conexión sigue siendo la misma

02:42:39.680 --> 02:42:44.020
ahora voy a seleccionar las columnas que quiero analizar

02:42:44.020 --> 02:42:47.180
en este caso va a ser el column

02:42:49.040 --> 02:42:52.000
expando aquí y debería aparecerle la vista

02:42:53.060 --> 02:42:55.700
que creo, es decir, debería aparecerle por lo menos

02:42:55.700 --> 02:42:59.780
ahí el número uno diciéndole que aquí

02:42:59.780 --> 02:43:03.520
está la vista expando aquí y aquí está la pequeña vista aquí

02:43:03.520 --> 02:43:08.180
de esta pequeña vista me interesa nada más analizar el total

02:43:10.600 --> 02:43:17.020
y entonces aquí lo siguiente recordarán

02:43:17.700 --> 02:43:21.820
en que para que yo pueda ejecutar un análisis por lo menos tengo que

02:43:21.820 --> 02:43:26.140
agregarle un indicador a cada una de las columnas

02:43:26.140 --> 02:43:29.780
en este caso nada más tengo una columna pero voy a agregarle nada más un patrón

02:43:29.780 --> 02:43:32.180
entonces vete aquí donde dice pattern

02:43:33.220 --> 02:43:36.900
y busca el patrón que agregaste anteriormente

02:43:36.900 --> 02:43:41.220
aquí está verificar totales factura le das ok

02:43:43.940 --> 02:43:45.820
y colócale una alerta

02:43:46.380 --> 02:43:49.180
para que cumpla la condición al 100%

02:43:49.180 --> 02:43:53.000
¿Cómo haríamos ahí? Sería 99, mayor a 99, verdad, o menor a 101

02:43:55.040 --> 02:43:56.000
más preciso

02:43:58.400 --> 02:44:01.240
ah bueno, este como es numérico el valor

02:44:01.240 --> 02:44:03.200
me toca por número, qué pena, hay veces que sale

02:44:04.980 --> 02:44:09.180
no, aquí no podría ser el indicador porque este indicador

02:44:09.900 --> 02:44:12.500
no me da por porcentaje

02:44:13.700 --> 02:44:17.560
si la cantidad de elementos es menor a uno

02:44:17.560 --> 02:44:21.180
mi escuela me confundió, ahora un momento, vamos a ejecutar un momento

02:44:21.180 --> 02:44:24.860
y sacamos la regla a seguir, vamos a ejecutar un momento

02:44:26.600 --> 02:44:29.560
debería aparecer y todos cumplen el 100%

02:44:30.100 --> 02:44:32.860
no, aquel indicador es por número, no, no podría

02:44:33.260 --> 02:44:37.560
Nadia, me preocupa que a ti no tienes el 100%, no

02:44:38.660 --> 02:44:41.920
mi escuela, ahora me preocupo, vamos a ver

02:44:41.920 --> 02:44:43.860
vamos a ver qué pasó

02:44:44.780 --> 02:44:45.260
eh

02:44:46.580 --> 02:44:50.140
busca el patrón por favor, el patrón que hiciste

02:44:52.060 --> 02:44:54.600
eh no, dale cancelar acá, lo tienes del lado derecho

02:44:54.600 --> 02:44:56.660
le das doble X del lado derecho

02:44:59.420 --> 02:45:01.680
listo, ya lo abrió

02:45:03.160 --> 02:45:07.860
carajo, si lo tienes igual, muéstrame por favor los que no cumplen

02:45:08.580 --> 02:45:11.840
vete ahora, vete al análisis

02:45:11.840 --> 02:45:14.420
y muestra los que no cumplen

02:45:14.420 --> 02:45:15.960
en el resultado

02:45:17.660 --> 02:45:20.960
el 84 no cumple, clic derecho

02:45:20.960 --> 02:45:25.920
valores inválidos

02:45:30.120 --> 02:45:31.560
ahora muéstrame

02:45:31.560 --> 02:45:34.960
la consulta para ver, la de la vista

02:45:35.840 --> 02:45:38.140
el 404.13, vamos a ver

02:45:43.700 --> 02:45:45.060
no veo el error

02:45:46.180 --> 02:45:48.360
ah, en el where tienes un más, un momento

02:45:49.040 --> 02:45:52.600
en el where es igual tienes un más, es un producto cartesiano ahí

02:45:52.600 --> 02:45:56.740
igual, igual, igual, seguramente por la problema del teclado

02:45:56.740 --> 02:46:00.520
ok, el símbolo, y ahora bueno hay que cambiar la

02:46:00.520 --> 02:46:02.140
sentencia por create or replace

02:46:04.060 --> 02:46:06.960
listo, allá de create agregale or replace

02:46:09.640 --> 02:46:10.520
or replace

02:46:11.720 --> 02:46:14.540
ejecuta para ver, no, eh, es lo que decía

02:46:15.260 --> 02:46:18.860
tengo la duda ahora, colócalo un punticoma ahí en la línea siete al final

02:46:18.860 --> 02:46:22.960
era la pregunta que me decía ahora alguien, eh, punticoma, hay distintos puntos

02:46:26.200 --> 02:46:27.080
ah, sí

02:46:27.080 --> 02:46:30.660
no, para no perder mucho tiempo, nada más selecciona

02:46:32.220 --> 02:46:33.680
eh, va a buscar el punticoma

02:46:33.680 --> 02:46:36.380
bueno, listo, entonces

02:46:38.320 --> 02:46:41.580
bueno, eh, dígame

02:46:41.580 --> 02:46:44.700
¿Quién me, me habló por ahí?

02:46:45.940 --> 02:46:49.680
Gerardo, voy contigo entonces, vamos a ver

02:46:55.020 --> 02:46:57.940
dale ok, un momento ahí

02:46:57.940 --> 02:47:00.940
dale ok, ahí, ¿por qué? muéstrame

02:47:00.940 --> 02:47:04.660
eh, la, la regla en favor, muéstrame el, el

02:47:04.660 --> 02:47:07.780
el regex, perdón, el SQL, doble clic

02:47:08.920 --> 02:47:13.160
el regex, el patrón del SQL, ahí está bien, muéstrame

02:47:13.160 --> 02:47:16.380
sí, ahí está bien, no, ahí está bien, muéstrame el análisis por favor

02:47:17.060 --> 02:47:20.840
el análisis que hiciste, vete al setting, vete donde dice pattern un momento, pattern

02:47:21.480 --> 02:47:24.640
patrón, patrón para, sí, sí, para el momento

02:47:25.680 --> 02:47:28.420
expande ahí por favor, sí, tienes ese, o sea

02:47:28.420 --> 02:47:32.460
vamos a ver, dale ok para ver nuevamente, para ver el rock que hice, que tampoco decía

02:47:33.060 --> 02:47:36.400
mucho, dale escuchado para ver, como así, vete

02:47:36.400 --> 02:47:40.420
muéstrame la vista, para, da, da, refresca, refresca por favor ahí

02:47:41.160 --> 02:47:44.280
muéstrame la vista, ¿cómo te quedó? expande la vista ahí

02:47:44.780 --> 02:47:48.520
identificado el total, ahora, vamos nuevamente acá, bueno, vete nuevamente

02:47:48.520 --> 02:47:51.160
al, al, al

02:47:52.140 --> 02:47:56.020
pero lo raro, no, no, no, ahí, ahí está lo raro, lo que pasa es que

02:47:56.020 --> 02:48:00.020
eh borra nuevamente, borra, en la x borrarte la columna esa

02:48:01.780 --> 02:48:04.580
para que no hay control, ya, ya, ya, ya, ya, ya, ya, ya, ya, ya, ya, ya, ya, ya, ya, ya, ya, ya, ya

02:48:04.580 --> 02:48:07.740
select indicator, dale nuevamente, pero eso, select column, perdón

02:48:07.740 --> 02:48:10.780
select column, select column, por favor

02:48:11.760 --> 02:48:16.020
expande la vista por favor y muéstrame la metadata, expande ahí, dale clic

02:48:16.860 --> 02:48:19.800
eh, pero, ah, ya, entendí, vete nuevamente

02:48:19.800 --> 02:48:23.680
a, a tu, a tu word page, ah, no, pero, es que acá

02:48:23.680 --> 02:48:24.560
lo que parece, lo que pasa es

02:48:24.560 --> 02:48:25.780
que como le cambiaste el nombre,

02:48:26.020 --> 02:48:28.040
vete nuevamente acá al ¿Qué

02:48:28.040 --> 02:48:31.860
pena? Al al talen, dale acá,

02:48:31.960 --> 02:48:32.660
al tal, no, vete al tal, vete

02:48:32.660 --> 02:48:35.700
al tal. Dale en la conexión,

02:48:35.820 --> 02:48:37.380
dale refrescar, clic derecho en

02:48:37.380 --> 02:48:38.700
la conexión y recuperar list,

02:48:38.800 --> 02:48:39.920
reload, reload, la primera

02:48:39.920 --> 02:48:41.380
opción, reload, database list,

02:48:41.420 --> 02:48:43.680
la primera opción. Dale reload,

02:48:43.900 --> 02:48:46.100
dale que OK, y ahora me

02:48:46.100 --> 02:48:51.720
muestran la vista como te

02:48:51.720 --> 02:48:52.320
dice, ¿Qué pasa table? ¿Se

02:48:52.320 --> 02:48:53.880
dice que está ahí? O muéstrame

02:48:53.880 --> 02:48:55.100
la vista, colapso, ¿te digo?

02:48:55.480 --> 02:48:57.360
Creo que ya te cogió. Baja,

02:48:57.360 --> 02:48:58.240
baja, baja un poquito, baja,

02:48:58.420 --> 02:49:00.520
baja un momento en es, es pan

02:49:00.520 --> 02:49:04.200
de view, es pan de ventas, y

02:49:04.200 --> 02:49:05.020
es pan de column para ver.

02:49:05.120 --> 02:49:06.540
Pero, pero lo raro es que el

02:49:06.540 --> 02:49:08.420
sitio lo detecta a nivel de

02:49:08.420 --> 02:49:10.760
de MySQL y no lo detecta acá.

02:49:11.200 --> 02:49:16.480
Vete nuevamente acá al al al

02:49:16.480 --> 02:49:17.520
World Bench un momento. No,

02:49:17.540 --> 02:49:19.380
porque tiene un punto ahí. No

02:49:19.380 --> 02:49:19.540
tiene un punto ahí. No tiene

02:49:19.540 --> 02:49:22.320
punto L, punto total. Ah, no,

02:49:22.320 --> 02:49:24.460
no, no está bien. No es que

02:49:24.460 --> 02:49:28.020
lo raro es que acá. Ah, sí.

02:49:29.480 --> 02:49:31.760
Ah. Al al al al al al

02:49:31.760 --> 02:49:32.420
ingeniero, bórate un momento

02:49:32.420 --> 02:49:33.860
la tabla esa. Dale clic

02:49:33.860 --> 02:49:34.900
derecho del del lado de la

02:49:34.900 --> 02:49:36.240
tabla de la vista y bórate

02:49:36.240 --> 02:49:38.220
la vista, por favor. Que

02:49:38.220 --> 02:49:39.200
raro que le metes. Dale un

02:49:39.200 --> 02:49:41.180
drop view. La vuelves a

02:49:41.180 --> 02:49:43.100
crear nuevamente. Dale

02:49:43.100 --> 02:49:44.320
ejecutar nuevamente. Dale

02:49:44.320 --> 02:49:45.260
ejecutar. Dale refrescar

02:49:45.260 --> 02:49:46.220
la tabla de la vista acá. Para

02:49:46.220 --> 02:49:47.120
eso te la creó, que estuvo

02:49:48.200 --> 02:49:49.820
detectado. Es pan de ventas

02:49:49.820 --> 02:49:50.800
y ahí tienes total

02:49:50.800 --> 02:49:52.980
identificador, listo. Vamos

02:49:52.980 --> 02:49:54.940
entonces ahora a nuevamente y

02:49:54.940 --> 02:49:57.640
y recarga la conexión. Vale,

02:49:57.860 --> 02:50:01.500
recargar. OK. Normal. Eh eh

02:50:01.500 --> 02:50:03.120
aquí creo que hay un problema

02:50:04.340 --> 02:50:06.380
con y es a lo siguiente, para

02:50:06.380 --> 02:50:07.760
ver si el problema es la

02:50:07.760 --> 02:50:09.200
conexión o ya o MySQL.

02:50:09.440 --> 02:50:10.340
Créate una nueva conexión

02:50:10.340 --> 02:50:10.920
de base de datos, me

02:50:10.920 --> 02:50:13.040
interesa, por favor. Dale

02:50:13.040 --> 02:50:13.780
clic derecho, sí, clic

02:50:13.780 --> 02:50:15.400
derecho, crear database,

02:50:15.560 --> 02:50:16.620
conexión, dale chinook uno,

02:50:16.740 --> 02:50:18.540
intentamos para ver si esa

02:50:18.540 --> 02:50:20.040
nueva conexión me trae la

02:50:20.040 --> 02:50:20.640
configuración de ella,

02:50:20.700 --> 02:50:22.640
tráeme la configuración,

02:50:22.920 --> 02:50:26.360
claro, chinook uno, listo,

02:50:26.440 --> 02:50:28.360
MySQL, listo, dale next,

02:50:28.620 --> 02:50:31.460
dale next, MySQL, root,

02:50:31.740 --> 02:50:33.820
root, server ciento veintisiete

02:50:33.820 --> 02:50:35.920
punto cero punto cero punto

02:50:35.920 --> 02:50:37.800
cero punto cero punto uno y

02:50:37.800 --> 02:50:41.700
la data se llama chinook chinook

02:50:41.700 --> 02:50:42.900
dale test connection por si

02:50:42.900 --> 02:50:44.700
acaso listo, bien, OK, dale

02:50:44.700 --> 02:50:47.000
finish y ahora vete a chinook

02:50:47.000 --> 02:50:49.380
uno, por favor, abajo chinook

02:50:50.660 --> 02:50:55.220
uno chinook uno y expande la

02:50:55.220 --> 02:50:58.040
vista expande ventas. Bueno,

02:50:58.040 --> 02:50:59.540
ahora a lo siguiente, cambia

02:50:59.540 --> 02:51:00.880
la conexión en el análisis,

02:51:00.960 --> 02:51:03.000
en el análisis, cuando dice

02:51:03.000 --> 02:51:04.680
connection, escoge chinook

02:51:04.680 --> 02:51:08.560
uno, expande ahí con voz o

02:51:08.560 --> 02:51:09.360
tiene que refrescar, tiene

02:51:09.360 --> 02:51:10.460
que cerrar y volver a abrir

02:51:10.460 --> 02:51:11.860
porque no coge la la

02:51:11.860 --> 02:51:17.460
conexión, listo, créate,

02:51:17.680 --> 02:51:19.080
expande ahí y escoge chinook

02:51:19.080 --> 02:51:20.840
uno, ahí listo, ahora

02:51:20.840 --> 02:51:22.220
selecciona, dale yes,

02:51:23.000 --> 02:51:24.000
selecciona la cruz, yes,

02:51:27.520 --> 02:51:28.640
esa tiene que borrarla,

02:51:28.700 --> 02:51:30.940
OK, dale OK y la borras,

02:51:31.200 --> 02:51:32.940
dale OK ahí, borrála ahí

02:51:32.940 --> 02:51:35.700
y ya está borrado, listo,

02:51:35.880 --> 02:51:38.940
dale select column, expande

02:51:41.200 --> 02:51:43.080
y ahí sería total, listo,

02:51:43.180 --> 02:51:45.100
dale OK, agrega el patrón,

02:51:45.200 --> 02:51:47.720
agrega el patrón, por favor

02:51:51.640 --> 02:51:53.780
OK, eso dale ejecutar,

02:51:54.680 --> 02:51:57.060
no, eso no lo configuramos,

02:51:58.380 --> 02:51:59.840
ejecutar, ejecutar, así.

02:52:00.780 --> 02:52:03.040
Bueno, ahí como que hay un

02:52:03.040 --> 02:52:04.940
problema, como que no actualiza,

02:52:05.520 --> 02:52:06.720
no sé, no actualizo, bueno,

02:52:06.760 --> 02:52:08.580
ahí pasó algo raro.

02:52:09.120 --> 02:52:11.120
Bueno, sigamos entonces.

02:52:12.760 --> 02:52:15.220
Vamos a crear un patrón,

02:52:15.560 --> 02:52:18.660
pero ahora tipo regex,

02:52:18.840 --> 02:52:20.320
tipo regex.

02:52:20.800 --> 02:52:22.200
Para esto entonces, por

02:52:22.200 --> 02:52:25.100
favor, hacemos lo siguiente,

02:52:25.840 --> 02:52:26.980
hasta que cambie aquí,

02:52:27.080 --> 02:52:29.100
listo, vamos aquí donde dice

02:52:30.960 --> 02:52:32.740
regex y vamos a crear entonces,

02:52:32.920 --> 02:52:34.440
vamos a crearlo aquí donde dice

02:52:34.440 --> 02:52:36.680
me, a lo que no hay,

02:52:36.960 --> 02:52:37.760
créate una carpeta para

02:52:38.400 --> 02:52:40.040
localizarnos, créate un folder

02:52:40.040 --> 02:52:41.100
aquí dentro de regex,

02:52:42.400 --> 02:52:43.640
llámalo entonces, mail,

02:52:43.780 --> 02:52:44.840
para conservar los nombres ahí

02:52:44.840 --> 02:52:46.440
en inglés, mail,

02:52:47.660 --> 02:52:49.640
y te voy a compartir algo

02:52:50.640 --> 02:52:53.440
entonces, mail de correo para

02:52:53.440 --> 02:52:55.160
para validarlo, para que deja

02:52:55.160 --> 02:52:55.940
conservar lo mismo.

02:52:56.260 --> 02:52:57.840
Por aquí tengo un, hago un

02:52:57.840 --> 02:52:58.800
regex, un momento por aquí,

02:52:58.840 --> 02:53:00.760
un momentico y busco aquí, un

02:53:00.760 --> 02:53:02.980
momento para compartirle un regex.

02:53:03.160 --> 02:53:04.900
Váyase a la carpeta que se

02:53:04.900 --> 02:53:06.500
llama carpeta compartida que

02:53:06.500 --> 02:53:07.680
creo que está ahí, para

02:53:07.680 --> 02:53:08.860
colocarlo ahí, no pasarlo por

02:53:08.860 --> 02:53:11.360
acá por, y ahí hay algunos que

02:53:11.360 --> 02:53:12.480
no le sirve copiar y pegar,

02:53:12.640 --> 02:53:14.320
entonces para copiarlo allá.

02:53:14.940 --> 02:53:17.680
Vamos entonces, un momento

02:53:17.680 --> 02:53:18.880
por favor,

02:53:22.520 --> 02:53:23.480
relance, clientes,

02:53:24.220 --> 02:53:24.960
un momentico.

02:53:24.980 --> 02:53:26.360
Vamos a colocar este regex

02:53:26.360 --> 02:53:27.600
para ver qué tal funciona.

02:53:27.700 --> 02:53:28.500
Vamos aquí a colocar

02:53:28.500 --> 02:53:30.160
cualquier, un momento.

02:53:33.700 --> 02:53:34.960
No, un momento, no estoy

02:53:34.960 --> 02:53:35.960
comprando hoy, un momento.

02:53:36.700 --> 02:53:38.920
Bueno, ese momento ya carga,

02:53:39.120 --> 02:53:39.280
listo.

02:53:39.340 --> 02:53:40.660
Entonces, vayamos aquí a lo

02:53:40.660 --> 02:53:41.280
siguiente.

02:53:43.800 --> 02:53:44.840
Vayamos a

02:53:44.840 --> 02:53:46.960
carpeta compartida,

02:53:48.220 --> 02:53:48.700
URL,

02:53:50.220 --> 02:53:51.680
voy a copiar esta URL,

02:53:51.880 --> 02:53:53.020
y la voy a pegar en el

02:53:53.020 --> 02:53:53.360
browser.

02:54:02.280 --> 02:54:04.320
Y aquí está un regex que está

02:54:06.080 --> 02:54:06.540
aquí.

02:54:07.260 --> 02:54:08.400
Copié mal el nombre, pero

02:54:08.400 --> 02:54:09.200
bueno, aquí está.

02:54:09.360 --> 02:54:10.420
Copié por favor la expresión

02:54:10.420 --> 02:54:12.920
esa que está ahí.

02:54:19.460 --> 02:54:23.000
Bueno, este es un regex que

02:54:23.000 --> 02:54:25.360
ya no lo tuve mucho en cuenta

02:54:25.360 --> 02:54:26.520
algunas cosas, pero vamos a

02:54:26.520 --> 02:54:27.660
ver cómo nos funciona para

02:54:27.660 --> 02:54:30.580
saber cómo se hace regex.

02:54:31.580 --> 02:54:32.560
Entonces, ya después que

02:54:32.560 --> 02:54:34.440
tenga el regex como tal,

02:54:34.640 --> 02:54:36.140
ya habíamos creado una

02:54:36.140 --> 02:54:38.700
pequeña carpeta que se llama

02:54:39.540 --> 02:54:40.160
email.

02:54:40.620 --> 02:54:42.020
Dale clic derecho por favor

02:54:42.020 --> 02:54:47.340
y dígale nuevo regex.

02:54:48.420 --> 02:54:50.560
Y llámela por favor.

02:54:52.960 --> 02:54:53.440
Validar.

02:54:54.820 --> 02:54:56.660
Perdón, verificar, verificar,

02:54:57.600 --> 02:54:58.900
correo, verificar, correo.

02:54:58.900 --> 02:55:01.620
Vamos a darle aquí en next.

02:55:03.900 --> 02:55:05.720
Y ahora la expresión, diga,

02:55:06.300 --> 02:55:06.780
sí.

02:55:07.520 --> 02:55:09.500
Ah, sí, este, vete, ¿Quién

02:55:09.500 --> 02:55:10.280
me habló? Gerardo, sí,

02:55:10.340 --> 02:55:11.880
Gerardo, sí, mucho bien.

02:55:12.660 --> 02:55:13.600
Gerardo, mira lo siguiente.

02:55:15.180 --> 02:55:17.060
Vete a lo siguiente, vete al

02:55:17.060 --> 02:55:18.500
escritorio y vas a encontrar

02:55:18.500 --> 02:55:19.760
una carpeta que se llama

02:55:19.760 --> 02:55:20.660
Entra la carpeta, entra la

02:55:20.660 --> 02:55:22.840
ORL, por favor. A ese

02:55:22.840 --> 02:55:25.420
archivo se llama ORL.

02:55:25.880 --> 02:55:27.620
Copia, por favor, copia la

02:55:27.620 --> 02:55:28.320
dirección para decirte

02:55:28.320 --> 02:55:29.460
listo, cópiala y ábrelo en

02:55:29.460 --> 02:55:30.180
el blóser, por favor.

02:55:30.180 --> 02:55:31.620
Entra ahí y hay una carpeta

02:55:31.620 --> 02:55:34.420
que se llama regex.

02:55:34.640 --> 02:55:36.180
Ahí está regex. Entra el

02:55:36.180 --> 02:55:38.080
archivo regex y ahí está la

02:55:38.080 --> 02:55:39.160
la presión regular.

02:55:41.840 --> 02:55:43.280
No, cópiala, cópiala,

02:55:43.400 --> 02:55:44.400
cópiala. Ahí cópiala

02:55:44.400 --> 02:55:46.620
directamente ahí. Y ahora te

02:55:46.620 --> 02:55:48.680
daría así entonces. Ahora,

02:55:48.860 --> 02:55:50.640
entre comillas simples,

02:55:51.000 --> 02:55:51.820
metemos la expresión que

02:55:52.240 --> 02:55:54.320
copiamos. Nos quedaría así.

02:55:55.040 --> 02:55:56.620
Entre comillas simple. Aquí

02:55:56.620 --> 02:55:57.740
le de un espacio en blanco

02:55:57.740 --> 02:55:58.920
ahí. Ojo, con el espacio en

02:55:58.920 --> 02:56:00.300
blanco al final. Que no me va

02:56:00.300 --> 02:56:01.280
a dar igual. Le das por

02:56:01.280 --> 02:56:02.860
defecto y le das finish

02:56:02.860 --> 02:56:03.560
aquí.

02:56:07.200 --> 02:56:08.200
Y te crea la expresión

02:56:08.200 --> 02:56:09.860
regular de esa forma. Si tú

02:56:09.860 --> 02:56:10.960
quieres la puedes testear

02:56:10.960 --> 02:56:12.040
aquí. Entonces, si le das

02:56:12.040 --> 02:56:13.160
clic aquí en test.

02:56:14.240 --> 02:56:14.960
Entonces, tienes la

02:56:14.960 --> 02:56:15.620
expresión y aquí colocas

02:56:15.750 --> 02:56:17.770
alguna algo para bailarlo,

02:56:18.050 --> 02:56:19.710
¿OK? Pero hagamos lo

02:56:19.710 --> 02:56:20.450
siguiente y probémoslo

02:56:20.450 --> 02:56:21.290
inmediatamente que estamos

02:56:21.290 --> 02:56:23.750
casi para la para el almuerzo.

02:56:24.810 --> 02:56:25.730
Sí, me habló.

02:56:27.270 --> 02:56:28.790
No sé, vamos a ver qué

02:56:28.790 --> 02:56:31.230
pasó. Ah, no, listo, no,

02:56:31.230 --> 02:56:32.190
listo, porque tiene que estar

02:56:32.190 --> 02:56:32.710
cerrado entre comillas

02:56:32.710 --> 02:56:34.650
simple. Al inicio y al fin

02:56:34.650 --> 02:56:35.630
comía. Agregue las comillas

02:56:35.630 --> 02:56:36.390
simple para ver si está

02:56:36.390 --> 02:56:37.770
amable. Y al inicio. Listo,

02:56:37.770 --> 02:56:39.130
ahora sí, dele finish, dele

02:56:39.130 --> 02:56:40.730
finish. Perfecto. Entonces,

02:56:40.970 --> 02:56:41.910
probemos esta parte,

02:56:42.130 --> 02:56:43.590
probemos la expresión. Creemos

02:56:43.590 --> 02:56:44.630
aquí entonces un nuevo

02:56:45.770 --> 02:56:49.070
análisis, nuevo análisis, va

02:56:49.070 --> 02:56:50.770
a ser de tipo basic.

02:56:55.050 --> 02:56:58.210
Y este se va a llamar análisis

02:56:58.210 --> 02:57:03.050
expresión regular, correo.

02:57:04.270 --> 02:57:08.550
Propósito, validar el correo

02:57:08.550 --> 02:57:10.970
con un regex o en inglés o

02:57:10.970 --> 02:57:11.490
en español, expresión

02:57:11.490 --> 02:57:14.570
regular con un regex

02:57:15.750 --> 02:57:17.990
personalizado. Validar el

02:57:17.990 --> 02:57:18.950
correo con un regex

02:57:18.950 --> 02:57:22.550
personalizado. Se llama análisis

02:57:22.550 --> 02:57:24.370
expresión regular correo o

02:57:24.370 --> 02:57:25.690
análisis regex correo como tú

02:57:25.690 --> 02:57:26.850
quieres, es para verificar

02:57:26.850 --> 02:57:28.370
cómo se hace con expresiones.

02:57:28.970 --> 02:57:29.870
Ya sabes que lo puedes hacer

02:57:29.870 --> 02:57:31.350
a nivel de CQL o a nivel de

02:57:31.350 --> 02:57:33.190
expresión regular. Se aplica

02:57:33.190 --> 02:57:34.230
todo lo que has aprendido

02:57:34.230 --> 02:57:35.230
en expresión regular, lo que

02:57:35.230 --> 02:57:36.110
tú quieras puedes validarlo

02:57:36.110 --> 02:57:37.950
aquí. Te damos aquí finish

02:57:37.950 --> 02:57:41.230
entonces y vamos a escoger el

02:57:41.230 --> 02:57:42.670
email que está en customer

02:57:42.670 --> 02:57:45.770
como columna nada más. En la

02:57:45.770 --> 02:57:47.110
conexión de MySQL vamos

02:57:47.110 --> 02:57:50.770
entonces aquí dale chinook y

02:57:50.770 --> 02:57:51.970
busco la tabla que se llama

02:57:51.970 --> 02:57:56.850
customer. Y en customer

02:57:56.850 --> 02:57:58.250
solamente voy a escoger

02:57:58.250 --> 02:58:03.950
entonces correo. Te damos

02:58:03.950 --> 02:58:09.650
aquí OK. Debes escoger nada

02:58:09.650 --> 02:58:10.750
más correo o email, bueno

02:58:10.750 --> 02:58:13.410
email. Seleccione si usted

02:58:13.410 --> 02:58:14.330
quiere un identificador,

02:58:14.390 --> 02:58:15.450
aunque no necesario, quiero

02:58:15.450 --> 02:58:16.770
que me muestre por lo menos

02:58:16.770 --> 02:58:19.770
el road cone. Nada más voy a

02:58:19.770 --> 02:58:20.930
seleccionar road cone, aquí

02:58:20.930 --> 02:58:22.510
nada más me queda aquí. Y

02:58:22.510 --> 02:58:24.730
agregue ahora el patrón de

02:58:24.730 --> 02:58:27.710
tipo regex que hizo ahora. Se

02:58:27.710 --> 02:58:28.890
va aquí donde dice father.

02:58:32.530 --> 02:58:37.430
Aquí tiene regex. Y aquí va

02:58:37.430 --> 02:58:39.570
a buscar entonces mail y

02:58:39.570 --> 02:58:40.890
debería aparecer el que

02:58:40.890 --> 02:58:42.570
agregó nuevo. Y le da

02:58:42.570 --> 02:58:47.950
entonces OK. Nada más le

02:58:47.950 --> 02:58:49.370
agregué road cone. Road cone

02:58:49.370 --> 02:58:50.950
nada más. Número de filas.

02:58:51.230 --> 02:58:52.270
Y después le agregan el

02:58:52.270 --> 02:58:54.970
patrón ¿OK? ¿Quién me

02:58:54.970 --> 02:58:55.870
decía por allá? Alguien más.

02:58:56.150 --> 02:58:57.670
Road cone. Listo, acto

02:58:57.670 --> 02:58:59.410
seguido entonces, si ya todo

02:58:59.410 --> 02:59:00.950
está configurado, démoslo

02:59:00.950 --> 02:59:03.990
entonces donde dice room.

02:59:07.490 --> 02:59:09.350
Listo, y entonces aquí me

02:59:09.350 --> 02:59:11.370
dice en que ninguno de los

02:59:12.710 --> 02:59:14.510
correos cumple con el patrón.

02:59:14.630 --> 02:59:16.430
Deja a cambiarle ese correo

02:59:16.430 --> 02:59:17.890
un momentico. Voy a

02:59:17.890 --> 02:59:19.390
cambiarle este, voy a ver

02:59:19.390 --> 02:59:21.370
los correos que están aquí.

02:59:22.150 --> 02:59:24.850
En para ver de qué tipo son

02:59:25.370 --> 02:59:27.010
y agregar un regex entonces

02:59:27.010 --> 02:59:29.270
para eso. Un momento para

02:59:29.270 --> 02:59:30.290
cambiar ese regex que está

02:59:30.290 --> 02:59:34.810
ahí. No lo puedo ver. Un

02:59:34.810 --> 02:59:35.950
momento y me consigo un

02:59:35.950 --> 02:59:37.590
correo para que coincida con

02:59:37.590 --> 02:59:38.710
alguno por lo menos.

02:59:53.490 --> 02:59:55.650
No me sirve ninguna consulta

02:59:55.650 --> 02:59:57.350
hacia la base de datos. Alguno

02:59:57.350 --> 02:59:58.590
me puede mandar aquí por el

02:59:58.590 --> 03:00:01.630
check eh uno de los correos

03:00:01.630 --> 03:00:03.530
dos viéme dos correos por

03:00:03.530 --> 03:00:05.250
ahí para hacer un regex con

03:00:05.250 --> 03:00:06.070
respecto a esos correos por

03:00:06.070 --> 03:00:07.590
lo menos para que para que

03:00:07.590 --> 03:00:10.110
me cuadre con algunos. Que

03:00:10.110 --> 03:00:11.830
no puedo consultar aquí la

03:00:11.830 --> 03:00:12.690
bueno a menos que me vaya

03:00:12.690 --> 03:00:13.750
de un momento. No, ya lo

03:00:13.750 --> 03:00:15.150
hago por acá. Lo hago acá

03:00:15.150 --> 03:00:18.570
con el para traerme dos

03:00:18.570 --> 03:00:19.650
correditos por aquí y hago

03:00:19.650 --> 03:00:20.750
un regex con respecto a

03:00:20.750 --> 03:00:23.350
los correos tres. Aquí le

03:00:23.350 --> 03:00:30.270
damos. Voy a buscar el

03:00:30.270 --> 03:00:32.870
correo de qué tipo son. Creo

03:00:32.870 --> 03:00:35.010
que este correo son sí el

03:00:35.010 --> 03:00:36.030
problema es que es punto con

03:00:36.030 --> 03:00:37.970
punto BR por ejemplo. Un

03:00:37.970 --> 03:00:42.450
momento. Ah listo. Bueno aquí

03:00:42.450 --> 03:00:43.910
tengo uno que me lo generó

03:00:43.910 --> 03:00:45.410
aquí. Vamos. Permítame

03:00:45.410 --> 03:00:46.770
probar este regex para ver

03:00:46.770 --> 03:00:49.170
si funciona un poco mejor.

03:01:12.050 --> 03:01:14.070
Se me perdió el análisis

03:01:14.070 --> 03:01:15.150
¿Cuál era ese? Creo que era

03:01:15.730 --> 03:01:18.610
ese. Ejecuto nuevamente.

03:01:20.150 --> 03:01:21.170
Bueno, aquí le voy a mandar

03:01:21.170 --> 03:01:23.190
eh un reyes, lo voy a poner en

03:01:23.190 --> 03:01:26.510
el archivo. Diferente para

03:01:26.510 --> 03:01:27.830
que el que tenía no era como

03:01:27.830 --> 03:01:30.450
que muy bueno. Entonces, un

03:01:30.450 --> 03:01:33.190
momento, por favor. Voy a

03:01:33.190 --> 03:01:34.210
reemplazar este reyes por

03:01:34.210 --> 03:01:36.670
este. Guardar. Sea nuevamente

03:01:36.670 --> 03:01:37.810
la carpeta compartida, por

03:01:37.810 --> 03:01:39.570
favor. Y copie y reemplace

03:01:39.570 --> 03:01:41.190
reyes que que teníamos con

03:01:41.190 --> 03:01:43.390
el reyes que mandé ahora. Ya

03:01:43.390 --> 03:01:44.890
ese reyes sí está mejor, porque

03:01:44.890 --> 03:01:47.190
actualiza, ya encuentra la

03:01:47.890 --> 03:01:49.430
mayor parte de. Ese reyes lo

03:01:49.430 --> 03:01:50.890
va a hacer lo siguiente. Sí,

03:01:50.970 --> 03:01:51.850
está en la carpeta compartida,

03:01:51.970 --> 03:01:53.150
efectivamente. Es así como

03:01:53.150 --> 03:01:55.250
usted dice. Está en la carpeta

03:01:56.150 --> 03:01:57.610
compartida. Permítame

03:01:57.610 --> 03:01:59.690
comprobar para ver. Del F5

03:01:59.690 --> 03:02:00.930
aquí lo de F5 debería

03:02:01.870 --> 03:02:02.310
cambiar.

03:02:06.670 --> 03:02:07.930
Sí, ahí está. Todo que no

03:02:07.930 --> 03:02:09.730
tenga espacio ni al principio

03:02:09.730 --> 03:02:10.870
ni al final porque ya le

03:02:10.870 --> 03:02:12.870
daña la expresión.

03:02:14.870 --> 03:02:16.910
Sí. Dale F5, por favor, por

03:02:16.910 --> 03:02:18.050
recacar estos modos de cambio.

03:02:18.210 --> 03:02:19.150
Listo, hay algunos que no

03:02:19.150 --> 03:02:19.810
cumple, pero creo que el

03:02:19.810 --> 03:02:20.610
noventa y nueve por ciento

03:02:20.610 --> 03:02:21.630
cumple con ese noventa y

03:02:21.630 --> 03:02:24.430
ocho por ciento. Cumple con

03:02:24.430 --> 03:02:26.110
ese reyes. Pero la idea es

03:02:26.110 --> 03:02:27.610
que sepa entonces cómo cómo

03:02:27.610 --> 03:02:30.270
cómo agrega un reyes para

03:02:30.270 --> 03:02:32.350
poder utilizar digamos

03:02:32.350 --> 03:02:33.590
verificar elementos de

03:02:33.590 --> 03:02:35.810
calidad. Normalmente pues

03:02:35.810 --> 03:02:37.470
ese tipo de parámetros,

03:02:37.770 --> 03:02:38.930
formatos, te lo está dando

03:02:38.930 --> 03:02:41.110
el gobierno de datos. Lo que

03:02:41.110 --> 03:02:42.270
es que tú tienes que hacer sí

03:02:42.270 --> 03:02:44.550
ahora es cómo haces para

03:02:44.550 --> 03:02:46.130
configurar esa parte. Julio,

03:02:46.150 --> 03:02:47.930
en este caso no te no te

03:02:48.550 --> 03:02:49.930
tienes que el cien por ciento

03:02:49.930 --> 03:02:52.410
¿Qué? ¿Qué reyes tiene?

03:02:52.490 --> 03:02:53.250
¿El antiguo o el nuevo?

03:02:53.250 --> 03:02:55.330
Muestra para ver.

03:02:55.690 --> 03:02:56.630
Muéstrame para ver el reyes

03:02:56.630 --> 03:02:58.290
en el mail para ver. Ahí lo

03:02:58.290 --> 03:02:58.850
tienes. Ah, que no has

03:02:59.490 --> 03:03:00.890
guardado. En verificar

03:03:00.890 --> 03:03:01.670
correo si te das cuenta que

03:03:01.670 --> 03:03:02.570
hay un asterisco en

03:03:02.570 --> 03:03:03.590
verificar correo indica que

03:03:03.590 --> 03:03:05.550
no has guardado. Hazle

03:03:05.550 --> 03:03:06.730
clic ahí y ahora dale

03:03:06.730 --> 03:03:07.650
guardar. Te das cuenta que

03:03:07.650 --> 03:03:08.910
hay un asterisco cuando

03:03:08.910 --> 03:03:10.810
de guardar.

03:03:10.890 --> 03:03:12.970
Aquí, aquí, ahí, ya lo

03:03:12.970 --> 03:03:14.030
viste. A ver, estoy enseñándote

03:03:14.030 --> 03:03:15.950
aquí, ¿no? Sí, ves. Espera

03:03:15.950 --> 03:03:17.090
un momento, te lo coloco.

03:03:17.390 --> 03:03:18.070
Dale guardar ahí, por

03:03:18.070 --> 03:03:19.930
favor. Ahí ya estás. Sí,

03:03:20.190 --> 03:03:21.050
listo, ya viste que cambió.

03:03:21.110 --> 03:03:21.850
Ahora vuelve a ejecutar

03:03:21.850 --> 03:03:22.690
nuevamente. Le cambiaste

03:03:22.690 --> 03:03:23.510
reyes. Muestra para ver

03:03:24.290 --> 03:03:25.310
porque. Muestrame reyes

03:03:25.310 --> 03:03:26.270
nuevamente para ver. Vete a

03:03:26.270 --> 03:03:27.330
verificar el correo. Ah, no,

03:03:27.350 --> 03:03:29.750
ese es el. Ese es el viejo

03:03:29.750 --> 03:03:31.050
o es el nuevo que ve. Sí,

03:03:31.090 --> 03:03:31.790
sí, sí, sí, está ahí.

03:03:32.130 --> 03:03:32.910
Muestra para ver entonces

03:03:33.370 --> 03:03:35.270
nuevamente. Muestra nuevamente

03:03:35.270 --> 03:03:36.910
para ver la el análisis si

03:03:37.050 --> 03:03:38.850
están amables. Muestra. No,

03:03:38.990 --> 03:03:39.690
no, muéstrame el análisis

03:03:39.690 --> 03:03:40.390
nuevamente. Muestrame el

03:03:40.390 --> 03:03:41.050
análisis, está bien.

03:03:41.250 --> 03:03:42.670
Muestrame el análisis.

03:03:45.490 --> 03:03:47.050
Ah, porque te atumaste fue

03:03:47.970 --> 03:03:50.750
total. No, ese análisis.

03:03:51.050 --> 03:03:52.030
No, vete a expresión regular

03:03:52.030 --> 03:03:53.370
correo. El el análisis que

03:03:53.370 --> 03:03:54.870
tienes es el último que se

03:03:54.870 --> 03:03:55.810
llama análisis expresión

03:03:55.810 --> 03:03:59.110
regular correo. Ejecuta ese,

03:03:59.310 --> 03:03:59.650
¿sí? Porque está

03:03:59.650 --> 03:04:01.730
ejecutando era el de el

03:04:01.730 --> 03:04:02.530
anterior te ejecuta ese.

03:04:02.830 --> 03:04:04.010
Baja para ver. Ahora sí,

03:04:04.170 --> 03:04:05.050
tienes el noventa y ocho

03:04:05.050 --> 03:04:07.570
por ciento ahí ve. Sí, estamos

03:04:07.570 --> 03:04:08.410
ejecutando el que no era.

03:04:09.950 --> 03:04:12.070
Bueno, este bueno, nos vamos

03:04:12.070 --> 03:04:13.230
entonces ahora a almuerzo y

03:04:13.230 --> 03:04:14.250
regresamos en una hora, ¿OK?

03:04:14.250 --> 03:04:16.810
Eso, muchas gracias. OK.

03:04:19.930 --> 03:04:21.670
Listo, pues. Nos vemos nos

03:04:21.670 --> 03:04:22.690
vemos una hora, pues. Listo,

03:04:22.730 --> 03:04:23.410
liso, gracias.

03:05:22.950 --> 03:05:25.530
Listo, pues.

03:06:03.390 --> 03:06:04.850
Listo, pues.

03:06:28.750 --> 03:06:31.550
Listo, pues.

03:06:38.250 --> 03:06:41.050
Listo, pues.

03:07:04.510 --> 03:07:05.150
Listo, pues.

03:07:05.150 --> 03:07:06.530
Bueno, nuevamente, buenas

03:07:06.530 --> 03:07:08.510
tardes. Buenas tardes. Espero

03:07:08.510 --> 03:07:11.490
que hayan se descansado un

03:07:11.490 --> 03:07:12.790
poco entonces. Continuamos,

03:07:12.910 --> 03:07:16.230
¿Estamos conectados? Yes.

03:07:17.030 --> 03:07:18.650
Listo, entonces, eh, ya

03:07:18.650 --> 03:07:20.230
hicimos un par de ejemplos

03:07:20.230 --> 03:07:23.590
relacionados con la parte de

03:07:23.590 --> 03:07:25.570
patrones, eh, definimos

03:07:25.570 --> 03:07:26.690
entonces patrones a nivel de

03:07:26.690 --> 03:07:28.590
lo que es y lo que es lo

03:07:28.590 --> 03:07:30.250
que es SQL. Tiene que tener

03:07:30.250 --> 03:07:30.990
en cuenta que estos

03:07:30.990 --> 03:07:31.830
patrones pueden ser

03:07:31.830 --> 03:07:33.390
aplicables a cualquier columna

03:07:33.390 --> 03:07:34.530
que usted quiera agregarle.

03:07:35.150 --> 03:07:36.370
Lo que si tiene lo que lo que

03:07:36.370 --> 03:07:37.270
tiene que revisar es si tiene

03:07:37.270 --> 03:07:38.670
sentido pues al tipo de

03:07:38.670 --> 03:07:40.390
columna como tal. Pero digamos

03:07:40.390 --> 03:07:41.910
que cuando tú defines ya sea

03:07:41.910 --> 03:07:43.610
un patrón, tipo reyes o

03:07:43.610 --> 03:07:45.610
tipo SQL, lo puedes aplicar

03:07:45.610 --> 03:07:47.170
a cualquier columna entonces

03:07:47.170 --> 03:07:50.050
como tal. Bueno, vamos

03:07:50.050 --> 03:07:51.510
entonces a hacer lo

03:07:51.510 --> 03:07:52.450
siguiente, vamos a crear

03:07:52.450 --> 03:07:57.170
ahora un identificador, un

03:07:57.170 --> 03:07:57.790
indicador, perdón,

03:07:57.930 --> 03:07:59.810
identificador, un indicador.

03:08:00.210 --> 03:08:01.370
Entonces, para que me

03:08:01.370 --> 03:08:02.390
recuerde a la tienda antes de

03:08:02.390 --> 03:08:04.470
iniciar esta parte, vamos a lo

03:08:04.470 --> 03:08:06.450
siguiente entonces, cuando ah

03:08:06.450 --> 03:08:08.370
tenemos, bueno, cualquiera de

03:08:08.370 --> 03:08:10.870
estas de estos análisis,

03:08:11.750 --> 03:08:14.790
momento, que reinicie la

03:08:14.790 --> 03:08:17.270
reinicie la interfaz porque

03:08:17.270 --> 03:08:18.830
tenía problemas, voy a coger

03:08:18.830 --> 03:08:20.170
el primero que hicimos que

03:08:20.170 --> 03:08:22.970
fue el de, creo que fue

03:08:22.970 --> 03:08:23.930
este inicialmente, un

03:08:23.930 --> 03:08:25.590
momento, por favor, está un

03:08:25.590 --> 03:08:31.490
momento, está bien. Bueno,

03:08:31.610 --> 03:08:35.850
vamos a ver entonces. Listo,

03:08:35.990 --> 03:08:39.850
ya cargo aquí. Ya lo he

03:08:39.850 --> 03:08:41.110
ejecutado ya, no sé por qué

03:08:41.110 --> 03:08:46.010
lo ejecuté. Voy a ver un

03:08:46.010 --> 03:08:47.350
momento el resultado para

03:08:47.350 --> 03:08:48.070
explicarle qué es lo que

03:08:48.070 --> 03:08:49.470
vamos a hacer entonces.

03:08:51.430 --> 03:08:52.370
Cuando tú ejecutas un

03:08:52.370 --> 03:08:53.850
análisis, notarás entonces

03:08:53.850 --> 03:08:55.150
que esa gráfica lo que

03:08:55.150 --> 03:08:57.770
hacen es un conteo, ¿Verdad? Al

03:08:57.770 --> 03:08:59.250
final, saca el número de

03:08:59.250 --> 03:09:00.430
elementos y te lo presenta en

03:09:00.430 --> 03:09:02.230
un diagrama en barra. Al

03:09:02.230 --> 03:09:03.450
final, esa gráfica que están

03:09:03.450 --> 03:09:05.830
ahí son indicadores que

03:09:05.830 --> 03:09:07.330
cuentan elementos, es decir,

03:09:07.650 --> 03:09:09.770
muestran una gráfica de un

03:09:09.770 --> 03:09:11.650
suceso en netamente

03:09:12.250 --> 03:09:13.510
cuantitativo. Eso es lo que

03:09:13.510 --> 03:09:15.010
es al final. Los

03:09:15.010 --> 03:09:16.090
indicadores, entonces, lo

03:09:16.090 --> 03:09:17.750
que hacen es contar, mostrar

03:09:17.750 --> 03:09:19.390
cuantitivamente el valor de

03:09:19.390 --> 03:09:21.150
algo. Entonces, para crear un

03:09:21.150 --> 03:09:22.350
identificador, nos vamos

03:09:22.350 --> 03:09:23.710
entonces aquí donde dice

03:09:23.710 --> 03:09:26.790
indicator. Aquí hay unos ya

03:09:26.790 --> 03:09:27.910
definidos por la herramienta.

03:09:27.930 --> 03:09:29.110
Vamos a crear nuestro propio

03:09:29.110 --> 03:09:30.770
identificador. Por lo tanto,

03:09:30.990 --> 03:09:32.310
vamos a crear entonces lo

03:09:32.310 --> 03:09:33.590
siguiente, clic derecho,

03:09:33.810 --> 03:09:37.350
nuevo indicador. Voy a hacer

03:09:37.350 --> 03:09:38.790
un indicador muy sencillo

03:09:38.790 --> 03:09:41.050
para que podamos ver cómo

03:09:41.050 --> 03:09:42.770
funciona. El indicador lo

03:09:42.770 --> 03:09:43.970
que va a contar es

03:09:43.970 --> 03:09:46.350
verificar, va a contar el

03:09:47.010 --> 03:09:49.290
número de veces en que una

03:09:49.290 --> 03:09:50.470
cadena de string empieza

03:09:51.770 --> 03:09:52.750
mayúscula. Es sumamente

03:09:53.190 --> 03:09:54.910
sencillo. Que si carece de

03:09:54.910 --> 03:09:56.630
sentido, pues, muy poco,

03:09:57.330 --> 03:09:58.230
porque normalmente, aunque

03:09:58.230 --> 03:09:59.430
tenga un formato, es más

03:09:59.430 --> 03:10:00.430
fácil de hacer con otras

03:10:00.430 --> 03:10:01.850
cosas. Pero lo que va a

03:10:01.850 --> 03:10:03.470
ser sencillamente es contar

03:10:03.470 --> 03:10:05.430
si una cadena de string

03:10:06.090 --> 03:10:07.250
inicia mayúscula. Eso es

03:10:07.250 --> 03:10:07.910
lo único que va a contar.

03:10:09.090 --> 03:10:10.670
Entonces, voy a colocar

03:10:10.670 --> 03:10:11.450
identificador de esta

03:10:11.450 --> 03:10:13.870
forma. Contador, voy a

03:10:13.870 --> 03:10:14.870
llamarlo de esta forma.

03:10:16.810 --> 03:10:19.870
Contador, contador inicia

03:10:21.430 --> 03:10:23.490
iniciales un derechor

03:10:23.490 --> 03:10:29.150
mayúscula. Propósito, contar

03:10:29.150 --> 03:10:34.170
el número de veces que una

03:10:34.170 --> 03:10:42.030
variable string inicia en

03:10:43.670 --> 03:10:44.590
mayúscula. Voy a cambiar

03:10:44.590 --> 03:10:45.750
ese string porque es más de

03:10:45.750 --> 03:10:46.510
tipo de texto, entonces voy

03:10:46.510 --> 03:10:47.450
a cambiar de su mejora de

03:10:47.450 --> 03:10:49.250
texto, es decir, contar el

03:10:49.250 --> 03:10:50.050
número de veces que una

03:10:50.050 --> 03:10:51.970
variable de texto, de tipo

03:10:51.970 --> 03:10:53.330
texto va a contrar para que

03:10:53.330 --> 03:10:55.070
sea. De tipo texto inicia

03:10:55.070 --> 03:10:56.490
en mayúscula. Eso es lo

03:10:56.490 --> 03:10:57.930
que va a hacer. Va a hacer

03:10:57.930 --> 03:11:00.310
más nada. Nada del otro

03:11:00.310 --> 03:11:01.610
mundo. Vamos con una

03:11:01.610 --> 03:11:02.770
cuestión muy sencilla y

03:11:02.770 --> 03:11:03.770
después vamos inventando

03:11:03.770 --> 03:11:06.070
entonces la complejidad de

03:11:06.070 --> 03:11:08.930
los ejercicios. Vamos a

03:11:08.930 --> 03:11:09.830
ver y le damos entonces

03:11:09.830 --> 03:11:11.990
aquí finish.

03:11:17.230 --> 03:11:18.990
E indicadores hay de cuatro

03:11:18.990 --> 03:11:20.790
tipos. Vamos con el más

03:11:20.790 --> 03:11:23.410
sencillo que es el que cuenta

03:11:23.410 --> 03:11:25.150
elementos. Ese es el más

03:11:25.150 --> 03:11:26.910
sencillo de todos. Contar

03:11:26.910 --> 03:11:30.110
elementos. Entonces, para

03:11:30.110 --> 03:11:30.890
definir el tipo

03:11:30.890 --> 03:11:32.710
identificador, aquí le da

03:11:32.710 --> 03:11:34.070
clic y hay cuatro tipos

03:11:34.070 --> 03:11:36.290
identificadores. En este

03:11:36.290 --> 03:11:37.550
caso voy a hacer es

03:11:37.550 --> 03:11:38.970
conteo de elementos que

03:11:38.970 --> 03:11:40.950
cumplen una condición. Si se

03:11:40.950 --> 03:11:42.090
da cuenta la gráfica por

03:11:42.090 --> 03:11:43.690
ejemplo de nulos, lo que

03:11:43.690 --> 03:11:45.130
hace al final es contar el

03:11:45.130 --> 03:11:46.070
número de veces que una

03:11:46.070 --> 03:11:48.150
columna es nula. Esa es la

03:11:48.150 --> 03:11:49.430
misma idea que tenemos acá

03:11:49.430 --> 03:11:50.930
con el indicador. Va a

03:11:50.930 --> 03:11:52.090
contar el número de veces

03:11:52.090 --> 03:11:54.110
que la columna corresponde

03:11:54.110 --> 03:11:55.090
es igual a la condición

03:11:55.090 --> 03:11:59.070
que vamos a hacer. Entonces

03:11:59.070 --> 03:12:00.530
dejamos por defecto este

03:12:00.530 --> 03:12:02.110
que está aquí que es

03:12:04.630 --> 03:12:06.970
contar por definición de

03:12:06.970 --> 03:12:08.530
la columna y vamos a

03:12:08.530 --> 03:12:10.290
definir entonces la

03:12:10.290 --> 03:12:12.270
sentencia. Para definir

03:12:12.270 --> 03:12:13.170
sentencia nos vamos aquí

03:12:13.170 --> 03:12:15.030
donde dice más.

03:12:17.750 --> 03:12:19.210
Y aquí hay que analizar un

03:12:19.210 --> 03:12:21.430
poco la entrada, la

03:12:21.430 --> 03:12:23.270
entrada. En este caso este

03:12:23.270 --> 03:12:24.570
identificador yo puedo

03:12:24.570 --> 03:12:25.670
hacerlo un identificador

03:12:25.670 --> 03:12:27.430
genérico o un

03:12:27.430 --> 03:12:28.410
identificador bajo un

03:12:28.410 --> 03:12:29.250
lenguaje que en este caso

03:12:29.250 --> 03:12:31.310
únicamente es Java. Es

03:12:31.310 --> 03:12:32.630
decir, identificador

03:12:32.630 --> 03:12:33.830
genérico es para

03:12:33.830 --> 03:12:35.830
cualquiera, digamos motor

03:12:35.830 --> 03:12:37.690
de base de datos, específico

03:12:37.690 --> 03:12:38.930
un motor de base de datos o

03:12:38.930 --> 03:12:39.810
un lenguaje específico

03:12:39.810 --> 03:12:40.750
con este caso que es el de

03:12:40.750 --> 03:12:42.850
Java. Vamos a escoger

03:12:42.850 --> 03:12:43.730
entonces como estamos

03:12:43.730 --> 03:12:44.550
sobre una base de datos

03:12:44.550 --> 03:12:46.270
MySQL, vamos a hacer uno

03:12:46.270 --> 03:12:47.390
específico para MySQL.

03:12:47.550 --> 03:12:49.770
Tome aquí y escoja MySQL

03:12:50.610 --> 03:12:51.710
y le va a cambiar

03:12:51.710 --> 03:12:53.730
entonces los parámetros de

03:12:53.730 --> 03:12:55.610
configuración. Cuando esté

03:12:55.610 --> 03:12:56.730
en esta interfaz dele

03:12:56.730 --> 03:12:57.870
por favor donde dice

03:12:59.790 --> 03:13:02.710
editar. Y notará entonces

03:13:02.710 --> 03:13:04.090
que va a encontrar varias

03:13:05.450 --> 03:13:07.170
pestañas. Pestañas entonces

03:13:07.170 --> 03:13:11.350
donde está full SQL y un

03:13:11.350 --> 03:13:13.950
template que vamos a

03:13:13.950 --> 03:13:15.970
modificar ahora. Entonces lo

03:13:15.970 --> 03:13:17.050
único que usted tiene que

03:13:17.050 --> 03:13:18.850
configurar es la definición

03:13:18.850 --> 03:13:21.070
del indicator. La definición

03:13:21.070 --> 03:13:21.910
del indicator lo que va a

03:13:21.910 --> 03:13:22.890
colocar usted es la

03:13:22.890 --> 03:13:24.790
condición del where que

03:13:24.790 --> 03:13:26.210
usted quiere que se cumpla

03:13:26.210 --> 03:13:27.550
para contar los elementos.

03:13:28.530 --> 03:13:29.770
Nuevamente lo único que va

03:13:29.770 --> 03:13:30.910
a configurar para este tipo

03:13:30.910 --> 03:13:32.650
de indicador es la

03:13:32.650 --> 03:13:33.650
condición del where.

03:13:34.470 --> 03:13:35.790
Partiendo de que la columna

03:13:35.790 --> 03:13:37.050
viene de una base de datos

03:13:37.050 --> 03:13:38.650
en este caso MySQL.

03:13:39.830 --> 03:13:40.870
Entonces que vamos a hacer

03:13:40.870 --> 03:13:42.470
aquí hay varios

03:13:44.050 --> 03:13:45.250
varios template.

03:13:45.830 --> 03:13:46.970
Explico entonces el más

03:13:46.970 --> 03:13:48.050
sencillo. Cuando usted

03:13:48.050 --> 03:13:49.750
escoja column names este que

03:13:49.750 --> 03:13:51.210
está aquí column names

03:13:51.210 --> 03:13:54.010
lo suelta acá perdón

03:13:54.010 --> 03:13:55.190
lo selecciona y lo suelta

03:13:55.190 --> 03:13:57.370
acá. Ese column name está

03:13:57.370 --> 03:13:59.230
de forma genérica porque

03:13:59.230 --> 03:14:00.470
ese column name se

03:14:01.210 --> 03:14:03.070
emplaza por la por el nombre

03:14:03.070 --> 03:14:04.270
de la columna al cual tú

03:14:04.270 --> 03:14:06.030
agregue el indicador. Entonces

03:14:06.030 --> 03:14:07.490
si yo agrego la columna al

03:14:07.490 --> 03:14:09.290
indicador email significa que

03:14:09.290 --> 03:14:11.150
la consulta select la hace

03:14:11.150 --> 03:14:12.010
sobre la tabla que tenga

03:14:12.010 --> 03:14:13.870
análisis where la columna

03:14:13.870 --> 03:14:15.550
que agregue el indicador.

03:14:15.950 --> 03:14:16.930
Por eso que se coloca de

03:14:16.930 --> 03:14:18.210
forma genérica. Pero de

03:14:18.210 --> 03:14:19.110
igual forma tú puedes

03:14:19.110 --> 03:14:20.930
construir una sentencia

03:14:20.930 --> 03:14:22.750
SQL igualmente de forma

03:14:22.750 --> 03:14:24.130
genérica con todos los

03:14:24.130 --> 03:14:25.170
elementos que tú puedes tener

03:14:25.170 --> 03:14:26.790
ya sea elementos de group

03:14:26.790 --> 03:14:28.770
by and or having lo que

03:14:28.770 --> 03:14:31.990
tú quieras. Listo. Listo,

03:14:32.110 --> 03:14:33.450
vamos a lo siguiente. Eh,

03:14:33.770 --> 03:14:35.870
aquí donde dice a esta

03:14:36.510 --> 03:14:39.590
parte. Bueno, listo, vamos a

03:14:39.590 --> 03:14:41.030
lo que me di. Pero te va

03:14:41.030 --> 03:14:44.630
más. Bueno, va. Bueno,

03:14:44.670 --> 03:14:47.350
vamos a ver. Eh, pero si si

03:14:47.350 --> 03:14:47.990
te el indicador significa

03:14:47.990 --> 03:14:48.910
que sería doble clic lo

03:14:48.910 --> 03:14:51.550
puedes ver, ¿no? ¿Quién me

03:14:51.550 --> 03:14:52.430
habló para ver para ver la

03:14:52.430 --> 03:14:54.350
pantalla un momento? Uy,

03:14:54.370 --> 03:14:58.750
vamos a ver, vamos a ver

03:14:58.750 --> 03:15:01.150
la pantalla. Ah, listo. Eh,

03:15:01.230 --> 03:15:03.150
minimiza esta esta que yo te

03:15:03.150 --> 03:15:04.150
deja ver aquí, este que no

03:15:04.150 --> 03:15:05.750
te deja ver. Minimiza aquí

03:15:05.750 --> 03:15:08.630
por favor. Cierra. O baja

03:15:08.630 --> 03:15:10.190
el scroll. Lo que va a ser

03:15:10.190 --> 03:15:12.010
que no te deja ver. Dale

03:15:12.810 --> 03:15:16.270
ahí. Clip, por favor. Y

03:15:16.270 --> 03:15:19.810
escoge eh MySQL. Y después

03:15:19.810 --> 03:15:22.070
le da clic en edit. No, el

03:15:22.070 --> 03:15:23.530
de acá, el edit que está

03:15:23.530 --> 03:15:25.570
en la eh en la scroll de

03:15:25.570 --> 03:15:26.790
barra de barra horizontal.

03:15:27.210 --> 03:15:28.190
Ruedalo a la derecha, por

03:15:28.910 --> 03:15:30.730
favor. Y dale edit. Bueno, si

03:15:30.730 --> 03:15:31.670
te das cuenta, acabo de haber

03:15:31.670 --> 03:15:33.130
unos templates, escoge el

03:15:33.130 --> 03:15:33.990
segundo column name, lo

03:15:33.990 --> 03:15:34.890
selecciona, clic sostenible,

03:15:35.050 --> 03:15:37.510
lo sueltas en en el en el

03:15:37.510 --> 03:15:41.670
text área. Perfecto. Y y

03:15:41.670 --> 03:15:43.270
vamos por ahí entonces.

03:15:46.090 --> 03:15:47.730
Listo, entonces, voy por aquí

03:15:49.530 --> 03:15:51.690
editar column names y aquí

03:15:51.690 --> 03:15:53.730
coloco una expresión cualquiera

03:15:53.730 --> 03:15:55.490
que yo quiera que cumple. En

03:15:55.490 --> 03:15:57.390
este caso en particular quiero

03:15:57.390 --> 03:15:58.990
definir entonces una expresión

03:15:58.990 --> 03:16:00.110
que me valide y que me

03:16:00.110 --> 03:16:02.650
cuente si la primera letra

03:16:02.650 --> 03:16:04.650
del de un texto inicia

03:16:04.650 --> 03:16:05.730
mayúsculas. Eso es lo que va

03:16:05.730 --> 03:16:07.350
a contar. Entonces, ¿Cómo

03:16:07.350 --> 03:16:08.990
hacemos aquí? Como este

03:16:08.990 --> 03:16:10.230
señor es MySQL, voy a

03:16:10.230 --> 03:16:11.490
usar una función de MySQL

03:16:11.490 --> 03:16:12.630
de expresión regular que se

03:16:12.630 --> 03:16:17.610
llama rec x. Así es, rec, un

03:16:17.610 --> 03:16:18.670
momento, te la coloco acá para

03:16:18.670 --> 03:16:21.290
que la veas mejor, rec, te la

03:16:21.290 --> 03:16:23.790
coloco acá, un momento.

03:16:24.750 --> 03:16:28.370
Sería esa. Esta es la rec

03:16:28.370 --> 03:16:33.690
x. Y entonces, aquí coloco,

03:16:34.090 --> 03:16:36.190
digo entonces que inicie,

03:16:37.350 --> 03:16:39.890
quiero sacar el circunflejo

03:16:39.890 --> 03:16:42.330
¿Cómo es? Ah, circunflejo

03:16:42.330 --> 03:16:44.470
¿Cuál es el símbolo?

03:16:49.530 --> 03:16:51.190
Siento ¿Cómo se llama el

03:16:51.190 --> 03:16:51.930
carácter de Tiangulito?

03:16:52.010 --> 03:16:53.510
Circunflejo, ¿Verdad?

03:16:54.410 --> 03:16:55.830
Circunflejo, carácter, voy a

03:16:55.830 --> 03:17:01.170
buscarlo, se me circunflejo

03:17:02.910 --> 03:17:07.790
circunflejo, creo que se

03:17:07.790 --> 03:17:11.450
circunflejo. Este de aquí,

03:17:11.970 --> 03:17:14.330
¿Cómo sale? No sé, pero se me

03:17:14.330 --> 03:17:17.550
olvidó el es este de aquí,

03:17:17.770 --> 03:17:19.110
control C, diciéndole que

03:17:19.110 --> 03:17:21.430
inicie la expresión regular

03:17:22.790 --> 03:17:25.590
quedaría así y le digo que

03:17:25.590 --> 03:17:27.850
esté en un rango de la A

03:17:27.850 --> 03:17:31.850
mayúscula a la Z mayúscula

03:17:32.510 --> 03:17:34.290
entonces cierro aquí, me

03:17:34.290 --> 03:17:35.990
quedaría la expresión al final

03:17:35.990 --> 03:17:38.090
de esta forma. En este caso

03:17:38.090 --> 03:17:39.410
ese función es propio de

03:17:39.410 --> 03:17:41.590
MySQL, con lo tanto, si

03:17:41.590 --> 03:17:43.110
intento ejecutar este

03:17:43.110 --> 03:17:44.930
indicador sobre un motor tipo

03:17:44.930 --> 03:17:46.730
Postgres, va a ser un error

03:17:46.730 --> 03:17:48.170
porque va a intentar hacer esa

03:17:48.170 --> 03:17:49.670
consulta con el REX y no la

03:17:49.670 --> 03:17:51.030
va a encontrar en Postgres de

03:17:51.030 --> 03:17:52.270
esa misma forma o con el

03:17:52.270 --> 03:17:53.950
mismo, la misma sintaxis.

03:17:54.050 --> 03:17:55.210
Quedaría de esa forma. Espero

03:17:55.210 --> 03:17:56.150
que hay alguno estamos con

03:17:56.150 --> 03:17:57.530
otro día el circunflejo. De

03:17:57.530 --> 03:17:58.750
algún modo, si usted sea, voy

03:17:58.750 --> 03:18:02.590
a voy a pegar esto en en la

03:18:02.590 --> 03:18:03.750
carpeta compartida, por si

03:18:03.750 --> 03:18:04.810
acaso, para que tengas el

03:18:04.810 --> 03:18:05.890
circunflejo ahí entonces, si

03:18:05.890 --> 03:18:07.330
no demore mucho, voy a

03:18:07.330 --> 03:18:10.010
agregarle la carpeta. Dale,

03:18:10.370 --> 03:18:12.910
y voy a colocar entonces

03:18:13.750 --> 03:18:15.090
indicador, un archivo llamado

03:18:15.090 --> 03:18:16.390
indicador, voy a colocar la

03:18:16.390 --> 03:18:18.250
expresión esa.

03:18:21.110 --> 03:18:23.170
Entonces, vamos a ver acá.

03:18:25.530 --> 03:18:26.830
Sería ir a la carpeta

03:18:30.110 --> 03:18:30.470
compartida.

03:18:31.790 --> 03:18:33.030
Aquí en el root de la carpeta

03:18:33.030 --> 03:18:34.170
compartida, agregué un archivo

03:18:34.170 --> 03:18:36.850
llama indicator, y ahí está el

03:18:36.850 --> 03:18:38.770
el REX. Bueno, rellenó la

03:18:40.370 --> 03:18:40.730
expresión.

03:18:40.990 --> 03:18:42.810
Como el circunflejo. En el

03:18:42.810 --> 03:18:43.950
raíz, Gerardo, al atrás,

03:18:44.250 --> 03:18:45.670
por favor. Vaya, la cogí. Ah,

03:18:45.670 --> 03:18:46.290
ya, espérate, sí, ya la

03:18:46.290 --> 03:18:47.450
cogí. Al final, debería

03:18:47.450 --> 03:18:48.570
que darle entonces, así

03:18:48.570 --> 03:18:50.410
nada más, la expresión.

03:18:51.770 --> 03:18:52.670
Eduardo, creo que te quedó esa

03:18:52.670 --> 03:18:53.630
expresión muy grande, me

03:18:53.630 --> 03:18:57.090
parece a mí. Creo que la tienes.

03:18:58.530 --> 03:19:00.290
Ah, porque tienes, eh, ¿dónde

03:19:00.290 --> 03:19:01.930
le agregaste? Vete al

03:19:01.930 --> 03:19:04.090
indicator, ahí, ah, no, está

03:19:04.090 --> 03:19:05.890
viendo, ah, sí, sí, sí, que

03:19:05.890 --> 03:19:06.710
estaba viendo el full

03:19:06.710 --> 03:19:09.850
template. Sí, sí, sí. No había

03:19:09.850 --> 03:19:12.970
dado cuenta. Bueno, listo,

03:19:12.970 --> 03:19:13.890
creo que ya la todos la

03:19:13.890 --> 03:19:14.770
tenemos entonces, le damos

03:19:14.770 --> 03:19:18.890
aquí, ¿OK? Listo. Vamos a

03:19:18.890 --> 03:19:22.650
probar entonces, va, ah, se

03:19:22.650 --> 03:19:24.650
va. Voy a cerrar todos estos

03:19:24.650 --> 03:19:25.450
señores para que no me

03:19:26.830 --> 03:19:27.270
causen

03:19:30.950 --> 03:19:31.830
sí, dígame

03:19:33.250 --> 03:19:34.490
¿Quién me ya, quién me

03:19:34.490 --> 03:19:36.570
escribió? Vamos a ver. Ya

03:19:36.570 --> 03:19:37.530
wey. Sí, te quedó. Dale

03:19:37.530 --> 03:19:38.870
nuevamente editar para ver.

03:19:39.370 --> 03:19:40.830
Ah, porque reemplazaste el

03:19:40.830 --> 03:19:42.890
full. Ah, lo siguiente,

03:19:43.330 --> 03:19:44.450
borrá, borráte, porque te

03:19:44.450 --> 03:19:45.770
va, te, te quedó, borráte,

03:19:46.010 --> 03:19:47.690
dale cáncer ahí un momento.

03:19:48.330 --> 03:19:49.990
Y te voy a colocar acá mejor.

03:19:52.070 --> 03:19:53.950
Dale cáncer, borráte ahí en

03:19:53.950 --> 03:19:56.170
la X, borráte esa, ese

03:19:56.170 --> 03:19:57.170
template listo, vete a

03:19:57.170 --> 03:19:59.090
crearlo nuevamente.

03:20:02.190 --> 03:20:03.490
Dale, eh, coge MySQL,

03:20:03.710 --> 03:20:05.150
por favor.

03:20:07.130 --> 03:20:08.230
Dale editar, espérate un

03:20:08.230 --> 03:20:09.230
momento, dale editar. Y al

03:20:09.230 --> 03:20:10.130
final lo que tienes que

03:20:10.130 --> 03:20:11.070
reemplazar nada más es la

03:20:11.070 --> 03:20:13.190
sentencia del web. Y ese

03:20:13.190 --> 03:20:14.530
web se une con el full,

03:20:14.590 --> 03:20:16.290
full SQL. Entonces, ahora

03:20:16.290 --> 03:20:18.210
si pega la la lo que mande

03:20:18.210 --> 03:20:20.050
en el en la carpeta, no sé si

03:20:20.050 --> 03:20:20.750
usted tiene memoria ahí,

03:20:21.170 --> 03:20:22.690
listo. Dale OK. Y ahora

03:20:22.690 --> 03:20:24.030
eso que existe se agregó con

03:20:24.030 --> 03:20:24.950
lo que estaba como template

03:20:24.950 --> 03:20:27.090
anteriormente. Sí, lo

03:20:27.090 --> 03:20:28.210
hiciste, lo creaste en el

03:20:28.210 --> 03:20:30.190
full. O sea, reemplazate,

03:20:30.290 --> 03:20:31.250
reemplazate ahí. Listo.

03:20:31.350 --> 03:20:33.010
Entonces, vamos a probar eso.

03:20:33.170 --> 03:20:34.230
Vamos a probar entonces.

03:20:35.210 --> 03:20:36.410
Vamos a crear aquí un nuevo

03:20:36.410 --> 03:20:39.490
análisis de tipo basic.

03:20:41.490 --> 03:20:44.110
Colundar de tipo básico.

03:20:45.110 --> 03:20:47.150
Entonces vamos a colocarle

03:20:47.150 --> 03:20:51.930
análisis. Indicador. Inicio

03:20:51.930 --> 03:20:55.570
con derechor mayúscula.

03:20:56.050 --> 03:20:59.110
Propósito. Analizar las

03:20:59.770 --> 03:21:03.870
columnas textuales.

03:21:04.930 --> 03:21:08.310
Que inician en mayúscula.

03:21:10.890 --> 03:21:13.450
El yo lo llamé análisis

03:21:13.450 --> 03:21:16.370
indicador inicio mayúscula.

03:21:16.850 --> 03:21:18.570
Análisis indicador inicio

03:21:19.650 --> 03:21:20.210
mayúscula.

03:21:21.090 --> 03:21:22.090
Y el propósito de analizar

03:21:22.090 --> 03:21:23.230
las columnas textuales que

03:21:23.230 --> 03:21:24.690
inician en mayúscula.

03:21:25.090 --> 03:21:26.450
Listo, le damos aquí

03:21:26.450 --> 03:21:27.270
Finish.

03:21:29.270 --> 03:21:31.070
Y vamos a a a escoger

03:21:31.070 --> 03:21:32.730
ahora entonces nuevamente

03:21:32.730 --> 03:21:33.790
la tabla cliente que tiene

03:21:33.790 --> 03:21:35.610
muchos campos textuales.

03:21:35.710 --> 03:21:36.750
Entonces voy aquí al select

03:21:36.750 --> 03:21:37.610
column, ya empieza a hacer

03:21:37.610 --> 03:21:39.030
un proyecto de memoria.

03:21:39.270 --> 03:21:40.190
Voy a la tabla que se llama

03:21:40.190 --> 03:21:41.150
customer.

03:21:44.370 --> 03:21:46.590
Y voy a escoger el first name,

03:21:46.990 --> 03:21:48.690
last name,

03:21:50.330 --> 03:21:53.590
company, y correo, email.

03:21:54.590 --> 03:21:56.390
Cuatro columnas, first name,

03:21:56.830 --> 03:21:58.570
last name, company,

03:21:59.330 --> 03:22:00.170
e email.

03:22:01.170 --> 03:22:03.070
First name, last name,

03:22:04.190 --> 03:22:05.310
company, e email.

03:22:05.310 --> 03:22:05.710
Y ahora vamos a agregar

03:22:05.710 --> 03:22:06.650
cuatro columnas de tipo

03:22:08.330 --> 03:22:08.770
barchar.

03:22:09.210 --> 03:22:10.710
Listo, le damos OK.

03:22:13.190 --> 03:22:14.890
Y ahora a cada una de esas

03:22:14.890 --> 03:22:16.590
columnas le vamos a agregar

03:22:16.590 --> 03:22:18.030
el indicador de usuario.

03:22:18.290 --> 03:22:18.970
¿Cómo lo hacemos?

03:22:19.150 --> 03:22:20.690
Al lado de pattern está

03:22:20.690 --> 03:22:21.370
UDI.

03:22:21.990 --> 03:22:23.250
Dele click en el UDI de

03:22:23.250 --> 03:22:24.470
cada una de las columnas y

03:22:24.470 --> 03:22:26.430
le agrega el indicador que

03:22:26.430 --> 03:22:27.110
acaba de hacer.

03:22:27.650 --> 03:22:28.730
Se voy con la primera,

03:22:29.490 --> 03:22:30.770
expando aquí y aquí aparece

03:22:30.770 --> 03:22:31.950
el contador inicial de

03:22:33.110 --> 03:22:33.790
mayúsculas.

03:22:34.090 --> 03:22:35.550
Listo, OK.

03:22:35.790 --> 03:22:38.070
Voy a este UDI de acá.

03:22:41.750 --> 03:22:42.430
Perfecto.

03:22:44.130 --> 03:22:46.290
Este UDI de acá.

03:23:03.350 --> 03:23:05.430
Como tiene por lo menos un

03:23:05.430 --> 03:23:06.230
UDI, un patrón o

03:23:06.230 --> 03:23:07.110
identificador, puedes

03:23:07.110 --> 03:23:07.710
ejecutar.

03:23:07.790 --> 03:23:09.230
Entonces, vamos

03:23:09.230 --> 03:23:11.610
después que termine esta parte,

03:23:12.090 --> 03:23:13.570
dele room para ver.

03:23:15.790 --> 03:23:15.810
OK.

03:23:15.810 --> 03:23:15.850
Y ahora vamos a agregar

03:23:15.850 --> 03:23:15.870
el indicador de usuario.

03:23:15.870 --> 03:23:16.110
indicador de usuario.

03:23:24.030 --> 03:23:27.170
Bueno, aquí tenemos lo

03:23:27.170 --> 03:23:27.770
siguiente.

03:23:27.870 --> 03:23:29.530
Se me hace raro esta parte.

03:23:31.610 --> 03:23:33.250
Pero el todo empiezan con

03:23:33.250 --> 03:23:34.350
mayúscula la primera.

03:23:35.450 --> 03:23:36.370
Todo empiezan con

03:23:37.110 --> 03:23:37.870
mayúscula.

03:23:38.250 --> 03:23:39.990
Compañía solamente hay 10

03:23:39.990 --> 03:23:41.970
que inician en mayúscula.

03:23:44.110 --> 03:23:46.250
Y correo hay 59 que si me

03:23:46.250 --> 03:23:48.450
hace raro con ese correo que

03:23:48.450 --> 03:23:49.710
no recuerdo que los correos

03:23:49.710 --> 03:23:51.150
iniciaran en mayúscula.

03:23:51.270 --> 03:23:52.590
Permítame confirmar para ver

03:23:52.590 --> 03:23:53.170
estos datos.

03:23:54.350 --> 03:23:54.830
No sé.

03:23:55.190 --> 03:23:56.230
Voy a confirmar los datos

03:23:56.230 --> 03:23:57.450
para ver si están bien o me

03:23:57.450 --> 03:23:58.490
equivoqué de pronto en la

03:23:58.490 --> 03:23:59.150
configuración.

03:23:59.730 --> 03:24:02.670
Voy a consultar los nombres

03:24:03.490 --> 03:24:04.370
de clientes.

03:24:04.510 --> 03:24:05.710
Entonces, voy a colocar aquí

03:24:05.710 --> 03:24:06.190
la primera.

03:24:13.110 --> 03:24:13.510
Listo.

03:24:13.730 --> 03:24:14.230
Esto sí empieza en

03:24:14.230 --> 03:24:14.770
mayúscula.

03:24:15.170 --> 03:24:17.830
Estoy seguro.

03:24:21.430 --> 03:24:21.830
Sí, señor.

03:24:21.970 --> 03:24:22.710
Empecé en mayúscula.

03:24:25.670 --> 03:24:26.070
Compañía.

03:24:29.910 --> 03:24:31.110
Los que no empiezan en

03:24:31.110 --> 03:24:32.070
mayúscula porque están en

03:24:32.070 --> 03:24:32.710
nulos.

03:24:33.550 --> 03:24:34.350
Sí, definitivamente.

03:24:34.350 --> 03:24:36.330
y el último que quedé con la

03:25:00.350 --> 03:25:01.110
cincuenta. Sí.

03:25:05.390 --> 03:25:09.950
Perfecto. Tengo. Bueno, va por

03:25:09.950 --> 03:25:11.210
aquí entonces, señor, está la

03:25:11.210 --> 03:25:14.350
columna, y aquí está un le das

03:25:14.350 --> 03:25:16.270
clic aquí al botoncito, y te va

03:25:16.270 --> 03:25:17.630
a aparecer para escoger entonces

03:25:17.630 --> 03:25:20.390
el indicador. Exactamente. Sí,

03:25:20.490 --> 03:25:22.550
señor, así es.

03:25:28.130 --> 03:25:31.490
Muy. Perfectamente. Entonces,

03:25:31.490 --> 03:25:32.370
¿Ves quién me habló? Julio hoy

03:25:32.370 --> 03:25:34.630
para allá, Julio. Ah, baja un

03:25:34.630 --> 03:25:35.750
momento, Julio. Ah, porque no

03:25:35.750 --> 03:25:37.130
ha guardado, Julio, parece. No

03:25:37.130 --> 03:25:38.390
ha guardado la expresión.

03:25:38.570 --> 03:25:39.450
Mira, mira lo siguiente. Si

03:25:39.450 --> 03:25:40.370
te das cuenta que el nombre

03:25:40.370 --> 03:25:41.350
acá tiene un asterisco,

03:25:41.510 --> 03:25:42.730
indica que no ha guardado.

03:25:43.150 --> 03:25:44.170
Dale guardar primero la

03:25:44.990 --> 03:25:46.610
expresión. Ah, vete, dale

03:25:47.590 --> 03:25:49.090
clic ahí. Date cuenta que tiene

03:25:49.090 --> 03:25:49.810
un asterisco al lado,

03:25:49.990 --> 03:25:50.990
significa no ha guardado. Dale

03:25:50.990 --> 03:25:53.670
guardar entonces. Allá donde

03:25:53.670 --> 03:25:54.550
está el disquecito acá

03:25:54.550 --> 03:25:56.210
arribita. Aquí, aquí, aquí.

03:25:56.570 --> 03:25:57.310
Porque te cuenta que ahora

03:25:57.310 --> 03:25:58.970
te quita ya el el signo.

03:25:58.970 --> 03:25:59.990
Ahora, intenta nuevamente

03:25:59.990 --> 03:26:01.230
ejecutar, ejecuta la, ah,

03:26:01.250 --> 03:26:04.450
bueno, te faltó. Y ejecuta para

03:26:04.450 --> 03:26:05.450
ver cuando termines la

03:26:05.450 --> 03:26:06.410
configuración, por favor.

03:26:08.110 --> 03:26:09.190
Ejecuta cuando termine la

03:26:09.190 --> 03:26:10.270
configuración, listo, vamos

03:26:10.270 --> 03:26:13.690
a ver. Quita esta parte aquí

03:26:13.690 --> 03:26:15.130
para que no te da lo que

03:26:15.650 --> 03:26:17.050
esto porque no minimiza esto

03:26:17.050 --> 03:26:20.230
aquí. Minimiza esto aquí

03:26:20.230 --> 03:26:21.210
porque creo que te está

03:26:21.830 --> 03:26:24.210
cuando terminas de configurar

03:26:24.210 --> 03:26:26.230
esta parte minimízala para

03:26:26.230 --> 03:26:28.030
que no se te vea ahí esta de

03:26:28.030 --> 03:26:30.230
acá abajo. Este dale clic

03:26:30.690 --> 03:26:32.430
aquí. No te minimiza aquí

03:26:32.430 --> 03:26:34.610
aquí. Eso, dale clic ahí

03:26:34.610 --> 03:26:36.770
baja, minimiza ahí. Listo, y

03:26:36.770 --> 03:26:37.750
este cierra la ventana esta

03:26:37.750 --> 03:26:39.930
que está acá, ve. Esta de

03:26:39.930 --> 03:26:41.350
acá arriba, detail view, la

03:26:41.350 --> 03:26:43.690
del, no, aquí está el X,

03:26:43.830 --> 03:26:47.990
ahí está, le cierra. Listo,

03:26:48.150 --> 03:26:48.970
y minimiza, ah, no, ya está

03:26:48.970 --> 03:26:51.790
bien. Listo, pues, eh, ya

03:26:51.790 --> 03:26:52.910
agréate a todos los user ID.

03:26:52.950 --> 03:26:54.130
Ahí te faltó. Ahora sí,

03:26:54.250 --> 03:26:55.070
ejecuta para ver.

03:27:02.390 --> 03:27:04.970
Muéstrame por favor el el

03:27:04.970 --> 03:27:08.150
company tienes diez, pero eh

03:27:08.150 --> 03:27:09.330
muéstrame un momento, sigue

03:27:09.330 --> 03:27:11.510
bajando y muéstrame el de

03:27:11.510 --> 03:27:16.390
e-mail. Un momento, reviso la

03:27:16.390 --> 03:27:17.370
presión regular. No, no,

03:27:17.370 --> 03:27:17.990
listo, está bien, está

03:27:17.990 --> 03:27:19.530
bien. Lo que es que creo que

03:27:19.530 --> 03:27:20.510
no me dio darse cincuenta y

03:27:20.510 --> 03:27:21.490
nueve. Un momento. Un

03:27:21.490 --> 03:27:22.710
momento y reviso esa presión

03:27:22.710 --> 03:27:23.830
regular que está como

03:27:23.830 --> 03:27:23.850
¿Qué es lo que es? Está

03:27:23.850 --> 03:27:25.110
extraña, no sé por qué dio

03:27:26.790 --> 03:27:28.870
eso. Momentico, momento. No,

03:27:28.870 --> 03:27:29.730
la presión regular está bien.

03:27:29.850 --> 03:27:31.050
¿Por qué me dio eso? Bueno, me

03:27:31.050 --> 03:27:33.010
tocó investigar ahora, pues.

03:27:33.690 --> 03:27:35.250
Vamos a seguir porque de no

03:27:35.250 --> 03:27:39.010
devoramos más tiempo. Bueno,

03:27:39.070 --> 03:27:40.110
déjeme y lo investigo que más

03:27:40.110 --> 03:27:40.890
sube esa expresión, pero

03:27:40.890 --> 03:27:42.910
bueno, así se define, eh, un

03:27:42.910 --> 03:27:43.990
indicador. Al final el

03:27:43.990 --> 03:27:44.970
indicador lo que hace es

03:27:44.970 --> 03:27:46.950
contar si la expresión que

03:27:46.950 --> 03:27:48.250
tú colocas es verdadera,

03:27:48.350 --> 03:27:49.270
entonces conte el número de

03:27:49.270 --> 03:27:50.690
elementos que cumplen esa

03:27:50.690 --> 03:27:51.330
expresión y la condición como

03:27:51.330 --> 03:27:53.290
tal. Vamos entonces a seguir

03:27:53.290 --> 03:27:54.590
con otro tipo de ejercicio

03:27:54.590 --> 03:27:56.090
y vamos ahora a hacerlo con

03:27:56.570 --> 03:27:58.730
CSV. A ver si esto lo subí un

03:27:58.730 --> 03:28:01.010
momento. No, un momento, ya

03:28:01.010 --> 03:28:03.790
voy a subir unos archivos que

03:28:03.790 --> 03:28:05.490
no los subí, se me escapó.

03:28:05.770 --> 03:28:07.130
Listo, un momento, tal vez

03:28:07.130 --> 03:28:08.110
no está el cualito. Listo,

03:28:08.110 --> 03:28:09.150
vamos a la carpeta compartida

03:28:09.690 --> 03:28:11.110
nuevamente. Aquí vamos a

03:28:12.130 --> 03:28:13.610
descargar una carpeta que

03:28:13.610 --> 03:28:15.410
subí ahora, que se llama

03:28:16.910 --> 03:28:19.450
F5. F5, un momento aquí. No

03:28:19.450 --> 03:28:20.850
la veo.

03:28:24.790 --> 03:28:26.550
TDQ. Descarga por favor esta

03:28:27.730 --> 03:28:29.930
carpeta. Voy a revisar cuál

03:28:29.930 --> 03:28:31.830
es el que vamos a hacer ahora.

03:28:33.030 --> 03:28:34.750
Listo, yo la tengo aquí, voy

03:28:34.750 --> 03:28:37.410
a descomprimirla.

03:28:39.450 --> 03:28:40.450
Listo, descargas.

03:28:44.550 --> 03:28:45.130
Entonces,

03:28:45.890 --> 03:28:46.770
entonces, vamos a aquí extraer

03:28:47.470 --> 03:28:48.050
todo.

03:28:52.170 --> 03:28:53.330
extraer aquí.

03:28:56.010 --> 03:28:57.330
Listo, esto lo que tiene son

03:28:57.330 --> 03:28:58.650
archivos CSV.

03:29:00.210 --> 03:29:01.270
Que vamos a probar ahora

03:29:01.270 --> 03:29:02.330
entonces.

03:29:03.270 --> 03:29:07.410
Bueno, entonces, si ya

03:29:07.410 --> 03:29:08.990
descargo, por favor, vamos

03:29:08.990 --> 03:29:14.190
entonces a hacer lo siguiente.

03:29:14.950 --> 03:29:16.470
Crece un, una entrada de

03:29:16.470 --> 03:29:18.990
metadata. Mientras respondo

03:29:18.990 --> 03:29:20.650
aquí a algo Jimena. Por cada

03:29:20.650 --> 03:29:21.570
uno de esos archivos, a

03:29:21.570 --> 03:29:22.570
excepción del ten que está

03:29:22.570 --> 03:29:23.250
ahí que se fue.

03:29:24.450 --> 03:29:25.770
Voy a fight the limit, yo

03:29:25.770 --> 03:29:26.590
primero.

03:29:28.050 --> 03:29:29.090
Creamos entonces.

03:29:31.070 --> 03:29:32.990
Y aquí creo una entrada hacia

03:29:35.010 --> 03:29:36.050
anomalias.csv.

03:29:36.750 --> 03:29:37.710
Lo voy a llamar entonces

03:29:38.970 --> 03:29:39.650
anomalias.

03:29:42.150 --> 03:29:42.830
anomalias.

03:29:43.150 --> 03:29:43.830
Next.

03:29:45.050 --> 03:29:46.750
Ya eso viene exactamente lo

03:29:46.750 --> 03:29:48.110
vimos, lo mismo que vimos con

03:29:48.110 --> 03:29:49.310
CSV allá en el talent data

03:29:49.310 --> 03:29:49.950
integration.

03:29:50.730 --> 03:29:52.650
Vamos entonces aquí.

03:29:53.030 --> 03:29:54.090
Subimos este señor,

03:29:54.910 --> 03:29:55.590
anomalias.

03:29:57.450 --> 03:29:58.130
Descargas.

03:29:59.650 --> 03:30:01.410
TDC, TDQ, perdón,

03:30:01.490 --> 03:30:02.130
CSV.

03:30:02.950 --> 03:30:03.630
Anomalias.

03:30:06.830 --> 03:30:07.390
Next.

03:30:08.690 --> 03:30:09.610
Listo, señor, tiene

03:30:09.610 --> 03:30:12.010
encabezado, está separado por

03:30:12.010 --> 03:30:12.370
coma.

03:30:13.790 --> 03:30:15.130
Y doy un refresh para ver.

03:30:17.190 --> 03:30:17.750
Listo.

03:30:20.070 --> 03:30:20.510
Next.

03:30:21.350 --> 03:30:22.570
Y cree una entrada, por

03:30:22.570 --> 03:30:24.450
favor, para cada, para cada

03:30:24.450 --> 03:30:25.290
uno de esos archivos que

03:30:25.290 --> 03:30:26.470
están ahí.

03:30:26.770 --> 03:30:28.630
Mientras respondo aquí a

03:30:28.630 --> 03:30:29.730
ustedes, entonces aquí sería

03:30:29.730 --> 03:30:32.690
el otro archivo que sería.

03:30:34.770 --> 03:30:35.250
Correlaciones.

03:30:36.250 --> 03:30:37.470
Mientras vagamos haciendo eso,

03:30:37.590 --> 03:30:38.750
disculpe, ¿Quiénes son los

03:30:38.750 --> 03:30:41.450
que van a hacer la prueba el

03:30:41.450 --> 03:30:43.130
caso estudio hoy? No te

03:30:43.610 --> 03:30:44.930
preocupes. No te preocupes.

03:30:44.950 --> 03:30:46.050
Julio, ¿Quién más? OK,

03:30:46.290 --> 03:30:47.510
perfecto. Me espero un

03:30:47.510 --> 03:30:48.650
momento, listo, confirmo algo

03:30:48.650 --> 03:30:50.230
aquí en la máquina virtual.

03:30:51.690 --> 03:30:53.350
Vaya haciendo, por favor, un

03:30:53.350 --> 03:30:54.610
metadata para cada uno de

03:30:54.610 --> 03:30:56.090
estos archivos. Acesión del

03:30:56.090 --> 03:30:58.730
ten uno que está ahí. Si no,

03:30:59.010 --> 03:31:01.830
se fue ahí. Eh, confirmó algo

03:31:02.810 --> 03:31:03.210
aquí.

03:31:12.310 --> 03:31:13.830
Nada más el y el encabezado,

03:31:14.250 --> 03:31:14.810
el del imitador y el

03:31:14.810 --> 03:31:16.010
encabezado. Que tiene

03:31:16.010 --> 03:31:19.670
encabezado. Creo que hay

03:31:19.670 --> 03:31:20.670
uno que se llama ten uno,

03:31:20.670 --> 03:31:24.770
creo que se llama. Ten uno.

03:31:26.390 --> 03:31:26.950
Ah, entonces me equivoqué,

03:31:27.110 --> 03:31:27.790
fui yo, perdón, te

03:31:27.790 --> 03:31:30.030
confirmó para ver. Cuando

03:31:30.030 --> 03:31:31.410
descargué me pareció ver un

03:31:31.410 --> 03:31:33.030
ten uno aquí. Si no hay

03:31:33.030 --> 03:31:33.990
este ten uno que está aquí,

03:31:34.350 --> 03:31:36.790
no. Ten uno. Ese no,

03:31:36.930 --> 03:31:37.950
borralo. Si quieren borrarlo,

03:31:37.990 --> 03:31:39.010
se no tienen nada.

03:32:15.110 --> 03:32:15.870
Bueno,

03:32:16.730 --> 03:32:17.830
bueno, si quieres, este,

03:32:17.830 --> 03:32:19.230
dejemos hasta aquí y me deja

03:32:19.230 --> 03:32:21.670
con los que van a hacer el

03:32:21.670 --> 03:32:22.750
el nuevamente el caso de

03:32:23.590 --> 03:32:24.870
estudio para explicarle un

03:32:24.870 --> 03:32:26.110
par de cositas ahí. Si ya

03:32:26.110 --> 03:32:27.310
terminó de subir todos los

03:32:27.310 --> 03:32:28.030
archivos, por favor,

03:32:28.170 --> 03:32:29.010
entonces, me deja nada más

03:32:29.010 --> 03:32:29.950
como se quedan nada más los

03:32:29.950 --> 03:32:31.730
tres y les explicamos

03:32:31.730 --> 03:32:33.790
nuevamente porque hay que

03:32:34.710 --> 03:32:35.650
configurar lo que teníamos

03:32:35.650 --> 03:32:36.530
anteriormente, que no lo

03:32:36.530 --> 03:32:38.310
tenemos, perdimos los job

03:32:39.170 --> 03:32:40.410
que seguramente alcanzaron

03:32:40.410 --> 03:32:41.870
a hacer, se perdieron en

03:32:41.870 --> 03:32:42.830
la máquina virtual anterior.

03:32:42.830 --> 03:32:43.990
Ya voy para allá, voy para

03:32:43.990 --> 03:32:46.110
allá, voy para allá.

03:32:46.830 --> 03:32:48.790
Oye, vamos a ver.

03:32:50.650 --> 03:32:53.790
OK, vamos a ver. Dale

03:32:53.790 --> 03:32:58.370
refresh. Refresh. Listo,

03:32:58.550 --> 03:32:59.690
lo que que que es mandado

03:32:59.690 --> 03:33:00.710
mítico, dale, ah, listo,

03:33:00.830 --> 03:33:02.290
hidre, dale allá, ponle uno

03:33:02.830 --> 03:33:04.450
ahí, dale nuevamente refresh

03:33:04.450 --> 03:33:07.390
porque no es automático. Ah,

03:33:07.410 --> 03:33:08.410
porque tienes que configurar

03:33:08.410 --> 03:33:10.210
el set acá. Dale set, ahí

03:33:10.210 --> 03:33:10.750
tienes, ahí tienes, ahí tienes

03:33:10.750 --> 03:33:14.590
el refresh. Dale nuevamente

03:33:14.590 --> 03:33:15.930
para ver. Espérate, que te

03:33:15.930 --> 03:33:17.750
te subió uno más. Cámbiate,

03:33:17.970 --> 03:33:19.010
elegir que te te sumó uno,

03:33:19.330 --> 03:33:21.350
ponle uno ahí. Dale nuevamente

03:33:22.350 --> 03:33:24.950
refresh. Ahora sí, listo,

03:33:24.950 --> 03:33:31.390
ahora sí. Listo. Sí, pero la

03:33:31.390 --> 03:33:32.410
idea era que hiciera todos

03:33:32.410 --> 03:33:34.850
los metadatas, pero si los

03:33:36.290 --> 03:33:37.830
metadatas, si no lo semos

03:33:37.830 --> 03:33:38.870
vamos a empezar el día el día

03:33:38.870 --> 03:33:40.070
martes, si no, vamos a

03:33:40.070 --> 03:33:42.250
empezar, no sé si nos si

03:33:42.250 --> 03:33:43.590
iniciamos para la configuración

03:33:43.590 --> 03:33:44.610
de las máquinas como estaban

03:33:44.610 --> 03:33:45.810
anteriormente, regálenme tres

03:33:45.810 --> 03:33:46.870
minutos, busco un poquito de

03:33:46.870 --> 03:33:47.830
agua y vengo enseguida, ya

03:33:49.290 --> 03:33:51.370
vengo. Los de vas, si

03:33:51.370 --> 03:33:52.530
quieres, pues, no sé si quieren

03:33:52.530 --> 03:33:54.170
quedarse o si quieres se

03:33:54.990 --> 03:33:56.330
desconectan, como decen, ya

03:33:57.370 --> 03:33:57.770
vengo.

03:34:01.610 --> 03:34:03.610
Ah, bueno, volví, bueno,

03:34:03.610 --> 03:34:07.090
volví ya nuevamente, listo.

03:34:07.350 --> 03:34:09.830
Vamos entonces los del

03:34:11.270 --> 03:34:13.210
los que vamos a hacer el caso

03:34:13.210 --> 03:34:16.470
de estudio. Primero, estamos

03:34:16.470 --> 03:34:17.830
conectados los tres, yes o

03:34:17.830 --> 03:34:19.690
no. Bueno, en primer lugar,

03:34:19.890 --> 03:34:20.750
recuerde que lo primero que

03:34:20.750 --> 03:34:22.770
hicimos fue subir el modelo

03:34:22.770 --> 03:34:23.730
de datos del data warehouse,

03:34:23.990 --> 03:34:26.030
entonces, primero, váyase a

03:34:26.030 --> 03:34:29.390
MySQL command line.

03:34:30.390 --> 03:34:33.390
Y esto aquí le damos root.

03:34:34.950 --> 03:34:38.010
Nos conectamos con root.

03:34:39.850 --> 03:34:42.150
Y váyase a la carpeta

03:34:42.150 --> 03:34:44.690
compartida, caso de estudio,

03:34:46.170 --> 03:34:48.090
y descarga un archivo que se

03:34:48.090 --> 03:34:52.010
llama Chinook Undercore DWSQL,

03:34:52.290 --> 03:34:54.870
por favor. Esto es lo

03:34:54.870 --> 03:34:56.470
primero que vamos a hacer.

03:34:57.410 --> 03:34:58.870
Vete a la carpeta compartida

03:34:58.870 --> 03:35:02.170
ahí en tu browser, por favor.

03:35:03.050 --> 03:35:05.270
Vas acá a caso de estudio, a

03:35:05.270 --> 03:35:06.610
la carpeta caso de estudio,

03:35:07.090 --> 03:35:09.850
no, pero vete al browser, en

03:35:09.850 --> 03:35:11.030
el browser, la carpeta

03:35:11.030 --> 03:35:12.650
compartida, eh, la que tenemos

03:35:12.650 --> 03:35:14.710
ahí en, voy a tu máquina.

03:35:16.150 --> 03:35:18.210
Vete a tu desktop. Ah,

03:35:18.290 --> 03:35:18.990
perdón, ahí la tienes, que

03:35:18.990 --> 03:35:19.650
perdón, que no veía bien,

03:35:19.750 --> 03:35:20.850
ese exactamente, que no te

03:35:20.850 --> 03:35:26.350
veía bien. Listo, sí,

03:35:26.350 --> 03:35:27.570
carpeta, el caso de estudio,

03:35:27.730 --> 03:35:28.810
entra a caso de estudio y

03:35:28.810 --> 03:35:29.970
descarga el que se llama Chinook

03:35:29.970 --> 03:35:33.470
Undercore DWSQL. Listo,

03:35:34.430 --> 03:35:38.810
entonces, abre la carpeta,

03:35:39.150 --> 03:35:40.790
copia la ruta donde está el

03:35:40.790 --> 03:35:41.730
archivo, bueno, aquí me

03:35:41.730 --> 03:35:42.570
aparece, voy a copiarla

03:35:42.570 --> 03:35:44.430
directamente aquí, le da clic

03:35:44.430 --> 03:35:45.930
derecho en propiedades del

03:35:45.930 --> 03:35:49.010
archivo, y me traigo la

03:35:49.010 --> 03:35:50.890
ruta, donde está, donde se

03:35:50.890 --> 03:35:53.250
ha descargado, esa ruta la

03:35:53.850 --> 03:35:58.410
copio, y la pego en, antes

03:35:58.410 --> 03:36:00.310
de esto le digo source,

03:36:02.090 --> 03:36:05.550
pego la ruta, slash, y

03:36:05.550 --> 03:36:07.170
llamo, el archivo se llama

03:36:09.430 --> 03:36:10.850
chinookdw.sql, ya lo pongo

03:36:10.850 --> 03:36:12.650
en grande, queda más o

03:36:12.650 --> 03:36:16.130
menos así, queda así.

03:36:24.130 --> 03:36:25.830
Por favor, le da enter, y

03:36:25.830 --> 03:36:26.950
veamos para ver si construye

03:36:26.950 --> 03:36:27.730
el modelo.

03:36:32.150 --> 03:36:33.630
Ah, listo, me fui por acá

03:36:33.630 --> 03:36:35.090
porque, bueno, descargué,

03:36:35.270 --> 03:36:36.490
dos formas, una me fui a la

03:36:36.490 --> 03:36:37.330
barra de direcciones, eso

03:36:37.330 --> 03:36:38.470
le di clic derecho en el

03:36:38.470 --> 03:36:39.510
archivo que descargué,

03:36:39.570 --> 03:36:42.230
properties, y aquí copié la

03:36:42.630 --> 03:36:46.150
ruta. Aquí copié la ruta,

03:36:46.230 --> 03:36:47.750
location aquí, copy, y

03:36:47.750 --> 03:36:50.870
después la pegué acá, y le

03:36:50.870 --> 03:36:52.630
pongo chinookdw.

03:36:54.810 --> 03:36:56.270
Listo, ahí te entro ya.

03:36:57.810 --> 03:37:00.850
Ahí te entro, sí. Funcionó.

03:37:01.410 --> 03:37:02.470
Listo, ahora, y si ya

03:37:02.470 --> 03:37:04.190
funcionó, súbete el talent

03:37:04.190 --> 03:37:05.190
data integration, por favor.

03:37:05.350 --> 03:37:06.530
No caso ve, creo que, de

03:37:06.530 --> 03:37:08.090
ahí, todos de ahí. Listo, yo

03:37:08.090 --> 03:37:09.650
también le doy enter entonces.

03:37:13.410 --> 03:37:15.750
Listo, procedemos entonces y

03:37:15.750 --> 03:37:18.330
montamos el talent data

03:37:19.110 --> 03:37:21.030
integration. Ese que está

03:37:21.030 --> 03:37:24.290
aquí. Si vas adelantado y te

03:37:24.290 --> 03:37:25.390
sube antes, crea una

03:37:25.390 --> 03:37:28.390
conexión hacia el chinook de

03:37:28.390 --> 03:37:31.410
MySQL. Mientras acá está

03:37:31.410 --> 03:37:32.670
caliendo todavía. Perdón.

03:37:33.290 --> 03:37:35.250
El no, no es el mismo. No,

03:37:35.250 --> 03:37:37.470
no es el mismo. No es el

03:37:37.470 --> 03:37:38.870
mismo. El otro, este que

03:37:38.870 --> 03:37:39.890
estamos, que está abierto es

03:37:39.890 --> 03:37:43.170
el talent data quality. Y

03:37:43.170 --> 03:37:48.310
ahora tenemos el talent, el

03:37:48.310 --> 03:37:48.350
talent.

03:37:50.670 --> 03:37:52.530
Sí, la primera vez, no, deja

03:37:52.530 --> 03:37:53.410
el proyecto por defecto,

03:37:53.430 --> 03:37:54.190
quise crear un nuevo proyecto

03:37:54.190 --> 03:37:54.970
que se llama local project,

03:37:55.950 --> 03:37:58.030
¿Verdad? Sigue, siguiente.

03:37:58.930 --> 03:38:05.210
Sí, dale perfecto.

03:38:09.730 --> 03:38:11.970
Bueno, espero entonces a que

03:38:11.970 --> 03:38:13.010
Eduardo te cargue. Listo,

03:38:13.270 --> 03:38:14.110
primero entonces, Eduardo,

03:38:14.270 --> 03:38:15.370
creemos la conexión hacia

03:38:15.370 --> 03:38:16.430
el chinook de MySQL. Entonces,

03:38:16.610 --> 03:38:18.110
creas aquí metadata, debe

03:38:18.910 --> 03:38:21.510
conexión, clic derecho, crear

03:38:22.330 --> 03:38:24.930
conexión, y colocamos aquí

03:38:25.970 --> 03:38:27.830
chinook, entre paréntesis,

03:38:28.010 --> 03:38:30.450
MySQL identificando el motor.

03:38:33.670 --> 03:38:34.750
Next, no le agregamos

03:38:34.750 --> 03:38:35.890
propósito ni nada por cuestión

03:38:35.890 --> 03:38:38.290
de tiempo. En el debe type,

03:38:38.290 --> 03:38:41.350
por favor, escoge MySQL

03:38:46.050 --> 03:38:48.130
en el login vamos a colocar

03:38:50.530 --> 03:38:51.410
root

03:38:51.410 --> 03:38:54.330
con lo que fue

03:38:54.330 --> 03:38:59.510
el password es root, el

03:38:59.510 --> 03:39:01.870
server es ciento veintisiete

03:39:01.870 --> 03:39:03.070
punto cero punto cero punto

03:39:04.090 --> 03:39:06.750
uno y la base de datos es

03:39:11.370 --> 03:39:11.890
chinook.

03:39:13.150 --> 03:39:14.110
Cuatro mil de test

03:39:14.110 --> 03:39:16.450
connection, por favor.

03:39:19.030 --> 03:39:20.590
Listo, bajar, aquí,

03:39:20.810 --> 03:39:22.530
descarga los driver.

03:39:24.890 --> 03:39:25.450
Ok,

03:39:27.350 --> 03:39:27.670
Finish,

03:39:30.070 --> 03:39:31.950
y procede a extraer el esquema.

03:39:32.430 --> 03:39:34.170
Entonces, vete aquí en la

03:39:34.170 --> 03:39:36.150
conexión, clic derecho, y le

03:39:36.150 --> 03:39:37.890
dice recuperar esquema.

03:39:42.930 --> 03:39:44.670
Recuperar esquema, le damos

03:39:44.670 --> 03:39:48.030
aquí next, y escogemos aquí

03:39:48.030 --> 03:39:49.110
todas las tablas de chinook.

03:39:52.530 --> 03:39:52.570
Listo,

03:39:58.230 --> 03:40:00.250
Next, y Finish.

03:40:02.990 --> 03:40:05.130
Listo, ahora creemos una

03:40:05.130 --> 03:40:07.570
conexión hacia la modelo de la

03:40:07.570 --> 03:40:09.370
bodega de datos. Nuevamente

03:40:09.370 --> 03:40:10.690
creamos una nueva conexión,

03:40:10.830 --> 03:40:13.550
crear conexión.

03:40:14.470 --> 03:40:16.790
Esto se llama chinook

03:40:16.790 --> 03:40:16.930
con la base de datos, con

03:40:16.930 --> 03:40:19.650
underscore DW,

03:40:21.330 --> 03:40:22.630
abre aparentes y aquí coloco

03:40:22.630 --> 03:40:23.730
el motor MySQL.

03:40:25.770 --> 03:40:27.230
Lo mismo, pero cambiamos la

03:40:27.230 --> 03:40:28.070
base de datos, la vamos a

03:40:28.070 --> 03:40:29.050
llamar ahora chinook,

03:40:29.070 --> 03:40:31.130
underscore DW.

03:40:35.890 --> 03:40:36.450
DBTi,

03:40:38.050 --> 03:40:39.170
MySQL aquí.

03:40:41.510 --> 03:40:43.390
Entonces, aquí coloco

03:40:43.390 --> 03:40:46.570
login, voy a colocar aquí

03:40:47.550 --> 03:40:48.070
root,

03:40:51.210 --> 03:40:52.910
el backwards root,

03:40:53.910 --> 03:40:57.170
el server es 127.0.0.1,

03:40:59.930 --> 03:41:01.330
y la base de datos, lo único que te va a cambiar,

03:41:01.570 --> 03:41:03.110
se va a llamar chinook

03:41:03.110 --> 03:41:05.190
con underscore DW, que fue el nombre que le

03:41:05.190 --> 03:41:07.150
dimos. Por favor, pruebas

03:41:07.150 --> 03:41:11.150
la conexión, Test Connection.

03:41:12.210 --> 03:41:12.690
Ok,

03:41:13.730 --> 03:41:15.770
Finish, y haces lo mismo,

03:41:15.970 --> 03:41:19.150
recuperas el esquema.

03:41:22.290 --> 03:41:23.590
Ya voy, muestra para ver, ya voy

03:41:23.590 --> 03:41:24.330
para allá.

03:41:25.730 --> 03:41:26.810
Ya voy para allá.

03:41:28.310 --> 03:41:29.570
Sí, dale ok ahí,

03:41:29.810 --> 03:41:31.110
y ese falta exactamente.

03:41:32.310 --> 03:41:32.790
Chinook.

03:41:33.530 --> 03:41:34.770
Listo, dale Test Connection ahora

03:41:34.770 --> 03:41:35.190
para ver.

03:41:35.190 --> 03:41:36.010
Ok,

03:41:36.290 --> 03:41:41.190
dale detalles un momento ahí,

03:41:42.430 --> 03:41:43.590
acceso de negado, qué power le

03:41:43.590 --> 03:41:45.270
colocaste, mira a ver si el power es

03:41:45.270 --> 03:41:47.110
el root, nuevamente borra el power y

03:41:47.110 --> 03:41:49.450
coloca el root nuevamente para ver,

03:41:49.750 --> 03:41:51.470
dale Test Connection,

03:41:51.670 --> 03:41:53.390
ahora sí, ok,

03:41:54.610 --> 03:41:55.090
Finish,

03:41:55.470 --> 03:41:57.710
exactamente, recupera el esquema.

03:41:57.710 --> 03:41:58.030
Next,

03:42:08.750 --> 03:42:09.630
y Finish.

03:42:12.030 --> 03:42:13.290
Sí, sí, no nos compliquemos,

03:42:13.450 --> 03:42:15.330
todo está bien, aunque vamos a usar solamente 5.

03:42:15.870 --> 03:42:17.510
Bueno, alto seguido, conexión.

03:42:17.750 --> 03:42:18.570
Ok, no.

03:42:19.970 --> 03:42:21.770
Bueno, mientras creamos una

03:42:21.770 --> 03:42:23.830
carpeta acá en el Job Design

03:42:23.830 --> 03:42:25.750
Create Folder, y lo vamos a llamar

03:42:25.750 --> 03:42:25.870
caso

03:42:27.090 --> 03:42:27.730
estudio.

03:42:30.970 --> 03:42:32.250
Y entonces,

03:42:33.110 --> 03:42:33.790
dentro de caso

03:42:33.790 --> 03:42:35.210
estudio, vamos a hacer un job

03:42:35.210 --> 03:42:38.070
por cada requerimiento

03:42:38.070 --> 03:42:39.750
que nos pidieron, que fue el de

03:42:40.330 --> 03:42:41.150
Dean Género.

03:42:41.810 --> 03:42:43.690
Vamos entonces a crear un job, por ejemplo,

03:42:44.170 --> 03:42:45.870
llamado Job

03:42:45.870 --> 03:42:47.910
Dean Under Record

03:42:47.910 --> 03:42:48.770
Géneros.

03:42:55.410 --> 03:42:55.890
Listo,

03:42:56.070 --> 03:42:57.730
y entonces vamos a hacer el primero

03:42:57.730 --> 03:42:59.410
que es igual a los demás,

03:42:59.570 --> 03:43:01.550
que es de álbum, iguales, vamos entonces

03:43:01.550 --> 03:43:02.510
al de género.

03:43:02.730 --> 03:43:05.030
La tabla de entrada es

03:43:05.550 --> 03:43:06.030
Enchinute,

03:43:06.550 --> 03:43:08.110
y busco la tabla Genre,

03:43:08.350 --> 03:43:09.870
y éste entra de entrada.

03:43:11.510 --> 03:43:12.770
Genre, la coloco acá.

03:43:18.270 --> 03:43:18.750
Bien,

03:43:18.750 --> 03:43:20.770
y la salida sería Dean Género

03:43:20.770 --> 03:43:22.690
en español, y va a ser

03:43:22.690 --> 03:43:24.750
la salida de tipo Output.

03:43:27.090 --> 03:43:29.170
Va a ser Output, TV Output.

03:43:29.390 --> 03:43:30.750
Uno de entrada y uno de salida.

03:43:38.210 --> 03:43:38.870
¿Cuál está

03:43:38.870 --> 03:43:40.310
generando? Genre.

03:43:41.430 --> 03:43:42.190
Ese va a ser de entrada,

03:43:42.510 --> 03:43:44.490
está bien, TV Input.

03:43:45.250 --> 03:43:46.230
Listo, está bien, ok.

03:43:46.970 --> 03:43:48.390
Ahora, Dean Género,

03:43:48.550 --> 03:43:49.870
lo sueltas y va a ser de salida.

03:43:49.950 --> 03:43:51.670
Sueltas y va a ser TV Output.

03:43:51.910 --> 03:43:54.230
Listo, agrega un T-Mat en el medio.

03:43:59.570 --> 03:44:00.370
Conecta el

03:44:00.370 --> 03:44:02.230
Genre con el T-Mat.

03:44:06.370 --> 03:44:08.230
Conecta el T-Mat con Dean Género.

03:44:10.950 --> 03:44:12.170
Vamos a llamar la salida

03:44:12.170 --> 03:44:13.750
Under Record Géneros.

03:44:13.750 --> 03:44:15.750
La conexión.

03:44:20.530 --> 03:44:21.890
Configuramos el tema, doble clic

03:44:21.890 --> 03:44:23.850
en el tema y mapeamos cada columna.

03:44:24.150 --> 03:44:25.930
Entonces, iría Genre ID

03:44:25.930 --> 03:44:27.750
iría con ID Género.

03:44:30.070 --> 03:44:31.990
Iname iría con nombre.

03:44:35.750 --> 03:44:38.650
Y le dices una nueva columna, ya hay que poner la nueva columna que le dices.

03:44:39.470 --> 03:44:41.590
Julio, te veo todavía con esa parte que pasó ahí.

03:44:41.590 --> 03:44:45.410
No está bien, no está bien la configuración, ya está bien.

03:44:45.670 --> 03:44:46.690
Te falta otra.

03:44:47.190 --> 03:44:48.510
Que es la de la...

03:44:49.230 --> 03:44:50.770
No, espérate, espérate, espérate.

03:44:50.870 --> 03:44:51.830
Es que son dos.

03:44:55.310 --> 03:44:57.190
Ahora créate la otra que sería.

03:44:57.650 --> 03:44:58.570
Exactamente, bien, exactamente.

03:44:58.670 --> 03:45:01.450
Muestra para ver el caso tuyo, Eduardo.

03:45:05.150 --> 03:45:05.590
Ese...

03:45:06.390 --> 03:45:07.950
Tienes mal la columna, no.

03:45:08.450 --> 03:45:09.310
¿Cuál fue la que creaste?

03:45:09.310 --> 03:45:11.030
Genre ID, la primera es la que tienes mal.

03:45:11.130 --> 03:45:12.910
Tienes que borrar la primera, la que se llama Genre ID.

03:45:13.250 --> 03:45:14.690
Oh, no, la borra acá.

03:45:15.290 --> 03:45:17.110
De este lado, perdón, sí, de este lado.

03:45:17.170 --> 03:45:18.790
Este Genre ID que tienes que borrar.

03:45:20.050 --> 03:45:21.590
La borra aquí con esta X que está acá bajito.

03:45:21.710 --> 03:45:22.890
Acá, mira, pero ojo, no.

03:45:23.130 --> 03:45:23.710
Ojo, mira, mira.

03:45:24.470 --> 03:45:26.790
Mira cómo la vas a borrar. Deja que te muestro de este lado.

03:45:28.770 --> 03:45:29.970
Ahí te muestro.

03:45:32.390 --> 03:45:33.230
El problema es esta columna.

03:45:33.310 --> 03:45:34.610
Entonces, la ubicas acá abajo.

03:45:35.050 --> 03:45:35.690
Acá abajo.

03:45:37.630 --> 03:45:42.130
Y le das X a esa columna.

03:45:42.410 --> 03:45:43.970
Borre ese road name que lo puntaste mal.

03:45:44.110 --> 03:45:47.610
Es decir, entra ahí, clic y borralo.

03:45:48.790 --> 03:45:51.670
Ahora, conecta entonces el Genre ID con ID género.

03:45:51.810 --> 03:45:52.530
Ahí no, atrás.

03:45:53.570 --> 03:45:54.330
Ahí, suéltalo.

03:45:55.570 --> 03:45:57.510
Suéltalo ahí, listo.

03:45:57.650 --> 03:45:59.970
Y ahora el name va con nombre.

03:46:01.210 --> 03:46:01.990
Dale OK.

03:46:03.110 --> 03:46:04.790
Y procede a ejecutar el job para ver.

03:46:05.750 --> 03:46:07.130
Listo, esperamos a ver.

03:46:07.750 --> 03:46:09.150
Yo no sé si le cambiamos la memoria.

03:46:09.390 --> 03:46:09.950
Esperamos para ver.

03:46:11.950 --> 03:46:13.230
Listo, ahí tienes que tomar

03:46:13.230 --> 03:46:15.110
un screenshot de ese.

03:46:15.150 --> 03:46:16.650
Ahora, vete.

03:46:16.910 --> 03:46:18.570
Ahí él toma el screenshot de esa parte, ¿Verdad?

03:46:18.790 --> 03:46:20.510
Ahora, para confirmar que todo esté bien,

03:46:20.710 --> 03:46:22.710
vete a la conexión del Chinook DW

03:46:22.710 --> 03:46:23.850
de la bodega de datos.

03:46:24.610 --> 03:46:26.310
A la conexión del lado izquierdo de la metadata.

03:46:29.130 --> 03:46:30.610
La conexión, en la conexión acá.

03:46:30.750 --> 03:46:32.690
Chinook DW, donde está la conexión.

03:46:32.690 --> 03:46:33.770
Clip derecho.

03:46:35.110 --> 03:46:36.110
Editar query.

03:46:37.030 --> 03:46:38.570
Dale select asterisco ahí

03:46:38.570 --> 03:46:40.870
from din, din género, ¿Verdad?

03:46:41.230 --> 03:46:42.690
Vuela que grabamos ahora, din género.

03:46:45.110 --> 03:46:46.110
No, asterisco.

03:46:47.530 --> 03:46:48.650
Din género, ¿Verdad?

03:46:50.070 --> 03:46:50.570
Din

03:46:50.570 --> 03:46:53.010
género, ahí lo, esto.

03:46:53.570 --> 03:46:54.070
Ejecuta.

03:46:54.790 --> 03:46:56.330
Ahí está el señor que está corriendo.

03:46:56.410 --> 03:46:57.870
Ejecuta el señor que está corriendo. Ah, listo.

03:46:57.890 --> 03:46:59.110
Y ahí tienes, ábrete.

03:47:00.770 --> 03:47:02.070
Ábrete, ábrete, ábrete.

03:47:02.070 --> 03:47:03.970
Y ahí tienes

03:47:04.810 --> 03:47:07.090
el segundo pantallazo del primer punto.

03:47:08.510 --> 03:47:09.290
Y ahora lo que tienes que hacer es

03:47:09.290 --> 03:47:11.110
con las demás tablas.

03:47:12.210 --> 03:47:13.170
Din género,

03:47:13.310 --> 03:47:15.210
vas a llamarlo. Jov, Jov géneros, perdón.

03:47:15.410 --> 03:47:16.910
Jov géneros.

03:47:17.370 --> 03:47:19.530
El del otro sería Jov,

03:47:20.270 --> 03:47:22.010
¿Cuál era el que era? Jov.

03:47:22.010 --> 03:47:23.010
Se me escapó ahora.

03:47:23.810 --> 03:47:24.730
Jov tiempo.

03:47:25.710 --> 03:47:27.110
Y sí, veo aquí.

03:47:27.110 --> 03:47:28.970
Jov géneros.

03:47:29.050 --> 03:47:31.550
Sí, ahí está, Jov géneros.

03:47:31.770 --> 03:47:32.770
Ah, bueno, entonces este.

03:47:33.030 --> 03:47:35.470
Ok, entonces créate el tiempo, Jov tiempo.

03:47:36.130 --> 03:47:36.990
Nada más Jov tiempo, sí,

03:47:37.070 --> 03:47:39.590
nada más tendría que ser Jov.

03:47:39.690 --> 03:47:41.310
Finish. Y ahí tendría que tener

03:47:41.310 --> 03:47:43.270
un, la entrada sería

03:47:44.750 --> 03:47:45.150
eh,

03:47:45.550 --> 03:47:47.070
in voice.

03:47:48.010 --> 03:47:49.290
¿Cierto? Jov sabe hacer Jack, sí.

03:47:49.830 --> 03:47:50.470
Jov sabe hacer.

03:47:51.390 --> 03:47:53.090
De entrada. Ah,

03:47:53.130 --> 03:47:54.550
din tiempo y de salir definitivamente.

03:47:56.090 --> 03:47:56.890
Le agregas

03:47:56.890 --> 03:47:57.650
un te unique,

03:47:58.750 --> 03:48:00.550
un te matte y listo.

03:48:02.350 --> 03:48:02.470
Bueno,

03:48:02.490 --> 03:48:04.270
los dejo porque me toca hacer algo con mi amá,

03:48:04.350 --> 03:48:05.250
qué pena que me toca ir.

03:48:06.450 --> 03:48:08.550
Bueno, cualquier cosa

03:48:08.550 --> 03:48:09.910
me están escribiendo, Jov. Le hizo.

03:48:10.670 --> 03:48:11.530
Gracias a ustedes.

03:48:16.270 --> 03:48:16.670
Listo.

03:48:19.910 --> 03:48:20.190
Jov.

03:48:23.070 --> 03:48:23.510
Ufff.

03:48:23.550 --> 03:48:23.710
Bueno,

03:48:23.750 --> 03:48:24.030
sí.

03:48:50.450 --> 03:48:51.850
.

03:49:04.210 --> 03:49:05.610
.

03:49:05.610 --> 03:49:05.710
Jov.

03:49:09.230 --> 03:49:10.630
Jov.

03:49:10.630 --> 03:49:10.970
.

03:49:17.290 --> 03:49:18.690
.

03:49:18.690 --> 03:49:20.170
.

03:49:50.170 --> 03:49:51.270
¿Pero hay mayúsculo en los demás?

03:49:51.550 --> 03:49:53.310
¿Tenemos que ir a los mayúsculos?

03:49:54.470 --> 03:49:54.750
¿Pero qué?

03:49:56.030 --> 03:49:57.070
Pues ya...

03:49:57.690 --> 03:50:00.330
Pues dame lo que digas, dame lo que digas, y como vos...

03:50:00.330 --> 03:50:00.730
Nada más, ¿verdad?

03:50:03.150 --> 03:50:03.410
¿Pero qué?

03:50:04.570 --> 03:50:05.370
¿Pero qué pues?

03:50:05.530 --> 03:50:06.350
A ver, cuénteme.

03:50:09.630 --> 03:50:10.490
Bueno, ya...

03:50:10.490 --> 03:50:12.190
Voy a tomar la f...

03:50:12.190 --> 03:50:13.890
Bueno, cuénteme pues.

03:50:15.850 --> 03:50:17.470
Pero ya habíamos tirado los mayúsculos.

03:50:17.470 --> 03:50:19.250
Por eso muéstame...

03:50:19.250 --> 03:50:20.830
Pero muéstame lo que...

03:50:20.830 --> 03:50:23.470
Lo que estaba viendo o no muéstame.

03:50:27.750 --> 03:50:28.830
¿Quién fue? ¿Quién no fue?

03:50:29.070 --> 03:50:30.570
¿Me lo voy a traer?

03:50:32.430 --> 03:50:32.970
¿Y por qué?

03:50:33.170 --> 03:50:34.130
¿Y por qué fuiste el truco?

03:50:35.390 --> 03:50:36.270
Vale, listo.

03:50:37.430 --> 03:50:38.670
Si no estoy mal...

03:50:38.670 --> 03:50:40.090
Si no estoy mal...

03:50:40.090 --> 03:50:42.990
Si no estoy mal...

03:50:42.990 --> 03:50:45.310
Si no estoy mal

03:50:46.370 --> 03:50:47.310
Puedes ser ahí.

03:50:48.450 --> 03:50:50.810
Que se ve mejor que el de...

03:50:50.810 --> 03:50:51.750
que lo zeربías de alta.

03:50:51.910 --> 03:50:52.450
¿Vas a darse el alto?

03:50:52.910 --> 03:50:54.950
Pero ahí en esto lo que se va a hacer es...

03:50:54.950 --> 03:50:55.910
No, no.

03:50:56.990 --> 03:50:58.070
Ahí si entiendo.

03:50:58.390 --> 03:50:59.750
Debe de tener un logo, acá una imagen.

03:51:00.030 --> 03:51:02.870
Pero ahí en el menú de lo que va a mostrarte

03:51:02.870 --> 03:51:04.130
tiene que empezar en mayúsculas.

03:51:04.710 --> 03:51:07.150
Porque yo creo que tiene la mayúscula, y ese es mayúscula.

03:51:07.790 --> 03:51:10.030
Y yo la siguiente coje voy a decir de pocas palabras.

03:51:10.670 --> 03:51:11.910
Ya he dado una, en la fase que tenés

03:51:11.910 --> 03:51:13.390
tiene que empezar en mayúsculas mientras lo hago,

03:51:16.370 --> 03:51:24.610
No sé si es la verdad la principal, ya hay, creo que, cierta la creimiento, y solamente de aquí puedo hacer a cuatro.

03:51:24.990 --> 03:51:28.470
Como ejemplo, como, no sé, como es que tú dices que no.

03:51:28.950 --> 03:51:31.090
Claro, tendrías que, como esto es la página principal.

03:51:31.230 --> 03:51:34.210
Claro, yo sé que de esta página, ya que tengo lista, no sé.

03:51:34.210 --> 03:51:35.810
Ya parecía que un día teníamos a cuatro.

03:51:35.810 --> 03:51:36.330
¿Qué es eso?

03:51:38.510 --> 03:51:40.450
¿Qué es ahí al lado, junto a eso?

03:51:40.650 --> 03:51:42.250
Porque el personal va junto a él, y él sabe.

03:51:43.070 --> 03:51:43.590
Pero me da caos.

03:51:43.850 --> 03:51:45.070
Pero él ya empieza con ese vallúsculo.

03:51:45.270 --> 03:51:46.750
A punto como va vallúsculo.

03:51:47.130 --> 03:51:47.450
¿Ve esto?

03:51:48.010 --> 03:51:50.590
¿Y qué? O sea, ¿qué es lo que está al lado junto?

03:51:50.790 --> 03:51:51.090
¿Qué es eso?

03:51:51.750 --> 03:51:52.410
¿Cómo todo esto?

03:51:57.010 --> 03:51:59.470
Y venía a Cádiz y compreendió su inglés.

03:51:59.950 --> 03:52:01.910
A Cádiz tiene a ver, a Chibis.

03:52:05.150 --> 03:52:08.370
Ahora te pregunto lo mismo que te había pasado.

03:52:08.990 --> 03:52:11.710
¿Cómo vas a hacer para la actualización, eliminación y consulta?

03:52:11.810 --> 03:52:12.910
Dice, a veces va a la actualización.

03:52:13.850 --> 03:52:14.270
El creimiento.

03:52:14.430 --> 03:52:15.730
Estaba un buen punto en guardar.

03:52:15.970 --> 03:52:17.330
¿Cómo actualiza, cómo elimina?

03:52:19.150 --> 03:52:21.690
Es una pregunta que tengo, pero es una pregunta que tengo.

03:52:23.410 --> 03:52:27.250
Entendería que cuando yo inserte, no sé, la voy a guardar.

03:52:27.410 --> 03:52:28.450
Pero en la misma página.

03:52:28.910 --> 03:52:31.450
Bueno, pero cuando me vas a tirar a un rey,

03:52:32.570 --> 03:52:34.550
muércale que le va a quedar la tabla.

03:52:35.410 --> 03:52:38.930
Pero no me lo separes porque entendería que son dos páginas diferentes.

03:52:40.610 --> 03:52:41.450
Listo, me sigo.

03:52:43.510 --> 03:52:44.110
Bueno, ¿qué más?

03:52:45.670 --> 03:52:47.750
Bueno, estoy diciendo donde va a estar la sesión,

03:52:47.890 --> 03:52:48.490
va a estar donde me va a ir.

03:52:48.630 --> 03:52:50.170
Pero tengo una pregunta ahí.

03:52:50.450 --> 03:52:52.250
Dice, ¿qué hora y dónde está la hora ahí más?

03:52:54.030 --> 03:52:55.030
No, lo hay más allá.

03:52:55.230 --> 03:52:56.710
Tengo que ir agotando la parte de abajo.

03:52:56.710 --> 03:52:56.870
Listo.

03:52:57.750 --> 03:52:58.610
Otra pregunta.

03:52:58.970 --> 03:52:59.070
Oye.

03:53:10.670 --> 03:53:13.010
Ah, pero usted, doctor, ¿cuándo te queda?

03:53:13.270 --> 03:53:13.610
Dos horas.

03:53:16.530 --> 03:53:17.650
Listo, voy agotando.

03:53:19.590 --> 03:53:22.330
Déjame lo que quedamos antes.

03:53:22.470 --> 03:53:22.930
Yo también.

03:53:26.070 --> 03:53:27.310
Bueno, me va a mostrar.

03:53:27.910 --> 03:53:29.330
Oye, es lo que vamos a iniciar.

03:53:31.310 --> 03:53:33.030
¿Cómo es, cómo es la historia de esto?

03:53:33.290 --> 03:53:33.750
¿Cómo es la historia?

03:53:34.850 --> 03:53:36.110
¿Dónde saca los poseos, por ejemplo?

03:53:36.250 --> 03:53:38.190
Lo sacamos de...

03:53:38.190 --> 03:53:38.610
¿Ligero?

03:53:38.870 --> 03:53:43.470
No, no, pero a nivel de...

03:53:43.470 --> 03:53:44.890
Pero te vamos a dejar con las líneas, ¿verdad?

03:53:46.430 --> 03:53:48.310
No, o sea, la información.

03:53:48.790 --> 03:53:49.670
Bueno, no, honesto.

03:53:50.130 --> 03:53:51.610
No, pero es que me nada.

03:53:51.710 --> 03:53:52.650
Yo no me pregunté nada.

03:53:52.650 --> 03:53:56.070
¿Tú lo vas a tener guardado a nivel de un archivo

03:53:56.070 --> 03:53:59.010
y lo vas a consultar por los clientes de la oficina?

03:53:59.610 --> 03:53:59.750
Sí.

03:53:59.750 --> 03:54:00.310
¿Y cuál es la idea?

03:54:00.610 --> 03:54:03.090
¿Yo doy clic en un botón ahí y se me puso ahí para entender?

03:54:04.730 --> 03:54:05.130
Sí.

03:54:09.770 --> 03:54:10.810
Espera, espera un momento.

03:54:11.010 --> 03:54:12.070
Yo creo que eso está estático.

03:54:12.810 --> 03:54:13.630
¿Qué decís, entonces?

03:54:13.750 --> 03:54:15.070
¿Tú vas a alguna página estática?

03:54:16.090 --> 03:54:16.970
No la pregunta.

03:54:17.230 --> 03:54:18.250
Es que sí es estática.

03:54:18.830 --> 03:54:20.610
Ya esa página está para establecer la botada.

03:54:20.610 --> 03:54:21.790
¿Tú no quieres que el botón ya viene?

03:54:22.130 --> 03:54:23.390
¿Tú quieres que me ponga a la luz?

03:54:25.790 --> 03:54:26.610
¿Cómo que te vas a hacer así?

03:54:27.730 --> 03:54:28.090
¡Oye!

03:54:28.810 --> 03:54:29.170
¿Cual?

03:54:29.790 --> 03:54:30.110
Sí.

03:54:30.230 --> 03:54:30.790
¿Y si sí, otra?

03:54:30.950 --> 03:54:32.690
Si, el botón va a pasar bien también.

03:54:32.870 --> 03:54:33.230
¿Y si sí?

03:54:33.930 --> 03:54:34.470
Sí, sí.

03:54:35.090 --> 03:54:38.210
Eso que mejor quita todo y no vas a colocar ahora ahí

03:54:38.210 --> 03:54:40.270
porque sabes que en día de hoy estés por estar ahora

03:54:40.270 --> 03:54:41.170
que las ideas no tienen tiempo.

03:54:41.950 --> 03:54:43.230
Cuando creas una sesión.

03:54:43.310 --> 03:54:44.450
No, no, no, no.

03:54:44.450 --> 03:54:44.570
No, no.

03:54:44.570 --> 03:54:46.470
No puedo ir ahora por favor, no tienes ningún lado.

03:54:47.630 --> 03:54:48.810
¿Quién dice un artículo de tu?

03:55:20.150 --> 03:55:23.950
Entonces, quita el código y te da la categoría si es inmenso o inmenso y vuelve a ir.

03:55:24.670 --> 03:55:29.150
Listo, ¿qué más? Si tienes el código, lo muestras, si no, lo quitas.

03:55:36.830 --> 03:55:40.130
Uy, acá hay confirmado la señal, diles porque faltó confirmado la señal.

03:55:40.130 --> 03:55:43.130
Ahí faltó.

03:55:46.170 --> 03:55:47.130
Ah, nada más, nada más.

03:55:48.030 --> 03:55:50.210
Porque estoy en el suelo, estoy en el suelo, más, sigue.

03:55:50.570 --> 03:55:51.250
¿Tenéis otro en el suelo?

03:55:54.990 --> 03:55:55.350
¿Tenéis?

03:55:58.110 --> 03:55:59.770
¿Y qué hicimos? Listo.

03:56:00.030 --> 03:56:00.730
¿Cuánto hay? Quedamos así.

03:56:03.010 --> 03:56:07.590
Entonces, por ejemplo, ya te había dicho que no cogías los primeros, o sea, podíamos...

03:56:07.590 --> 03:56:10.150
Sí, pero el código, ahí tienes con los dos con el código, claro.

03:56:10.550 --> 03:56:12.390
Ahí tienes con los dos con el código, claro, ya.

03:56:12.810 --> 03:56:14.410
Si no está bien, no tienes que quitarla.

03:56:15.430 --> 03:56:15.910
Venga, tío.

03:56:16.650 --> 03:56:17.270
Me lo he dicho, me lo he dicho.