7:00
2024-10-30 10:32:08
3:47:42
2024-10-30 10:42:07
2:49:34
2024-11-01 09:09:55
36:40
2024-11-04 11:30:04
1:29
2024-11-05 09:32:07
Visit the TAC, Data Catalog, Stewardship course recordings page
WEBVTT
-->
Y de allá te va a enviar un código de acceso.
-->
Sí.
-->
Por un momento he visto ahí sí, cómo no, claro que sí.
-->
Se me perdió aquí la... aquí que tengo.
-->
Listo, Dennis, ahí está. ¿Quién más me decía? ¿Quién me notaba para copiarle la URL?
-->
Arturo, perfecto, Arturo. Voy a tu máquina entonces.
-->
Bueno, usted podría acceder desde su máquina, pero el problema que tengo es que no lo alcanzó a ver.
-->
Entonces, cuando tenga un error me queda un poco más complicado de resolver.
-->
Es el inconveniente nada más.
-->
Perfecto, Arturo. Ahí está entonces la URL.
-->
Daniel, estoy en tu pantalla y por favor para verificar los permisos si están correctos.
-->
Nota que ahí te salen varias configuraciones o varios accesos.
-->
Escoge la última que dice Test Job Migration.
-->
Dale click ahí.
-->
Le da doble click o click.
-->
Aunque abajo hay un... listo, perfecto.
-->
Vete al menú Manage que está en la parte horizontal.
-->
Dale click ahí en Manage, un momento.
-->
Perfecto, listo. Tenemos los permisos correctos entonces.
-->
Perfecto, voy a dejarte presentar aquí.
-->
Bueno, queríamos confirmar para ver si los permisos, porque ya tuvimos experiencia con un problemita que tuvimos inicialmente a nivel de permisos con el primer curso.
-->
Entonces, lo que queríamos comprobar inicialmente era si teníamos los permisos correctos.
-->
Bueno, está todo bien.
-->
Vamos a conectarnos nuevamente a ese software más o menos como en una hora.
-->
Permíteme hacer una introducción teórica.
-->
Bueno, buena pregunta.
-->
¿Denis?
-->
Sí.
-->
Sí, ¿Denis, verdad?
-->
¿Quién me habló?
-->
Ah, Verónica, vamos con usted.
-->
Bueno.
-->
Verónica, si no le está tomando el password, indica dos cosas.
-->
Hay un error en el password, no está creado como usuario.
-->
Vamos a confirmar si usted está creado.
-->
Daniel, voy con tu...
-->
Que ya tú te lo guías, vete al siguiente menú.
-->
Manage, un momento, Daniel, si es tan amable.
-->
En el menú Manage que está en la parte horizontal, el menú horizontal, dale click ahí.
-->
Y está uno que dice User, por favor.
-->
Lo viste ahí, el tercero.
-->
Confirma por favor si está el caso de Verónica ahí, si le alcanza a saber.
-->
Ahí está como usuario.
-->
Sí, está como usuario.
-->
Intente, o sea, en el software sí está como usuario y tiene los permisos correctos.
-->
Entonces, verifique nuevamente para ver tanto el correo como la contraseña.
-->
Mire que no tenga de pronto activado el teclado en mayúscula.
-->
O si usted quiere comprobarlo de la siguiente forma.
-->
Acceda desde su máquina, no desde la máquina virtual.
-->
Y confirme desde su máquina si se puede conectar.
-->
Si está en amable, y mejor lo hace allá para confirmar si se puede conectar.
-->
Los que puedan acceder, Daniel, ¿me colaboras por favor dándole click ahí en Manage?
-->
Cuando acceden al software van a la última configuración que dice Test John Migration.
-->
Es lo último que aparece.
-->
Le da click ahí por favor si eso está en amable.
-->
Y confirmen si le aparece el menú exactamente igual como lo tiene Daniel o como estoy presentando actualmente.
-->
Doble click.
-->
Listo proceder. Perfecto, Alfonso.
-->
Dale click en Manage, Alfonso, que estoy viendo que te conectaste.
-->
Manage.
-->
El menú horizontal de la parte de arriba donde está Object, Collection, Worship, Manage.
-->
Dale click ahí.
-->
Sí, perfecto.
-->
Estamos todos en sintonía a nivel de permisos.
-->
Faltaría comprobar el caso de Verónica si puede acceder y el caso de Enes.
-->
Pero si no puede acceder desde esta máquina es porque tuvo algún error.
-->
Entonces déjelo inicialmente en su máquina y podamos iniciar.
-->
Lo que queríamos comprobar era primero si el usuario estaba activado.
-->
Ya comprobamos que todos los usuarios están activados.
-->
Y segundo que los permisos se hayan definido de manera correcta y así es.
-->
Entonces podíamos iniciar inicialmente la pared teórica.
-->
Y después decidimos si hace la práctica directamente en su máquina o lo hace en la máquina virtual.
-->
Lo que necesito es que por lo menos uno lo haga en la máquina virtual porque no pudo acceder al software.
-->
Entonces me toca tomar la pantalla de alguien y llevarme a partir de esa pantalla.
-->
Bueno, vamos, como les decía, eso lo vamos a ver como en una hora más o menos vamos a utilizar el software.
-->
Permítame entonces si hago una introducción teórica para poder entender qué es lo que se busca
-->
y cómo podría utilizar el software en su diario vivir, en sus procesos de negocio como tal.
-->
Entonces voy a confirmar, estoy presentando, perfecto, listo.
-->
Bien, este curso titulado Talent Data Catalog es una herramienta en el ecosistema de talent.
-->
Como su nombre lo dice, para catalogar datos no es la única herramienta que hay en el mercado.
-->
En realidad que está la de Oracle, la IBM, la de AWS, la de Microsoft.
-->
Particularmente yo tengo experiencia con Talent Data Catalog en versión 6 a nivel profesional en una empresa.
-->
Y con Oracle tengo experiencia pero más que todo a nivel académico.
-->
Si hago una comparación entre lo que es el Talent Data Catalog con el de Oracle, el Talent Data Catalog es superior
-->
principalmente porque la interfaz es muy instituida, es muy fácil de usar, no es compleja.
-->
Y además que tienes unas opciones que en realidad que en Oracle no las encuentras.
-->
La idea es poder, digamos, que usted analice todas las opciones que tenga el software
-->
y aprovechar cómo podía utilizar, digamos, la herramienta en el diario vivir de su empresa.
-->
Listo, entonces ¿cómo va a ser la metodología?
-->
Pues la metodología va a ser prácticamente la misma del curso anterior.
-->
Vamos a ver unos conceptos teóricos que esto puede durar entre una hora, quizás máximo una hora y 30.
-->
Acta seguido entonces toda la parte teórica la implementamos a nivel del software, a nivel teórico práctico.
-->
Con la única y pequeña diferencia es que no puedo acceder al software.
-->
Entonces me toca tomar la pantalla de alguien e ir guiándolo para que cada uno de ustedes
-->
a partir de esa pantalla puedan configurar de forma exitosa cada uno de las prácticas que tenemos planificadas.
-->
Entonces no hay mucha diferencia, la única es que no puedo acceder al software en este caso.
-->
Listo, ¿por qué no acceder al software? En realidad Talent desde que fue comprada por Quill.
-->
Talent ofrecía una versión trial del Talent Data Catalog para que usted hiciera la prueba.
-->
Yo actualmente no estoy muy de acuerdo con ciertos elementos a nivel de negocio que ha tenido la empresa desde que la compró Quill.
-->
Actualmente la empresa lo que si usted quiere, por ejemplo, está interesado en esta herramienta Talent Data Catalog,
-->
lo máximo que podía hacer es conectarse con un partner y el partner le va a mostrar la herramienta pero usted no lo va a utilizar.
-->
Entonces creo que hay una falla fuerte porque cómo voy a comprar algo que en realidad yo no sé si me va a funcionar
-->
o se va a adaptar precisamente a lo que yo requiero.
-->
Entonces ahí parece que hay una pequeña falla a nivel de negocio desde mi punto de vista, claro, desde Talent.
-->
Esto es una herramienta verdaderamente cara, carísima, carísima la herramienta,
-->
tanto a nivel de comprar el core del software más cada uno de los usuarios que se tiene.
-->
Bueno, vamos entonces.
-->
Quizás la primera pregunta para hacer entonces la introducción que nos podríamos formular es
-->
por qué una empresa hoy en día quisiese adoptar una solución a nivel de catálogo de datos
-->
partiendo en que hay muchas soluciones en el mercado.
-->
Bueno, para poder entender, digamos, por qué o qué beneficios tendría una empresa
-->
adoptar una herramienta de catálogo de datos independiente del nombre que sea,
-->
ya sea de Oracle, de Talent o de Microsoft.
-->
Veámoslo de esta forma.
-->
Imagínese que usted va a montar un negocio.
-->
El negocio entonces es venta de algo, venta de algún producto.
-->
Usted inicia, digamos, en una empresa muy pequeña con un nicho de mercado muy, muy pequeño.
-->
Y cuando usted tiene pocos clientes, usted se puede dar, digamos,
-->
que el lujo de llevar el control de sus ventas de forma manual.
-->
Es decir, lo apunta en algún cuaderno o libreta cada una de sus ventas
-->
y al final suma, digamos, cuánto vendió y puede sacar algunas cuestiones interesantes a nivel manual.
-->
Pero si, digamos, esa empresa empieza a ser exitosa,
-->
empieza a crecer como tal ese número de clientes.
-->
Cuando crece ese número de clientes, ya empieza a ser un poco,
-->
mucho más lento el proceso y mucho más complicado si lo lleva manual.
-->
Entonces, usted empieza a encontrar entonces un módulo de software
-->
que le ayude a automatizar la venta de esos productos.
-->
Si su empresa empieza a crecer, empieza a crecer seguramente en departamentos y áreas y empleados.
-->
Entonces, seguramente su empresa empieza a tener, digamos, un departamento de nómina,
-->
un departamento de recursos humanos.
-->
Y cuando tengo varios departamentos, entonces, como ya tenía un módulo para ventas,
-->
tendría que comprar un módulo para nómina, un módulo para recursos humanos, etcétera.
-->
Y cuando yo integro esos módulos entre sí para que se conecten,
-->
es lo que yo llamo una solución o que se llama para una solución ERP.
-->
Entonces, hay mucho ERP en el mercado y el ERP tiene como función precisa,
-->
es decir, aportar o apoyar o automatizar el proceso core de la empresa.
-->
En este caso, por ejemplo, ventas.
-->
Listo, cuando usted empieza a crecer, tiene varias sucursales.
-->
Entonces, al nivel, digamos, en el tiempo, empieza a ser exitoso
-->
y empieza a montar sucursales en diferentes partes.
-->
Esas sucursales necesitan mucho dinero y usted seguramente empieza
-->
y necesita crecer en clientes.
-->
Necesita incrementar su cliente como tal.
-->
Para eso, entonces, usted empieza a montar soluciones tipo CRM,
-->
que lo que busca el CRM entre muchas cosas es tratar de fidelizar al cliente,
-->
o sea, que el cliente sea fiel, no se le vaya para la competencia.
-->
Segundo, hacer lo que uno llama la trazabilidad de cliente,
-->
cómo convierto un cliente potencial en un cliente real.
-->
Entonces, eso lo hace un CRM, pero ya vas a tener dos software,
-->
un software tipo ERP y un software tipo CRM.
-->
Cuando tenga estos dos software, son de diferentes proveedores,
-->
seguramente empiezas a tener un problema de duplicidad,
-->
porque datos que van a estar del lado del ERP,
-->
lo vas a subir del lado del CRM y empiezas a tener una duplicidad.
-->
Si la empresa lo que hace, por ejemplo, es crear productos,
-->
o sea, fabricar productos, que compre materia prima,
-->
entonces tú necesitas buscar la mejor materia prima en el mejor costo.
-->
Entonces montas un software de tipo CCM.
-->
CCM lo que hace es conectar tu empresa contra los proveedores que tienes.
-->
Y eso entonces empiezas ahora, nuevamente tienes ahora dos software como tal.
-->
Empiezas entonces quizás a duplicar información,
-->
porque no eres el mismo proveedor.
-->
Y empiezas a tener entonces algunos problemas de duplicidad,
-->
pero solucionó con cada tipo, digamos, lo que quiero buscar en mi empresa.
-->
Empiezas a madurar mucho más en el mercado
-->
y empiezas a mejorar tu proceso de análisis,
-->
como hago yo para mejorar, digamos, mi proceso de toma de decisiones.
-->
Y entonces empiezas a montar soluciones tipo data warehouse,
-->
que básicamente un data warehouse es una base de datos decisional.
-->
O empiezas a montar un data lake, o empiezas a montar un data lake house,
-->
que te ayude a mejorar, que te genere información
-->
y con eso te ayude a mejorar esa toma de decisiones que tienes hoy en día.
-->
Pero eso cuenta en que yo empiezo a incrementar en sistemas
-->
y quizás empiezo a duplicar como tal mucha información y mucho dato que tengo.
-->
Pero cuando yo empiezo a crecer,
-->
se empieza a tener un problema de gobernabilidad de datos.
-->
Y esa gobernabilidad de datos, cuando tienes, digamos, ese stack tecnológicos,
-->
se ve desde el punto de vista en que no tienes un inventario centralizado de tus activos.
-->
En este caso, activos de datos.
-->
Me explico de esta forma.
-->
Tienes base de datos ERP, tienes CRM, tienes SCM, tienes bodega de datos.
-->
Y entonces tú dices, de pronto Mercadero dice,
-->
vamos a hacer una campaña que busque segmentar mis clientes por edad y por ubicación.
-->
Y entonces Mercadero pregunta,
-->
tenemos los datos necesarios para hacer el segmento?
-->
Entonces tendrías que llamar al ingeniero de datos
-->
y preguntarle qué datos tiene de tus clientes.
-->
El ingeniero de datos va a la base de datos,
-->
consulta a sus clientes y tiene, por ejemplo, identificación, nombre
-->
y no tiene, por ejemplo, fecha de nacimiento.
-->
Con eso raro uso hoy en día.
-->
Pero no tiene fecha de nacimiento.
-->
Si tú no tienes fecha de nacimiento, no podías segmentarlo por edad.
-->
Te tocaría hacer una campaña de autorización de datos de esos clientes.
-->
Pero ve el tiempo que te puede gastar en tener que llamar a una persona
-->
y preguntar con qué datos se cuenta para poder ver si la campaña es viable o no es viable.
-->
Y ahí viene esa parte de inventario de datos o de inventario del catálogo de tus datos.
-->
Entonces tú serías mucho mejores y mucho más sencillo
-->
en que tú tuvieses una fuente central
-->
y cualquiera persona podría consultar qué datos cuento
-->
y dónde están esos datos.
-->
Porque de pronto no tienes el problema de qué datos tienes.
-->
Si no tienes otro problema es dónde se encuentran esos datos.
-->
Entonces empiezas a tener un problema de gobernabilidad porque tienes muchas fuentes
-->
y les toca preguntar hasta llegar, digamos, a la solución que tú quieres.
-->
De igual forma, seguramente, si tú empiezas a vender productos,
-->
necesitas una política de privacidad de datos.
-->
Y en esa política de privacidad de datos tienes que definir qué datos son sensibles y confiables.
-->
Entonces lo mejor sería tener una herramienta que te permita consultar de manera muy rápida
-->
si estás implementando o no esas políticas de privacidad de datos.
-->
De igual forma, seguramente, te estás casando con algún cumplimiento normativo,
-->
sea GDPR, sea CCPA.
-->
Normalmente acá en Latinoamérica creo que usamos mucho GDPR.
-->
Pero GDPR me permite también definir algunas políticas
-->
y tener una herramienta que me permita definir si la estoy cumpliendo o no.
-->
Sería interesante, por ejemplo, políticas en que si yo tengo clientes en Europa,
-->
por políticas de Europa yo no puedo sacar de la Unión Europea, perdón,
-->
por políticas de la Unión Europea,
-->
todos los datos que sean de un cliente de Europa no pueden salir de Europa.
-->
Tienen que quedar en la Unión Europea en el Bundler Center,
-->
pero que esté ubicado en la Unión Europea.
-->
Entonces, ¿cómo yo podía verificar si eso es posible?
-->
Entonces, tú puedes tener una herramienta de catalogo de datos
-->
que te diga qué datos tiene y dónde se encuentran esos datos.
-->
Y tú rápidamente podrías verificar que eso se está cumpliendo como tal.
-->
Y por último, sería interesante tener lo que uno llama una trazabilidad de datos,
-->
llámalo trazabilidad, ciclo de vida o linaje,
-->
que te permita entender de dónde vienen los datos,
-->
qué transformaciones hay, quiénes las hizo
-->
y quiénes están utilizando esos datos.
-->
Por ejemplo, tú tienes un problema de quizás unos correos que están, digamos,
-->
errados o en su defecto están desactualizados.
-->
Entonces, tú puedes verificar de dónde viene, quién lo está transformando,
-->
si el problema que está en la transformación
-->
que me daña por lo menos los correos.
-->
Entonces, tú puedes tener una trazabilidad que te ayude a entender
-->
de dónde vienen esos datos, qué se están haciendo y hacia dónde van.
-->
Esa es la idea fundamental de un catalogo de datos.
-->
De igual forma, vas a tener otros beneficios.
-->
¿Por qué? Porque va a ser muy fácil entender y descubrir nuevos datos.
-->
Hago un paréntesis aquí.
-->
Cuando hablo de datos, estoy hablando de metadata.
-->
Entonces, no estoy hablando...
-->
Yo tengo, por ejemplo, una tabla de clientes.
-->
La tabla de clientes tiene las columnas identificación, nombre y apellido.
-->
Cuando hablo de este activo de datos, de estas herramientas de catálogo de datos,
-->
son herramientas que lo que hacen es guardar como tal la metadata.
-->
Y en este caso, la metadata de clientes sería los nombres
-->
y los tipos de datos de esa columna.
-->
No tanto me interesa en esta herramienta, no le interesa mucho los registros.
-->
Es decir, los nombres de empleados no le interesa.
-->
Lo que le interesa principalmente es la metadata que tú conservas
-->
de tus activos de datos.
-->
Ahora, como esos datos, tú ahora los vas a ligar
-->
y los puedes ligar con metadatos que pueden ser de negocio
-->
porque tú seguramente tienes unas definiciones, unos metadatos
-->
que te ayuda a descubrir, por ejemplo, las definiciones
-->
y que tengas en que todos hablen el mismo idioma.
-->
Por ejemplo, a nivel de supermercados,
-->
bueno, creo que la mayoría deben ser así.
-->
En caso de Colombia, todos los empleados del supermercado
-->
tienen que dar respuesta a cualquier pregunta.
-->
Es decir, tienen que tener un conocimiento horizontal.
-->
En pocas palabras, yo le puedo preguntar al cajero
-->
del supermercado que es donde puedo encontrar un producto
-->
y él debe llevarme a esa sección.
-->
O decirme dónde está ubicada, sección 4, sección 5.
-->
Eso es lo que llaman, digamos, un conocimiento a nivel horizontal.
-->
Y ahora, como hay una metadata y como tú quieres que todos
-->
hablen el mismo idioma, entonces tú puedes, digamos,
-->
guardar tus metadatos para que cada uno los consulte
-->
y podemos hablar exactamente el mismo idioma.
-->
Por ejemplo, yo en una empresa que alcancé de hacer un proyecto,
-->
ellos tenían un glosario de términos de negocio
-->
y me pareció interesante la definición que tenían de clientes.
-->
Para ellos, un cliente es un empleado más,
-->
en el sentido que se conserva como una persona
-->
que la trata de manera muy familiar.
-->
Y entonces la idea era insertar en los empleados
-->
en que los clientes es como si fuesen familia de ellos,
-->
como si estuvieses, digamos, con toda la confianza
-->
y la idea de ellos es que la mayoría, pues, de todos,
-->
te atendiera el cliente de igual forma.
-->
Eso me parece interesante, pues, cada uno lo define
-->
y, digamos, lo transmite de forma diferente.
-->
Ahora, las herramientas también de catálogo de datos
-->
te van a permitir algo que ya hemos venido trabajando,
-->
que es el concepto de calidad de los datos.
-->
Entonces, por lo menos, la herramienta te va a permitir hacer dos cosas.
-->
Te va a permitir definir, por ejemplo,
-->
si se están cumpliendo las reglas de calidad
-->
y te va a permitir monitorear cómo se están usando esas reglas de calidad como tal.
-->
Al final, pues, aquí hay un gan y gana de este tipo de herramientas
-->
porque, por ejemplo, para un analista de datos
-->
le sirve mucho encontrar datos rápidamente
-->
para hacer algún trabajo específicamente
-->
o para entender el significado de esos datos.
-->
Y para un equipo de negocios puede ser, por ejemplo,
-->
en que tú puedas tener una herramienta de autoservicio
-->
y puedas consultar fácilmente la ubicación de un dato,
-->
quién lo tiene, dónde está, quién lo está manejando.
-->
Y al final, pues, tener una comprensión de todos los datos de igual manera,
-->
que es lo que uno llama el conocimiento horizontal.
-->
Eso sería, digamos, que las ventajas del por qué
-->
pensar en una herramienta de catálogo de datos
-->
es claro que estas herramientas se implementan
-->
cuando ya hay un nivel de madurez muy superior en una empresa
-->
y que seguramente quizás ya tú tengas definido algunos metadatos
-->
y ahora vas a tener entonces una herramienta centralizada
-->
en que todas tus sucursales van a manejar exactamente el mismo idioma.
-->
En pocas palabras, vas a tener una única fuente de verdad
-->
y en este caso de tus activos de datos.
-->
Esas serían las principales ventajas a nivel de lo que es, digamos,
-->
montar una herramienta de catálogo de datos.
-->
Vamos entonces a iniciar con unos conceptos básicos
-->
para que todos empecemos de la misma forma.
-->
No sé, creo que sí. Estoy presentando entonces.
-->
En este caso voy a hacer una pequeña introducción netamente teórica.
-->
Primero vamos a definir el concepto de metadato,
-->
que es sumamente importante este concepto
-->
en una herramienta de catálogo, sea cualquiera.
-->
Esa palabra meta permite estar por encima de lo que usted coloque.
-->
Por ejemplo, yo cuando digo meta-lenguaje,
-->
entonces significa que es un lenguaje que me permite crear nuevos lenguajes.
-->
Entonces, por ejemplo, el típico es C.
-->
Cuando tú viste de pronto en la universidad
-->
o de pronto en el nivel práctico,
-->
tú has notado que cuando tú accedes un avaseato,
-->
por ejemplo, tipo Postgres,
-->
te aparece un avaseato ya internamente que se llama Postgres.
-->
Cuando entras a MySQL, es un avaseato que se llama MySQL.
-->
Cuando entras a Oracle ya hay unos esquemas que están predefinidos.
-->
Esos esquemas tienen una meta-tablas.
-->
¿Por qué se habla de meta-tablas?
-->
Porque son tablas que hablan acerca de tablas,
-->
o que te informan acerca de tablas.
-->
Tenemos el concepto ahora de metadatos,
-->
que básicamente la mejor definición metadatos
-->
son datos que describen otros datos.
-->
Entendemos en que el dato puede carecer de significado,
-->
pero ahora yo puedo agregarle más datos
-->
y progresar esos datos y me da más información.
-->
O yo podía tener un metadato
-->
que básicamente no tiene la información de ese dato.
-->
Entonces, ahí es un poco la forma en que cómo lo concibas.
-->
Metadatos, datos que hablan acerca de datos,
-->
o información que te habla acerca de datos.
-->
Ya esto es, por ejemplo, esto ya es bastante antiguo.
-->
Por ejemplo, cuando solo tenemos una imagen,
-->
pues esa imagen en realidad guarda muchos metadatos.
-->
De aquí vienen que a veces pasa lo siguiente,
-->
en que tú tienes una imagen y la compartes.
-->
Pero cuando la compartes,
-->
hay alguna partecita que no quieres que la vean.
-->
Entonces, tú digamos que le colocas ahí
-->
como una especie de marcador en negrito
-->
para que nadie lo vea.
-->
Pero hay algunas aplicaciones que cuando tomas la imagen,
-->
internamente guarda una copia de la imagen
-->
que va dentro de la imagen.
-->
O sea, guarda la original dentro de un metadato
-->
de tal forma en que si se pierde esa imagen
-->
tú la puedas recuperar.
-->
Entonces, tú a veces compartes eso
-->
y creyendo en que ocultas esa parte,
-->
pero si tú entras en cierta metadata,
-->
te va a dar entonces, por ejemplo, que está la original.
-->
Exactamente, sin el marcador que la hayas colocado.
-->
De igual forma, pues hay veces que tú tomas la imagen
-->
y por defecto, si tienes tu celular,
-->
te puede mandar o tomar la ubicación.
-->
Entonces, tú comparte esa imagen
-->
y se te va la ubicación.
-->
Entonces, cualquier persona podía saber
-->
dónde estás en ese momento,
-->
en ese lugar que tomaste la imagen.
-->
Asimismo, vas a encontrar metadatos
-->
a nivel de lo que es música.
-->
Tengo no solamente el nombre,
-->
tengo el álbum, por ejemplo, el género
-->
y muchos elementos que puedo tener a nivel de metadatos
-->
o a nivel de un documento de texto.
-->
Por ejemplo, si hablamos de un documento de texto
-->
enriquecido tipo Word,
-->
se guarda mucha metadata,
-->
muchísima metadata del autor,
-->
que cuando lo modificó,
-->
qué elementos modificó.
-->
Entonces, ese es el concepto de lo que se llama metadata.
-->
Entonces, estos metadatos
-->
vamos a utilizarlo mucho acá
-->
dentro del concepto del catálogo de datos.
-->
Hay una definición interesante que los metadatos
-->
se definen como el ADN de los datos.
-->
Y aquí empezamos con lo siguiente.
-->
Tienes que ubicarte
-->
desde ya en qué vas a hacer
-->
dentro del software.
-->
No sé si alguien me comentó algo por ahí.
-->
Ok, perfecto.
-->
Listo.
-->
Tienes que ubicarte el perfil
-->
que vas a hacer en la herramienta.
-->
Y vamos a empezar esa ubicación
-->
partiendo de los tipos de metadatos
-->
que la herramienta te va a permitir manejar.
-->
En primer lugar,
-->
un metadato que llaman técnico.
-->
Ese es el metadato
-->
que vamos a recuperar
-->
de los archivos, las tablas
-->
o cualquier activo de datos
-->
que tengas en tu empresa.
-->
Entonces imagina que tienes una base de datos
-->
y vas a sacar los metadatos de las tablas.
-->
Básicamente vas a sacar
-->
los nombres de la columna
-->
y los tipos de datos.
-->
Ese perfil no es tan técnico
-->
pero el perfil tiene un pequeño problema
-->
en que para poder definir
-->
el metadato técnico
-->
tendrías que saber la ubicación
-->
de ese metadato.
-->
Y quizás quien sabe la ubicación
-->
normalmente puede ser el ingeniero de datos.
-->
Quizás gobierno y gestión
-->
de datos quizás no sabe.
-->
Sabe que existe el dato
-->
pero no sabe dónde está.
-->
Aclaro, aquí el problema no es técnico
-->
aquí el problema es de saber la ubicación
-->
porque en realidad la herramienta
-->
te permite muy fácilmente
-->
a partir de ya tu sepas dónde está
-->
poderlo ubicar.
-->
Entonces aquí podríamos hablar entonces
-->
ya sea de base de datos
-->
data lake y cualquier elemento
-->
que sea un activo de datos en tu empresa.
-->
Vamos ahora
-->
con el metadato de negocio.
-->
Ese metadato de negocio está
-->
más ubicado para aquella persona
-->
que tenga un perfil
-->
y conoce más la empresa.
-->
Esta es la persona que va a
-->
definir entonces digamos
-->
la metadata a nivel de los
-->
glosarios de términos de negocio.
-->
¿Por qué? Porque es la que ha trabajado
-->
entiende mejor y entonces
-->
es la que va a manejar esta parte.
-->
Quizás ya hay algunos
-->
metadatos definidos que quizás las tengan
-->
en archivos SV en alguna tabla, en un Excel
-->
y la idea es que esos
-->
metadatos que tienes ya
-->
definido los podamos reutilizar en la
-->
herramienta. Pero claro este negocio
-->
es lo que va a definir básicamente son
-->
como tal
-->
las definiciones de la metadata que
-->
tú tengas.
-->
Listo y vamos ahora con otro que es
-->
este si es un poco más técnico
-->
que es la metadata
-->
a nivel de linaje.
-->
Entonces esta linaje lo puedes
-->
llamar de tres formas o lo llamas
-->
linaje o lo llamas trasabilidad
-->
o lo llamas ciclo de vida de los datos.
-->
Cualquiera de los tres nombres es sinónimo
-->
llámalo como tú quieras.
-->
Yo tengo unos datos técnicos
-->
y entonces esos datos técnicos
-->
seguramente pueden sufrir algunas
-->
transformaciones. Y la idea es que
-->
el dato del linaje, el dato del linaje
-->
me diga entonces ¿qué
-->
transformaciones se hicieron?
-->
¿Quién las hizo? ¿En qué fecha
-->
se actualizó esa transformación?
-->
Es tal forma en que yo haga la trasabilidad
-->
del dato desde que inicia, se
-->
transforma hasta que se consume.
-->
¿Por qué digo que debe ser
-->
más técnico? Porque aquí es que entran
-->
a juego los
-->
jobs,
-->
pipeline, workflow como tú quieras llamarlo
-->
que tengan de alguna herramienta ETL.
-->
Por ejemplo, seguramente quizás
-->
estás casado con PowerCenter o con
-->
Talent Studio. Entonces
-->
hay unos jobs que tienes ya
-->
definidos ahí y esos jobs son los que te van a
-->
definir el linaje o el ciclo de vida
-->
de los datos. Aclaro que
-->
puede ser posible en
-->
que definas proyectos
-->
de catálogo de datos sin linaje.
-->
Pero con el linaje la herramienta es mucho
-->
más poderosa porque gráficamente te va a
-->
decir dónde inicia,
-->
qué se transforma y hacia dónde
-->
llega. Y ahí podías hacer
-->
una análisis de impacto en si yo
-->
cambio un valor, ¿cómo ese valor
-->
afecta a esa cadena?
-->
A esa cadena que se lee,
-->
a esa cadena que se transforma y esa cadena que se
-->
consume. Entonces aquí es un poco
-->
más técnico. Quizás
-->
puede que en este momento no
-->
tengas los jobs o quizás
-->
tienes que definir cómo vas a hacer la
-->
política de integrar esos jobs
-->
dentro de la herramienta. De todos modos va a ser un
-->
ejemplo de cómo se hace eso
-->
y cómo quedaría la herramienta
-->
con esos tres tipos de metadata.
-->
Y por último
-->
tenemos entonces un poco un rol más
-->
de calidad de datos. Y básicamente
-->
ese rol de calidad de datos,
-->
lo que la herramienta te va a permitir
-->
es verificar
-->
si están cumpliendo algunas normativas
-->
o reglas de calidad de datos.
-->
Aquí puede haber cuatro perfiles
-->
o dos perfiles o un solo perfil.
-->
Lo que pasa es que tienes que ubicarte
-->
en qué es lo que vas a hacer
-->
y cómo vas a trabajar con la herramienta.
-->
Técnicamente a nivel de usuario final, pues
-->
o eres técnico o eres de negocio
-->
o eres de linaje o eres de calidad
-->
o eres todos.
-->
Pero es lo que te va a permitir la
-->
herramienta específicamente.
-->
Bueno, voy a continuar entonces
-->
aquí. Sigo acá.
-->
Voy a definir ahora
-->
este concepto de
-->
unos conceptos que seguramente ya los
-->
conocemos, pero para reforzar
-->
y que todos partamos de la misma base.
-->
¿Por qué voy a agregar estos
-->
conceptos? Porque ahora estos elementos
-->
que voy a agregar aquí son
-->
fuentes donde yo puedo tomar
-->
mil activos de datos.
-->
Son fuentes para yo
-->
poder hacer los metadatos técnicos
-->
como tal.
-->
Primero empezamos con el concepto este
-->
de Data Warehouse, que en realidad
-->
este concepto hay algunos
-->
que creen que Data Warehouse es una
-->
tecnología y en realidad no lo es.
-->
Data Warehouse
-->
simplemente es un modelo de datos
-->
en los cuales yo voy a crear
-->
otra base de datos.
-->
Y en esa base de datos
-->
yo voy a mantener entonces mis datos
-->
decisionales.
-->
Por ejemplo, digamos que
-->
tú quieres segmentar
-->
tus clientes por
-->
edad, digamos.
-->
Y en ese momento de mercado
-->
vas a colocar entonces los datos que son
-->
relevantes para tus segmentos. Por ejemplo,
-->
carece de sentido mucho
-->
en que yo tenga en Data
-->
Warehouse, por ejemplo,
-->
un teléfono de un cliente. Por ejemplo, ¿por qué?
-->
Porque quizás ese teléfono no
-->
me da más información o
-->
me agrega información decisional del cliente.
-->
Normalmente yo lo que hago en Data Warehouse es llevar
-->
aquellos datos que son relevantes
-->
para tomar una decisión. Y por eso
-->
que algunos lo llaman como base de
-->
datos decisional.
-->
Pero no es una tecnología nueva.
-->
En realidad no es otro motor de base de datos.
-->
Si hay casos como
-->
de pronto usted ha escuchado en
-->
AWS una tecnología que se llama Redshift
-->
dice, no, Data Warehouse
-->
es un poco más comercial ese
-->
nombre que está ahí. ¿Por qué? Porque
-->
lo que busca ellos es ofrecerte una plataforma
-->
partiendo del hecho
-->
en que el Data Warehouse va a tener, entre comillas,
-->
doble, una gran cantidad y un volumen de datos
-->
muy alto. Entonces te ofrece una infraestructura
-->
pensando en el escalamiento de tus
-->
datos. Pero al final tú lo que vas a
-->
subir es un modelo y los datos que
-->
se asocian a ese modelo como
-->
tal. Entonces seguramente
-->
puede ser que algunos
-->
metadatos lo tomes
-->
del Data Warehouse, por ejemplo.
-->
Por eso es que lo menciono aquí.
-->
Y tenemos el concepto que es Datamar.
-->
Datamar básicamente que hay diferencia
-->
en un Datamar es un subconjunto de un
-->
Data Warehouse. Cuando hablamos de un
-->
Data Warehouse significa que yo tengo un modelo
-->
de datos en el cual
-->
tengo toda la parte adicional
-->
de mis áreas o departamentos de mi empresa.
-->
Por ejemplo, nómina, cuentas por pagar,
-->
todos los departamentos de tu empresa
-->
si están en un modelo de datos, se habla
-->
de un Data Warehouse.
-->
Si por el contrario, tú no más tienes
-->
solamente el modelo de datos
-->
para entender adicionalmente
-->
un área, se llama Datamar.
-->
De ahí viene que un Datamar
-->
es un subconjunto de un Data Warehouse.
-->
En teoría, la sumatoria de tus Datamar
-->
te da un Data Warehouse.
-->
Bien, pero esto lo menciono vuelvo y repito
-->
porque seguramente quizás tengas en
-->
tu empresa un Data Warehouse.
-->
Y es posible que podamos sacar
-->
alguna metadata técnica de ese Data Warehouse.
-->
Vamos nuevamente con el concepto este de
-->
inteligencia de negocio
-->
en que cuando yo empezaba
-->
a estudiar esos temas y yo empecé mucho
-->
con inteligencia de negocio hace muchos tiempos.
-->
Y cuando entra este concepto de Big Data
-->
entonces se decía que Big Data iba a acabar
-->
con la inteligencia de negocio, pues
-->
ese era un
-->
problema de definición que no lo tienen claro.
-->
En realidad Big Data es una tecnología
-->
más de almacenamiento y progresamiento
-->
en que al final tú lo que terminas
-->
haciendo es haciendo lo mismo que en la
-->
computación tradicional, pero ahora
-->
con un volumen de datos elevado y porque tú quieres
-->
con unos tiempos de respuesta que sean
-->
muy cortos. Entonces hoy
-->
en día se habla de un concepto interesante
-->
que se llama Big Data Analítica,
-->
que ahora esa analítica que le colocan
-->
ahí, la idea es que yo define a un
-->
proyecto de Big Data que me permita analizar,
-->
pero para analizar algo
-->
Big Data no está para analizar, porque
-->
para analizar algo tú tienes que
-->
entender primero el contexto de tus datos
-->
y que esos
-->
datos normalmente te los grafiquen o te los resumen
-->
en una tabla y tú a partir de tu
-->
decisión de conocimiento, tú puedas
-->
ver y analizar qué está pasando en tu empresa.
-->
Entonces Big Data como tal no es
-->
una tecnología de análisis,
-->
hoy en día se agregó ese concepto Big Data
-->
Analítico, sí, vaya venga, porque ahí sí está
-->
pensado en que se procese
-->
y que al final generes unas gráficas para que la
-->
persona idónea en el área
-->
pueda entender los datos.
-->
Al final dese cuenta que a nivel de
-->
Big Data,
-->
a nivel de Data Lake, tú puedes tener
-->
muchos datos no estructurados, por ejemplo un audio
-->
o una imagen, pero al final
-->
tú necesitas estructurar eso para tomar una edición,
-->
o sea, o para mostrarlo, necesitas estructurarlo.
-->
Entonces, en realidad
-->
Intel ese negocio todavía sigue en el mercado,
-->
y aquí muestro la arquitectura
-->
por lo siguiente, entonces se cuenta que
-->
aquí en esta parte aparecen
-->
unos datos de ventas, ERP,
-->
CRM, como tal,
-->
y que llegan a un área de
-->
data stacking,
-->
un área de stage,
-->
es un área intermedia, normalmente
-->
esa es otra base de datos en el cual
-->
hago unas conversiones para hacer más fácil
-->
el proceso de TL,
-->
pero aquí lo interesante de esta
-->
arquitectura es que yo podía tomar
-->
metadatos técnicos, ya sea
-->
de las fuentes de entrada, que son las bases de datos
-->
de ERP o CRM, la que tú tengas,
-->
podía tomar metadatas del área
-->
intermedia que es la de stage,
-->
podía tomar metadatas del
-->
data warehouse,
-->
podía tomar metadatas de los
-->
centros,
-->
podría tomar metadatas
-->
de las
-->
herramientas de explotación
-->
de Business Intelligence, por ejemplo
-->
Power BI,
-->
tú tienes un reporte en Power BI,
-->
y la herramienta te va a permitir
-->
conectarte hacia Power BI
-->
y sacar la metadata de ahí,
-->
lo mismo te va a pasar con Tableau,
-->
con los servicios de Quill,
-->
IBM y con SAP,
-->
aclaro que, vuelvo a repetir, la herramienta está
-->
pensada para tomar metadatas técnicas,
-->
ya sea de bases de datos,
-->
o ya sea, por ejemplo, en este caso,
-->
de herramientas de explotación.
-->
Esa es la interesante de la herramienta comutal.
-->
Por eso que mostré esta gráfica, simplemente
-->
para evidenciar,
-->
o para que, digamos, si ustedes entienden que yo podía
-->
sacar metadatas técnicas de cualquier
-->
elemento que está en esa arquitectura de ahí.
-->
Entonces, esos metadatos técnicos
-->
y operativos, lo que van a buscar es entender
-->
la origen de los datos,
-->
entender qué se está haciendo en la empresa
-->
con esos datos, o sea, la transformación de esos datos,
-->
la frecuencia de actualización
-->
y los responsables.
-->
A nivel de metadatos de negocios, lo que buscamos
-->
entender es definir términos de negocios,
-->
definir los glosallos
-->
como tal, definir las
-->
generaciones que hay entre esos términos,
-->
quienes usan los datos,
-->
para qué los usan, entonces, ahí
-->
esto va más de entender
-->
la empresa. No técnicamente,
-->
sino desde el punto de vista del negocio.
-->
Quizás
-->
eso sea para algunos
-->
un perfil. Entonces, quizás
-->
de pronto tú vas a entrar
-->
en la herramienta para definir
-->
estos conceptos y para después
-->
explotar estos conceptos como tal.
-->
Por aquí hay otro elemento
-->
que se llama un MDM,
-->
Master Data Management,
-->
ese que está ahí.
-->
En realidad, que esto no es
-->
otra tecnología, tampoco es
-->
nueva, esto es otra base de datos.
-->
Que esta base de datos prácticamente
-->
qué hace? Quizás
-->
tú tengas varias sucursales
-->
que tengas
-->
replicados algunos datos ahí.
-->
Quizás hoy en día se habla
-->
de conceptos de un cliente 360,
-->
entonces, ver el cliente
-->
de diferentes puntos de vista.
-->
Y tú necesitarías una fuente
-->
de verdad de esos datos transaccionales.
-->
Entonces, tú montas un MDM.
-->
Un MDM va a tener los datos clave
-->
de tu empresa, datos como cliente,
-->
productos, proveedores, ubicaciones de esos señores.
-->
Lo mantienes en esa base de datos centralizada
-->
y que determina
-->
una fuente de verdad para muchas
-->
sucursales que tienes datos replicados.
-->
Entonces, ahí viene el concepto de SMDM,
-->
que tecnológicamente no es
-->
una tecnología nueva,
-->
simplemente es otra base de datos
-->
en que mantienes datos actualizados de esos
-->
por ejemplo los clientes, los datos más importantes
-->
o más relevantes que tengas en tu empresa.
-->
De igual forma,
-->
al final, como es una base de datos, podía sacar
-->
también datos técnicos de SMDM
-->
como tal.
-->
Listo, entonces aquí tenemos
-->
esa parte
-->
seguramente usted la entiende
-->
mucho mejor que yo. Yo no tengo este perfil.
-->
Pero básicamente
-->
cuando uno habla de gobierno
-->
de datos, habla de la definición
-->
de reglas, ¿cierto? Definición de reglas
-->
estándares que van
-->
a regir la parte esta de
-->
calidad de datos, en este caso en particular,
-->
pero no solamente calidad de datos, sino
-->
para muchas cosas.
-->
Este perfil, prácticamente
-->
yo soy un poco más técnico, no me meto mucho
-->
en este perfil, seguramente usted lo entiende.
-->
Y básicamente ese gobierno de datos
-->
abarca lo que uno llama el PPT,
-->
personas, procesos y tecnologías.
-->
Al final,
-->
lo que busco con esta presentación es que
-->
tienes que saber cómo
-->
vas a integrar esa parte
-->
de gobierno de datos, tanto
-->
a nivel de reglas de estandarización
-->
como reglas de definición de cuáles
-->
son los datos dentro de la herramienta,
-->
cómo la vas a usar.
-->
Y además de eso es
-->
cómo a partir de una regla
-->
definida o un estándar definido en gobierno,
-->
cómo puedo verificar
-->
en la herramienta si se está cumpliendo o no se está
-->
cumpliendo. Eso es lo interesante
-->
de cómo puedes utilizar la herramienta
-->
en función de esta parte de gobierno de datos.
-->
Bueno, la parte de gestión lo que busca
-->
es, yo tengo pues un conjunto de reglas, estándares
-->
y la parte de gestión es
-->
implementarlo como tal,
-->
esas reglas para el procesamiento de esos datos.
-->
De igual forma,
-->
con la herramienta te va a permitir también
-->
entender qué se está haciendo con esos datos, básicamente
-->
con el ciclo de vida o el linaje
-->
o tasadida como tú quieras llamarlo.
-->
Y vuelve y juega
-->
nuevamente esta parte de calidad.
-->
La herramienta, su función
-->
principal no es encontrar
-->
anomalías de datos,
-->
aunque te da un pequeño
-->
módulo para poder,
-->
digamos, encontrar
-->
si existe alguna anomalía.
-->
Por ejemplo, si un dato no está
-->
en el formato indicado.
-->
Eso te lo promete la herramienta, pero su función
-->
principal no es esa, aclaro.
-->
Si te vas a meter mucho con calidad de datos,
-->
ahí tienes varias herramientas, herramientas
-->
que van desde el Talent Data Quality,
-->
otra herramienta que se llama el
-->
Talent Data Preparation, el Talent Data Quality
-->
es más técnico, el Talent Data Preparation
-->
no es tan técnico.
-->
Herramientas de curación social como
-->
Tilo Talent Data Stewards, que te va a
-->
ayudar en esa parte, pero,
-->
aclaro, se puede hacer
-->
algunas cositas con la herramienta de calidad,
-->
pero su función principal no es
-->
determinar anomalías que puedan tener
-->
los datos. Se puede decir, pero no es su función
-->
principal.
-->
Y aquí voy a mencionar este concepto
-->
que se llama arquitectura
-->
empresarial, básicamente
-->
para entender lo siguiente.
-->
La herramienta tiene una sección
-->
que se llama arquitectura empresarial,
-->
en el cual yo no estoy
-->
muy de acuerdo con el nombre,
-->
porque
-->
la arquitectura empresarial
-->
que
-->
uno de los marcos más usados
-->
se llama TOGAF, básicamente
-->
busca
-->
digamos
-->
sincronizar la estrategia
-->
de negocio con la tecnología.
-->
Eso
-->
no es tan fácil de hacer.
-->
Es como yo
-->
alineo esa estrategia
-->
con la tecnología y no es tan fácil
-->
en ciertos casos.
-->
Necesita mucha madurez en el mercado.
-->
Yo creo que yo tengo un ejemplo
-->
claro de cómo la tecnología
-->
no se alinea con la estrategia.
-->
Yo he trabajado en algunas universidades
-->
de la región y lo había comentado.
-->
Y en esas universidades,
-->
digamos
-->
que las universidades
-->
para ser franqueadas
-->
a nivel mundial y bueno,
-->
específicamente en Colombia,
-->
hay un factor de predominante que es
-->
la investigación. Y en esa investigación
-->
es cuántos artículos y cuántos impactos
-->
ha tenido sobre artículos. Entonces
-->
la universidad patrocina mucho en que los
-->
docentes escriban muchos
-->
artículos.
-->
En que desde mi punto de vista,
-->
eso es un negocio.
-->
Un negocio porque
-->
eso digo en el caso de Colombia, siendo una crítica
-->
corruptiva a la educación,
-->
tú terminas es
-->
yo te meto en mi artículo y tú me metes
-->
en mi artículo. Y al final
-->
según la persona que usted metió
-->
no sabe nada de eso. Lo que quiere
-->
es tener simplemente que escribió un artículo
-->
para poderse rankear y pagarle más en la universidad.
-->
Entonces al final
-->
tengo un conjunto de personas que escribió un
-->
artículo que no sé si saben
-->
o no saben lo que dice ahí. Y segundo
-->
que usted para publicar un artículo tiene que pagarlo.
-->
Pero usted le está pagando
-->
en el caso de Colombia, hay
-->
revistas que le están cobrando 20, 25
-->
millones de pesos. Pero si entonces dice
-->
al final un negocio,
-->
lees la revista, tú le pagas para que te publique, eso no tiene sentido.
-->
Al final termina siendo un negocio
-->
la revista. Entonces creo
-->
que esa parte no
-->
no confío mucho en ciertos artículos
-->
que están ahí en el mercado. Entonces
-->
la universidad quería
-->
entender qué hacían los docentes
-->
en sus tiempos.
-->
O sea, cómo es la productividad, que ya meí esa productividad
-->
del docente para poder
-->
definir estos artículos diciendo
-->
bueno, pero si, ¿por qué no le da tiempo
-->
de escribir un artículo a un docente?
-->
Como dato particular,
-->
el caso
-->
de Colombia y creo que se podía
-->
extender a ciertos países de Latinoamérica.
-->
Colombia es el país que más trabaja,
-->
pero que menos produce.
-->
Usted dice, ¿cómo así? Más trabaja, pero menos produce.
-->
Claro. Lo que pasa es que Colombia
-->
no entra a las ocho de la mañana,
-->
pero a las ocho de la
-->
mañana no empieza a trabajar.
-->
Empieza a trabajar a las nueve y media.
-->
Es decir, a las ocho empieza a echar cuenta de
-->
que si hubo un partido a Selección Colombia, empieza
-->
la Selección Colombia y todo lo que le pasó a su vida.
-->
O sea, no empiezas ocho en punto.
-->
Eso indica en que como empieza una hora más tarde
-->
a las nueve, no sale a las seis,
-->
que es típico, sino sale a las siete de la noche.
-->
Entonces trabaja más, pero produce menos.
-->
Claro. Porque en teoría está más
-->
en la empresa, pero en realidad no está trabajando,
-->
pierde mucho tiempo.
-->
El europeo y el gringo es diferente.
-->
El europeo es el gringo
-->
más específicamente. Ese señor,
-->
el gringo clásico norteamericano, ese señor
-->
es, no es como latino jovial
-->
que habla mucho y echa cuenta. No, ese señor está
-->
dedicado exclusivamente a trabajar.
-->
Entonces es muy riguroso una empresa
-->
en Estados Unidos. Hay muchos, no hay
-->
esas amistades, no son tan fuertes como la parte
-->
latina. Entonces ellos sí,
-->
evidentemente trabajan menos en horas, pero
-->
producen más porque todas las horas que están ahí son dedicadas
-->
justamente a trabajar.
-->
Entonces, quería medir
-->
y la estrategia era poder medir,
-->
bueno, en la productividad,
-->
va al nivel táctico y el
-->
táctico propone tecnológicamente
-->
comprar un huellero. Un huellero en
-->
Colombia es, usted entra en una empresa,
-->
pasa su huella y esa huella
-->
lo único que va a marcar es la hora de entrada y hora de
-->
salida. Entonces,
-->
ahí no hay una alineación de lo que buscaba
-->
estrategia con la tecnología,
-->
porque no hay garantía de que si usted llegó
-->
temprano a las 8 de la mañana, usted
-->
en realidad que estaba trabajando esas
-->
horas allá adentro. Porque fácilmente
-->
entró, se sentó, pero
-->
no hizo nada. Entonces, hay un claro
-->
ejemplo en que no hay una alineación
-->
de tecnología con esa estrategia.
-->
Entonces, la arquitectura empresarial está pensada para eso.
-->
le voy a dar porque agregué esta parte.
-->
Entonces, esa arquitectura empresarial
-->
se divide en cuatro tipos de arquitectura.
-->
Tengo esa arquitectura de negocio,
-->
que es el que define la visión hacia donde vamos
-->
ahí, el CEO, el que conoce la empresa.
-->
Tengo la arquitectura a nivel de
-->
TI, es decir, a nivel de infraestructura,
-->
hardware, software, redes,
-->
es decir, sistemas operativos,
-->
lenguajes de programación, motores de base de datos.
-->
Tengo la arquitectura de datos,
-->
que es la interesante, que define la
-->
estructura y el flujo de datos en la
-->
alineación, que datos son necesarios para cada
-->
elemento, y está la
-->
arquitectura de aplicaciones. En esa arquitectura
-->
de aplicaciones, lo que
-->
hago es que sistema de información voy
-->
a montar que apoyen
-->
la estrategia de negocio que tenga la empresa.
-->
Esto lo menciono simplemente
-->
porque, dese cuenta,
-->
en que esta arquitectura está compuesta
-->
por cuatro, y en realidad que hay un marco,
-->
hay un marco de desarrollo
-->
que indican cómo va implementada
-->
esta arquitectura. Entonces, el software
-->
tiene una sección que dice arquitectura
-->
empresarial, y yo no estoy
-->
muy de acuerdo con ese concepto porque
-->
para mí es un diagrama arquitectónico,
-->
no es una arquitectura
-->
empresarial. Tenga presente
-->
estas cuatro y ustedes, de su punto
-->
de vista, me dirá si está bien el nombre o no.
-->
Por último, entonces,
-->
tenemos el concepto de lo que es
-->
el catálogo de datos. Básicamente es un
-->
inventario de tus
-->
metadatos. ¿Cuál es el tipo
-->
de metadatos? Se lo mencioné anteriormente.
-->
Técnico, de negocio
-->
y operativos.
-->
Son los tres tipos de metadatos
-->
que te va a manejar cualquier herramienta
-->
de catálogo de datos.
-->
Esos tres tipos como tal.
-->
Y por último,
-->
esta parte del concepto de glosario
-->
de términos es la definición
-->
de los términos y conceptos
-->
que tienes en tu empresa
-->
con el objetivo en que se hable
-->
exactamente el mismo idioma
-->
para todas las partes.
-->
Por ejemplo, en el caso de sistemas
-->
de nuestra carrera
-->
es un poco más compleja.
-->
A veces los contextos
-->
no me ayudan mucho.
-->
Por ejemplo,
-->
yo he trabajado en algunos
-->
trabajos
-->
en otros países. Por ejemplo, el caso de
-->
trabajé una vez
-->
para Inglaterra
-->
y lo que me pillaron ahí
-->
textualmente era implementar
-->
una base de datos.
-->
Entonces, esa implementación de esa base
-->
yo entendía que yo iba
-->
a hacer el diseño
-->
de la base de datos a partir de unos requisitos
-->
e iba a montar esa base de datos
-->
en el motor que yo quisiera.
-->
Entonces, yo ese trabajo,
-->
yo apliqué
-->
ese trabajo.
-->
Noté que la suma de dinero
-->
que yo pedía era muy pequeña comparada
-->
con las demás y me han contratado
-->
a mí.
-->
Cuando yo hago la entrega, me dice el cliente
-->
eso no está incompleto.
-->
¿Por qué? No, porque lo que yo quiero
-->
es un sistema de información.
-->
Prácticamente, no me voy a decir, era un sistema de información.
-->
Es decir, me tocaba definir la base de datos,
-->
me tocaba definir las interfaces gráficas
-->
y la conexión y todo, o sea, todo.
-->
Entonces, ahí hay un problema y la carrera
-->
tiene cinco pendientes. Hay veces, hay unos conceptos
-->
que en algunos países
-->
son diferentes
-->
y se pueden entender de diferentes.
-->
La idea de un glosario de términos
-->
es que todo maneja en el mismo idioma.
-->
Además, si tú ves la que tú pensas
-->
de TOGAF, TOGAF tiene un
-->
glosario para que todos
-->
independientes del país hablen exactamente
-->
lo mismo, que cuando hablen de un concepto
-->
técnico independiente del país
-->
se hable exactamente y se entienda que es
-->
ese mismo independiente donde estés.
-->
Bien, esto entonces
-->
te va a mejorar mucho la comunicación
-->
y ya, pues creo que usted es más experto
-->
de esa parte. Eso es la
-->
introducción inicial. Ya vamos aquí, ya
-->
nos vamos a meter con la herramienta ya más
-->
específicamente, un poco más teórica aquí.
-->
Listo, entonces.
-->
Ahora sí nos vamos con la herramienta
-->
Talent Data Catalog como tal.
-->
Primero,
-->
la herramienta tiene
-->
tres versiones, una versión que llaman
-->
Standard, una versión que se llama
-->
Advanced y una que se llama Advanced Plus.
-->
Actualmente
-->
usted tiene la Advanced.
-->
Esa Advanced
-->
nos va a limitar
-->
con algunas cosas.
-->
Y más específicamente de esta
-->
forma. Seguramente ya tú tienes
-->
algunos metadatos, algunos glosarios
-->
y notarás que la estructura
-->
de datos de esos glosarios pueden variar.
-->
Digamos, tiene un glosario de ventas,
-->
un glosario de clientes, no sé, cualquier
-->
locura acá. Y esas estructuras
-->
de datos de lo que tú vas a guardar en
-->
el glosario pueden variar, porque cada glosario
-->
puede ser muy diferente.
-->
Con la Advanced no
-->
podíamos definir una estructura para cada
-->
glosario. Entonces tú desde ya
-->
tienes que ir pensando. Bueno, yo tengo un
-->
glosario de términos, tengo unos metadatos,
-->
pero esos metadatos no todos son
-->
iguales. Y partimos del hecho en que no puedo
-->
crear una metadata particular
-->
para cada glosario, entonces me toca definir
-->
una metadata genérica.
-->
En poca palabra, un modelo de datos genérico
-->
que englobe cualquier tipo de glosario.
-->
Entonces al final te puede quedar
-->
una estructura muy grande
-->
para glosarios que puede ser un poco más compleja
-->
de entender. Eso es para cuando veamos
-->
a nivel práctico, vas a comprender
-->
mucho más.
-->
Listo, esas son las tres versiones que tú tienes actualmente
-->
en la Advanced como tal.
-->
Básicamente lo que
-->
va a permitir la herramienta a nivel
-->
de usuario final es poder
-->
descubrir datos.
-->
Más específicamente
-->
cualquier metadato, ya sea técnico
-->
de negocio
-->
o operativo como tú quieras llamarlo.
-->
Te va a permitir
-->
perfilar los datos, es decir, ahora
-->
los datos los puedes catalogar.
-->
Imagínate lo siguiente,
-->
tú tienes por ejemplo
-->
GDPR
-->
y en GDPR tú puedes
-->
catalogar algunos tipos de datos, por ejemplo tipos de datos
-->
personales, tipos de datos
-->
sensibles como por ejemplo que puede ser la historia
-->
médica de un usuario, entonces tú puedes
-->
perfilar esos datos y la herramienta te va a ayudar
-->
a perfilar esos datos.
-->
Te va a permitir organizar
-->
y te va a permitir documentar esos datos de manera
-->
mucho mejor, porque ahora la organización tú puedes
-->
buscarlo como tú quieras y vas a ver
-->
unos gráficos que te van a permitir
-->
entender esos datos
-->
en la organización que te presenta la herramienta.
-->
Ahora básicamente
-->
al final lo que buscamos
-->
con este tipo de proyectos de catálogo de datos
-->
es primero entender
-->
qué significan los datos para ti.
-->
Lo tanto para ti, bueno para cualquier
-->
empleado de tu empresa. Segundo
-->
de dónde provienen esos datos
-->
y hacia dónde van esos datos.
-->
Quién posee
-->
esos datos y quién tiene
-->
acceso a esos datos.
-->
Y cómo deben utilizar los datos. Entonces aquí ya tienes
-->
el inventario completo, el significado
-->
de dónde proviene, quién lo
-->
tiene, si está en una base
-->
de datos, si está en un data lake, cómo
-->
impactaría pasar un data lake
-->
de un S3 que tengas de pronto
-->
a un Azure, cómo se están trabajando.
-->
Entonces tú puedes entender muy fácilmente
-->
cualquier tipo de proyecto que tú quieras
-->
implementar hoy en día.
-->
Bueno, sus funciones son principal
-->
descubrimiento, descripción de los datos
-->
y linaje como tal.
-->
Y ahora hay algo muy
-->
particular de la herramienta. La herramienta
-->
le va a permitir manejar el concepto de
-->
versiones. Ese concepto de
-->
versiones se ve mucho mejor con el ejemplo.
-->
Ese concepto.
-->
Pero ahora ve una versión de la siguiente
-->
forma. Tú tienes una tabla
-->
clientes, el cual tiene
-->
identificación, nombre y apellido.
-->
Digamos, a lo largo
-->
del tiempo tú puedes agregar
-->
más datos de clientes. Por ejemplo, lo que tengo yo
-->
teléfono. Entonces
-->
una versión uno puede ser cuando
-->
tenía los metadatos con los tres
-->
columnas. Y la versión dos
-->
es cuando tenga los metadatos con las cuatro
-->
columnas. Más o menos ese es
-->
el concepto de versión. Eso te va a permitir
-->
entender cómo ha sido el flujo
-->
de cambios en tu empresa.
-->
Te va a permitir ahora
-->
la gestión de acceso. Decir
-->
quiénes acceden a este catálogo y
-->
quiénes tienen permisos de ver esos datos.
-->
Y por último te va a permitir colaborar.
-->
¿Por qué? Porque cualquier cosa que tú
-->
encuentres, podías compartirlo con otros usuarios
-->
que estén en la herramienta del
-->
talent data catalogo.
-->
Bueno, aquí ahora vas a
-->
encontrar entonces
-->
esos silos de información que puedes tener en diferentes
-->
sucursales. Ahora vas a tener uno solamente fuente de verdad.
-->
Vas a tener un solo inventario
-->
que te va a decir, si está bien o no,
-->
si las políticas están bien implementadas.
-->
Si te va a decir una fuente de verdad
-->
de esos metadatos que vas a tener.
-->
Vas a demorar
-->
menos tiempo buscando metadatos
-->
o datos como tal.
-->
Y vas a fomentar
-->
a utilizar esto
-->
en otros proyectos. No solamente de pronto
-->
quizás iniciarte el proyecto para
-->
un área, pero seguramente cuando
-->
veas las ventajas vas a pensar en definir
-->
proyectos a futuro para otras
-->
áreas del mercado como tal.
-->
Esta es la venta, esta es la
-->
ventana
-->
inicial del
-->
software. Esto es lo
-->
que se llama un, para ellos esta
-->
ventana inicial la llaman un dashboard.
-->
En ese dashboard hay
-->
unos elementos específicos que están por defecto.
-->
Tenemos un menú
-->
acá horizontal en la parte
-->
arriba y tengo unos enlaces.
-->
Y vea que en el enlace aparece el concepto
-->
que se llama arquitectura
-->
empresarial.
-->
Listo.
-->
¿Qué seguimos? Ahora
-->
la
-->
ya ahora como tal la herramienta
-->
va a definir el concepto de
-->
objeto. Un objeto
-->
es cualquier metadato que tú tengas.
-->
Que pueda ser metadatos que
-->
obtengas a nivel de almacenamiento.
-->
Por ejemplo, que lo tengas guardado en una tabla,
-->
en un archivo, en un data-lay,
-->
en un data que son los archivos que manejan
-->
para
-->
estas redes sociales. Entonces
-->
tú puedes mantener objetos de ese tipo.
-->
Puedes mantener objetos a nivel de
-->
los esquemas, tablas,
-->
informes, archivos.
-->
Cuando digo informes ahí son PowerBee,
-->
Tableau,
-->
Quick. Puedes ahora
-->
agregar objetos
-->
que lo llaman herramienta
-->
objetos a nivel de flujo de datos.
-->
Es decir, todos los
-->
objetos.
-->
Puedes tener objetos
-->
a nivel de
-->
descripciones,
-->
columnas o etiquetas que quieras
-->
mencionar.
-->
Listo.
-->
Entonces aquí
-->
esto te lo voy a
-->
mostrar a nivel
-->
de implementación.
-->
Pero aquí me tomé la libertad
-->
de hacer un flujograma,
-->
un diagrama de flujo
-->
de cómo
-->
la herramienta funciona o cómo
-->
la herramienta trabaja.
-->
Entonces, todo esta parte
-->
teórica que tengo aquí, que
-->
configuraciones, worksheet, como
-->
tal. Todo esto que está aquí
-->
vamos a tomar
-->
la herramienta y voy a complementar
-->
con la herramienta a nivel práctico
-->
y me devuelvo a la parte
-->
de la presentación y podemos ver
-->
entonces la teoría y la
-->
práctica al mismo tiempo.
-->
Entonces, ¿qué vamos a hacer ahora?
-->
Ahora sí,
-->
vamos a acceder a la herramienta
-->
por favor, a la máquina virtual para
-->
algunos. Sé que
-->
otros van a
-->
decidir
-->
montarlo de su máquina
-->
original, pero
-->
por lo menos necesito que alguno se
-->
conecte a su máquina virtual
-->
para poder ver, yo
-->
debido a que no puedo acceder al software como tal.
-->
Daniel,
-->
no sé si me das, veo que estás
-->
conectado, no sé si me permites
-->
te guío
-->
y nos va mostrando el software como tal.
-->
Sé si hay problemas
-->
en tomar tu pantalla y poder visualizarla.
-->
Listo,
-->
perfecto.
-->
primero, vayamos,
-->
vamos a definir
-->
entonces los siguientes
-->
conceptos. Cuando yo diga, vayamos
-->
al home
-->
de la herramienta, vamos a hacer lo
-->
siguiente.
-->
Daniel, ¿notas que en la parte superior izquierda
-->
hay una T que tiene un color como
-->
salmón o rosado, ¿no?
-->
Al ladito hay un círculo que tiene como
-->
un libro dentro, dale click ahí.
-->
Cuando yo diga home, es que nos vayamos
-->
ahí, dale click ahí. No, en el
-->
en el librito, en el círculo,
-->
en el de al lado.
-->
Ahí también te da, bueno, perfecto.
-->
Entonces, eso te lleva al home.
-->
El caso de Arturo,
-->
por favor, escoge la última
-->
opción. Arturo,
-->
Arturo, voy a mostrar tu pantalla, por favor, para que
-->
Denise seguí.
-->
Denise y Arturo están en esta pantalla.
-->
Por favor,
-->
escogen, dale doble click al
-->
test job migration, que es la última opción
-->
que está ahí. Al final,
-->
en el listado, dale click a ese.
-->
Perfecto, y estamos
-->
exactamente en la misma ventana que
-->
está Daniel.
-->
Entonces, cuando yo diga al home, se van
-->
a esa parte y nos va a mostrar,
-->
esto se llama el dashboard.
-->
El dashboard está integrado entonces
-->
por los elementos que voy a mostrar aquí.
-->
Por defecto, tengo unos enlaces
-->
y tengo la palabra worship y
-->
dashboard.
-->
Listo.
-->
Sigamos entonces.
-->
Daniel, si eres tan amable,
-->
dale click abajito en el menú object.
-->
Dale click,
-->
por favor, esto es
-->
click ahí para expandir ese menú
-->
que tienes ahí.
-->
Estos objects, ¿qué son?
-->
Fue lo que mostré teóricamente. Un object puede ser
-->
una metadata que tomé
-->
de una tabla,
-->
una metadata que tomé de un archivo
-->
en un data lake, una metadata que tomé
-->
por ejemplo de un
-->
job en talent studio
-->
o una metadata que tomé de un glosario.
-->
Entonces, ese menú que está ahí me va a permitir
-->
encontrar los diferentes objetos
-->
que he creado como tal.
-->
Dale click, por favor,
-->
al siguiente.
-->
Dale click en
-->
colección.
-->
Listo.
-->
Entonces, pre-tradición a lo siguiente.
-->
Estamos en la herramienta. La herramienta
-->
tiene el concepto
-->
que se llama configuración.
-->
Imagínate la configuración
-->
como una carpeta
-->
donde yo voy a guardar todos los
-->
objetos de mi proyecto.
-->
Nuevamente, la herramienta
-->
maneja el concepto de configuración.
-->
Imagina la configuración como
-->
una carpeta donde yo voy a
-->
colocar todos los objetos de mi
-->
proyecto. Ahora,
-->
¿qué es una colección?
-->
Imagina la colección como si fuese una
-->
subcarpeta dentro
-->
de la carpeta más grande del proyecto
-->
donde yo pueda agrupar, por ejemplo,
-->
subproyectos o pueda agregar
-->
elementos que tienen características
-->
comunes. Entonces, configuración
-->
es como si fuese la carpeta
-->
dentro de los objetos y colección
-->
una subcarpeta que va a permitir agrupar
-->
los objetos.
-->
Vete a donde dice worship,
-->
por favor, click ahí en worship
-->
al ladito.
-->
¿Qué es worship?
-->
Worship qué es? Va a ser la
-->
consulta que tú vas a hacer
-->
en la herramienta de catálogo de datos y que esa
-->
consulta tú la puedas compartir con otros
-->
usuarios. Eso es lo que es un
-->
worship. Vete a donde dice
-->
dashboard, por favor, click en dashboard.
-->
Click ahí, por favor.
-->
¿Qué es dashboard?
-->
Dashboard simplemente es la
-->
interfaz gráfica
-->
de cómo tú quieres
-->
o qué elementos tú quieres mostrar, por
-->
ejemplo, cuando tú inicias
-->
el talent data catalog. Dese cuenta que
-->
por defecto me aparece un menú de acceso
-->
directo que dice welcome data catalog,
-->
me aparece worship y me aparece
-->
dashboard. Pero quizás tú
-->
quieres quitar esos elementos y te
-->
aparezca algo diferente. Entonces dashboard
-->
simplemente es la interfaz gráfica
-->
que te va a permitir configurar
-->
y agregar los elementos que tú quieres
-->
ver en la pantalla inicialmente,
-->
en esta pantalla que estamos actualmente.
-->
Y vete a donde dice manage,
-->
por favor.
-->
Dale click en manage.
-->
Y aquí
-->
nos vamos a dividir un poco.
-->
Porque aquí podríamos
-->
pensar en dos tipos de usuario,
-->
de la herramienta como tal.
-->
Un tipo de usuario netamente administrativo
-->
de la herramienta y un usuario
-->
final de la herramienta.
-->
El administrativo le va a tocar hacer
-->
varias cosas. Entre esas, por ejemplo,
-->
la que hizo la persona
-->
de su empresa, que fue la que
-->
creó los usuarios
-->
y le definió los permisos.
-->
Ese es un usuario netamente administrativo
-->
de la herramienta. Ahora,
-->
esa persona seguramente no va a definir
-->
modelos de datos,
-->
metadatos a nivel técnico, operativo,
-->
de negocio. No es su función.
-->
Su función principal es, bueno, configurar
-->
la herramienta para que aquella persona que va a
-->
crear los metadatos tenga los permisos
-->
correctos para crear los elementos que necesita.
-->
Este perfil administrativo
-->
no lo voy a explotar tanto
-->
porque ya la herramienta tiene algunos
-->
elementos configurados y podríamos
-->
dañar alguna cosa que sea ahí. Entonces,
-->
lo que sí voy a hacer es que
-->
les voy a decir teóricamente qué es lo que hace
-->
cada cosa y qué podía configurar
-->
con esos elementos a nivel administrativo.
-->
Entonces, aquí creo
-->
que la mayoría vamos a ser usuarios finales, pero
-->
de todos modos te voy a indicar
-->
si vas a ser administrador cómo vas
-->
a tener que administrar como tal
-->
la herramienta.
-->
Listo, perfecto.
-->
Permítame un momento
-->
ahora. Voy a abrir acá un archivo
-->
y vamos a crear
-->
nuestro primer proyecto
-->
de catálogo de datos.
-->
Es claro lo siguiente,
-->
para tú empezar un proyecto de catálogo
-->
de datos
-->
tú tienes que definir
-->
pues una planificación y el proyecto
-->
como tal. Quiere decir que la herramienta
-->
parte del hecho
-->
en que ya tú tienes
-->
definido un proyecto de catálogo
-->
de datos. O sea, no va a
-->
empezar por sí sola como tal.
-->
Listo, entonces, para esta parte
-->
voy a hacer lectura
-->
de este caso de estudio.
-->
Dice lo siguiente,
-->
descripción de la empresa
-->
Acme Sportingwear
-->
es una empresa de venta de ropa
-->
deportiva con presencia en Europa
-->
y Estados Unidos.
-->
Perfecto.
-->
Vende sus productos a través
-->
de su sitio web y tiendas físicas.
-->
Y almacena información
-->
sobre sus clientes, pedidos
-->
y productos en una base de datos.
-->
Problemas
-->
que tiene la empresa hoy en día.
-->
Falta de visibilidad y control
-->
sobre los datos de clientes
-->
y pedidos. No sabe
-->
qué datos está manejando cada sucursal.
-->
Tengo varias sucursales independientes
-->
pero cada
-->
sucursal maneja los datos de forma
-->
diferente o tiene datos diferentes.
-->
Dificultad para analizar las ventas
-->
y el comportamiento de los clientes
-->
en diferentes regiones.
-->
Incoherencia de la calidad
-->
y significado de los datos.
-->
Y pérdida de tiempo y recursos
-->
de la gestión manual de los datos.
-->
Hay un problema
-->
en que no sé qué datos está manejando.
-->
Por ejemplo, tengo unos informes
-->
y no sé esos informes
-->
qué datos está tomando la base de datos
-->
si en realidad hay una transformación de esos
-->
datos porque hay unos reportes que tienen
-->
algunos errores. Entonces
-->
tengo algunos inconvenientes.
-->
Solución.
-->
Implementación del TDCC.
-->
Aquí le coloque 2C.
-->
La segunda C es de Cloud.
-->
Talent Data Catalog Cloud.
-->
Para centralizar la gestión de los metadatos
-->
de las tablas. Ahí me coloca los
-->
nombres de las tablas. Implementar
-->
un gobierno de datos efectivos para garantizar
-->
la calidad y significado de los datos.
-->
Y facilitar el acceso
-->
y la colaboración en torno a los datos
-->
de clientes y pedidos.
-->
Y obtener información valiosa
-->
para la toma de decisiones estratégicas.
-->
Eso es lo que estamos buscando
-->
en el proyecto como tal.
-->
Ahora, permítame
-->
y voy a dibujarle el diagrama
-->
de cómo estamos actualmente en esa
-->
empresa. Entonces, permítame y voy a crear
-->
aquí un flujo de gramo.
-->
Un diagrama de flujo.
-->
Listo, voy a crear aquí un nuevo diagrama.
-->
Listo. Perfecto.
-->
Entonces, actualmente
-->
la empresa tiene montado
-->
un data lake.
-->
Un data lake.
-->
Un data lake.
-->
Este data lake lo tiene montado
-->
específicamente en un S3.
-->
Bueno,
-->
AWS3.
-->
Fácilmente puede ser tu empresa y yo creo que
-->
tu empresa lo tiene montado, si mi
-->
cálculo no le falla, lo tiene montado
-->
sobre
-->
Azure, tu data lake.
-->
Me parece a mi creo. Listo.
-->
Hay una base
-->
de datos
-->
en que tenemos
-->
estos datos que están acá arriba
-->
en el data lake. Y ahora
-->
estos, hay un job,
-->
hay un pipeline, hay un workflow
-->
que son palabras exactamente iguales
-->
para lo mismo prácticamente.
-->
Lo que pasa es que, por ejemplo, AWS
-->
llama pipeline a su job.
-->
Talent Studio llama los job
-->
job. Creo que Power Centro
-->
llama workflow. No recuerdo
-->
bien los nombres, pero es lo mismo al final.
-->
Entonces tienes acá un job.
-->
Voy a colocar aquí
-->
job para ver si me sale.
-->
Básicamente este job
-->
que está aquí es un ETL.
-->
Un job ETL que lo que está haciendo
-->
es tomo los datos de acá de TS3
-->
y lo lleva acá a una
-->
base de datos.
-->
Ten en cuenta que esa base de datos la tienes
-->
replicada en diferentes partes a nivel mundial.
-->
Ahora,
-->
tenemos como hacemos para explotar
-->
esta base de datos. Entonces tengo
-->
unos informes que los tengo
-->
presentado en Tableau.
-->
Tengo aquí una
-->
tablita.
-->
Tableau se conecta a esta base de datos
-->
y Tableau, lo que está
-->
haciendo actualmente,
-->
es que muestra unos reportes,
-->
unos cuadros de mando
-->
a las diferentes personas
-->
encargadas de tomarte ediciones.
-->
Entonces, hay unos problemas a nivel
-->
de calidad. Hay unos problemas
-->
en que no sé qué campos
-->
maneja Europa, qué campos maneja
-->
Estados Unidos. No sé
-->
si el reporte está tomando los datos
-->
y qué datos está tomando de base de datos.
-->
No sé si en realidad que el job que
-->
está tomando los datos de TS3
-->
a la base de datos lo está transformando
-->
y si lo está transformando bien.
-->
Porque puedo tener algunos errores de pronto acá
-->
a nivel de Tableau
-->
y de pronto el error que está mostrando aquí
-->
no es un problema ni directamente de base de datos,
-->
sino de pronto que el TS3 está malo.
-->
O sea el Tableau tiene el archivo
-->
malo. Bueno, tantas cosas pueden pasar
-->
aquí.
-->
Este sería el flujo de trabajo
-->
que vamos a resolver entonces.
-->
Listo. Vamos
-->
a la herramienta como tal.
-->
Me voy nuevamente ahora con Daniel
-->
que es muy amablemente.
-->
Daniel, te digo Daniel o te digo Giovanni, qué pena
-->
que noté que tu Daniel
-->
parece acá como Daniel.
-->
Listo, todavía no hay
-->
problema entonces.
-->
Primera pregunta que te vas a hacer.
-->
Ya tengo el proyecto de planificación.
-->
Ya entiendo cuáles son
-->
los problemas.
-->
Y listo. ¿Cómo hago para empezar
-->
un proyecto de catálogo de datos
-->
en la herramienta?
-->
Entonces, mi recomendación es
-->
vamos a crear una carpeta
-->
y en esa carpeta vamos a mantener
-->
todos los objetos del
-->
proyecto.
-->
Entonces, por favor, vayamos
-->
todos al siguiente menú.
-->
Vayamos entonces, cuando yo
-->
diga, vayamos al repositorio,
-->
significa que tienes que entrar al menú
-->
Manage y vas al menú
-->
que dice repositorio, por favor.
-->
Si eres tan amable.
-->
Y listo.
-->
Se ubicas ahí en el repositorio.
-->
Voy a
-->
verificar. Permítame. Voy a abrir acá
-->
un archivo
-->
para guiarme porque no tengo
-->
el software. Entonces,
-->
perdón.
-->
Listo.
-->
Me espera un momento, por favor.
-->
Listo.
-->
Ahora voy a verificar entonces
-->
si estamos
-->
en el caso tuyo, Arturo.
-->
Por favor, vete al menú
-->
repositorio.
-->
Que voy a salirte.
-->
Bien. Entonces,
-->
vamos a crear una carpeta.
-->
Para crear la carpeta, nos ubicamos,
-->
si eres tan amable, Daniel y todos,
-->
a la plaga repositorio que está ahí arriba
-->
del lado izquierdo, dale click ahí
-->
y le da click derecho.
-->
Click primero para seccionar, click derecho ahora.
-->
Te aparece un menú
-->
que dice new. Vete al new
-->
y le dices folder, por favor.
-->
Coge la opción
-->
folder.
-->
Y muy importante, vamos a llamar este
-->
folder para que sea muy rápido
-->
y muy fácil para
-->
la persona que está administrando al final del curso
-->
sepa qué es lo que va a borrar. Vamos a
-->
llamar el folder de la siguiente forma.
-->
Lo vamos a llamar
-->
test
-->
llámalo
-->
test
-->
underscore
-->
o rayita piso
-->
rayita
-->
rayita
-->
en la carpeta contenedora de
-->
los proyectos del curso
-->
talent data catalogo. Entonces,
-->
ya yo le pudiera indicar a la
-->
persona que es mi intrecirle,
-->
mira, borra de todas las
-->
carpetas que empiezan por
-->
test. Todos, por favor,
-->
vamos a ver si todos seguimos
-->
test guión piso o de record
-->
curso on record Daniel.
-->
Démole, OK, por favor.
-->
Perfecto.
-->
Bueno, creo que ya aclaro que
-->
aquí solamente veo las pantallas
-->
de la maquina actual, entonces,
-->
quizás haya alguien que no no
-->
lo hizo y no lo puedo ver si no
-->
lo si tiene algún problema me
-->
avisas porque no estoy viendo
-->
sus pantallas entonces cuando
-->
están trabajando ya directamente
-->
en su máquina. Listo,
-->
esta carpeta la creamos para
-->
organizar y meter todos los
-->
objetos del proyecto en
-->
cuestión. Ahora,
-->
lo siguiente, si el proyecto
-->
es nuevo, o si vas a definir un
-->
proyecto para un ambiente de
-->
desarrollo, sea desarrollo o
-->
producción, en estos dos casos
-->
vas a crear una configuración
-->
nueva. Nuevamente repito, si
-->
el proyecto es nuevo o lo que
-->
vas vas a definir es un
-->
proyecto a nivel de un
-->
ambiente de desarrollo, sea
-->
developer o producción, vas a
-->
crear una configuración. Te
-->
había confi, te había hecho la
-->
analogía, una configuración es
-->
como si fuese la carpeta que
-->
va a contener todos los
-->
objetos, ¿Sí? Pero
-->
internamente para el señor
-->
Talendata Catalog. Esa
-->
herramienta que está acá para
-->
verlo visualmente, pero él
-->
ahora los objetos los une a
-->
través de una configuración
-->
interna. Entonces, para crear
-->
una configuración, vamos a lo
-->
siguiente. Se sitúa
-->
justamente en el nombre de la
-->
carpeta que creó y le va a
-->
dar clic derecho vamos al menú
-->
new y vamos a donde dice
-->
configuración por favor,
-->
escogemos la opción
-->
configuración
-->
vamos a llamarla todo
-->
exactamente igual, llama todo
-->
minúscula, ¿OK? Daniel, TDC,
-->
de tal en atacar las siglas,
-->
TDC, underscore, configuración,
-->
underscore, tu nombre. En ese
-->
caso no le vamos a agregar
-->
descripción.
-->
OK, perfecto. ¿Por qué creamos
-->
una configuración? Porque vamos
-->
a crear un nuevo proyecto. La
-->
configuración lo que va a
-->
mantener unido son los
-->
diferentes objetos
-->
internamente y la carpeta lo
-->
que me ha prometido que
-->
sale visualmente. Aclaro,
-->
tú puedes tener un proyecto
-->
que tenga objetos que
-->
tengan diferentes carpetas.
-->
Por eso creamos una carpeta
-->
de todos uno, una única
-->
carpeta de todos, de tal
-->
forma en que los objetos que
-->
creemos, cada quien pues no
-->
interviene con los objetos
-->
que crea otro usuario.
-->
Perfecto. Ahora, sumamente
-->
importante lo siguiente ahora.
-->
Cuando en el menú la parte
-->
superior derecha va a
-->
encontrar ahí un avatar,
-->
eso lo voy a explicar más
-->
tarde, pero antes del avatar
-->
aparece un combo voz que
-->
parece una, una, ella aparece
-->
como una pequeña flechita.
-->
Si le alcanzas a ver a Daniel
-->
superior derecha, al lado del
-->
avatar, vas para derecha,
-->
en la, en la, a la punta
-->
derecha, ves el avatar ahí
-->
que está como el, el usuario
-->
y dice test John Migración.
-->
Sí, ¿Viste dónde dice test
-->
John Migración? Creo que
-->
todos estamos ahí. Dale click
-->
ahí, por favor, clic ahí y
-->
se va a expandir un menú.
-->
Ojo a lo siguiente, ese test
-->
John Migración me va a
-->
explicar en qué configuración
-->
estoy conectado actualmente.
-->
Como la idea es que cada uno
-->
eh vamos a crear un proyecto
-->
diferente, cada uno nos vamos
-->
a conectar a la configuración
-->
que hicimos. En el caso
-->
particular de de Daniel,
-->
sería a TDC configuración, si
-->
no aparece, dale more,
-->
por favor. Si no te
-->
aparece, dale more. Y busca
-->
tu configuración que se llama
-->
TDC. Debe estar abajo. Ah, ahí
-->
está, TDC, por favor, escójela,
-->
selecciona y dale, creo que
-->
doble clic te da. Vete a
-->
repositorio, cuando yo diga
-->
repositorio, manage,
-->
repositorio. Compruebe, por
-->
favor, que en la esquina
-->
superior derecha, le aparezca
-->
justamente la configuración
-->
que usted creó.
-->
Perfecto, comprobamos que es
-->
la configuración. Entonces,
-->
cuando vaya a acceder a el
-->
curso, el día lunes y el día
-->
martes, asegúrese, por favor,
-->
en que esté ubicado en la
-->
configuración suya. O más
-->
precisamente, a nivel día de
-->
producción, que esté
-->
configurada, que esté en la
-->
configuración del proyecto que
-->
usted quiere trabajar. Bueno,
-->
hagamos un pequeño break de
-->
diez minutitos y volvemos
-->
entonces para continuar. Voy a
-->
buscar un poquito de café
-->
y volvemos en diez
-->
minutitos, ¿OK?
-->
Vamos a ver.
-->
Vamos a ver.
-->
Vamos a ver.
-->
Vamos a ver.
-->
Vamos a ver.
-->
Vamos a ver.
-->
Vamos a ver.
-->
Vamos a ver.
-->
Vamos a ver.
-->
Vamos a ver.
-->
Vamos a ver.
-->
Vamos a ver.
-->
Bueno, continuamos. ¿Estamos
-->
ahí conectados? Sí.
-->
Sí, sí, sí. Por favor,
-->
Daniel, antes, vete, dale clic
-->
en el nombre de la
-->
configuración, no en el número
-->
ese que está ahí en la fecha,
-->
sino arriba, en el nombre de
-->
la configuración que dice,
-->
TDC Configuration, Daniel.
-->
Dale clic ahí. Del lado
-->
izquierdo.
-->
Ah, perdón, tenía el...
-->
Estaba en silencio.
-->
Bueno, volvimos nuevamente.
-->
Daniel, si él está amable,
-->
en el repositorio, o sea,
-->
del lado izquierdo, dale clic
-->
en el nombre de la
-->
configuración, si él está
-->
amable.
-->
En el nombre dice,
-->
TDC Configuración, Daniel,
-->
dale clic, por favor,
-->
inicialmente ahí.
-->
Listo, empezamos entonces
-->
con esta parte.
-->
Cuando creas un oqueto
-->
en la herramienta, sale
-->
en unos menús que van a ser
-->
muy comunes.
-->
En primer lugar, aparece
-->
entonces el overview, que
-->
da un resumen del ojeto.
-->
Ese menú es común.
-->
Va a aparecer la descripción,
-->
que tú puedes agregar una
-->
descripción, por favor.
-->
Si está amable, Daniel,
-->
coloca entonces, descripción.
-->
Configuración de un proyecto
-->
de ejemplo.
-->
Y cada vez que tú haces un
-->
cambio, tienes que darle
-->
safe del lado derecho.
-->
Si notarás del lado
-->
derecho, te aparece un
-->
safe aquel lado.
-->
Perfecto.
-->
Me queda un momento con
-->
ese menú.
-->
Entonces, si está viendo mi
-->
pantalla, le había dicho que
-->
voy entonces a ligar los
-->
conceptos de herramienta con
-->
la parte teórica de acá.
-->
Nota que ahí aparece en la
-->
parte de abajo de la
-->
descripción, que está
-->
apareciendo, aparece un
-->
label.
-->
Los labels son un elemento
-->
para que usted pueda
-->
documentar ciertos objetos que
-->
define la herramienta o que
-->
se define la herramienta como
-->
tal.
-->
Básicamente, un label es una
-->
etiqueta.
-->
Y con esa etiqueta, yo puedo
-->
hacer búsqueda.
-->
¿Qué me va a permitir eso?
-->
Pues como lo estaba
-->
diciendo, mejorar las
-->
búsquedas y la revisión
-->
y me va a pedir centralizar
-->
en el proyecto los
-->
diferentes labels.
-->
Dele click, por favor.
-->
Ahora sí al label.
-->
Si es tan amable.
-->
Ahí hay un combo voz.
-->
Dale click al label.
-->
Dale click, por favor.
-->
Nota que aquí hay unos
-->
labels que ya están
-->
definidos.
-->
Esos labels se nos quedaron
-->
del otro curso, pero los
-->
labels que...
-->
Eso que hice anual,
-->
solicitud, no son...
-->
No deberían estar ahí.
-->
Fue del curso pasado que se
-->
agregaron ahí.
-->
Pero hay unos labels que ya
-->
están definidos que se
-->
llaman de G daños,
-->
catálogos de G daños,
-->
datos, etcétera.
-->
Ahora lo siguiente, por
-->
favor.
-->
Vete al menú Manage.
-->
Vete al menú Manage,
-->
si es tan amable, Daniel.
-->
Y hay una opción que dice
-->
labels.
-->
Si los ves ahí,
-->
dice labels.
-->
Dale click en labels.
-->
Esos labels que aparecen
-->
ahí por defecto son los
-->
labels que están
-->
agregados acá.
-->
Característica de los
-->
labels.
-->
Yo puedo definir labels a
-->
nivel centralizado.
-->
Y hay unos labels que son
-->
muy particulares de la
-->
configuración.
-->
Los labels que son
-->
centralizados,
-->
significa lo siguiente.
-->
En que todos los usuarios
-->
de los proyectos
-->
obtienen esos mismos
-->
labels.
-->
Es decir, que si agregamos
-->
un nuevo label,
-->
todos los usuarios
-->
del Talent Data Catalog
-->
van a tener esos labels.
-->
En teoría,
-->
aquí es que lo vemos.
-->
Tú,
-->
independiente de la
-->
herramienta, hay veces que
-->
la herramienta pues no se
-->
va a adaptar completamente
-->
a tu proceso de negocio.
-->
Tú normalmente
-->
adaptas tus procesos
-->
a la herramienta
-->
como tal.
-->
Y este no es el caso.
-->
Entonces tú tienes que
-->
adaptarla.
-->
Normalmente,
-->
según recomendación,
-->
mira mi pantalla,
-->
voy aquí a crear un
-->
archivito notepad aquí.
-->
Según recomendación
-->
de la herramienta,
-->
esos labels
-->
deberían decirte a ti
-->
un estado
-->
del objeto como tal.
-->
Por ejemplo,
-->
lo ideal según lo que
-->
recomienda la herramienta
-->
es que ahí aparezca
-->
label que digan
-->
en revisión,
-->
por ejemplo,
-->
que te diga aprobado,
-->
voy a colocarlo más grande,
-->
aprobado,
-->
que te digan,
-->
por ejemplo,
-->
que te digo yo,
-->
no conforme
-->
o que te diga
-->
en desarrollo.
-->
¿Cuál es la idea
-->
al final de la etiqueta?
-->
En que si yo marco,
-->
por ejemplo,
-->
esa configuración
-->
y digo en revisión,
-->
yo puedo hacer una búsqueda
-->
fácilmente y que
-->
me permita encontrar
-->
de manera muy rápida
-->
todas las configuraciones
-->
que están actualmente
-->
en revisión
-->
o yo puedo buscar
-->
todas las configuraciones
-->
que están actualmente
-->
no conforme.
-->
Esa es la idea
-->
de ese label
-->
en que yo pueda
-->
mejorar
-->
y encontrar
-->
más rápidamente
-->
algunos elementos
-->
que tienen alguna
-->
condición.
-->
Aclaro que
-->
para el caso particular
-->
de la forma en que
-->
está implementado,
-->
alguno pues seguramente
-->
en alguna reunión
-->
concibió que la mejor
-->
forma
-->
era definir
-->
eso que está ahí.
-->
Listo.
-->
Bueno,
-->
vayamos nuevamente
-->
al repositorio
-->
si es tan amable.
-->
Vete al repositorio
-->
al nombre
-->
de la configuración
-->
del Eclipse
-->
nuevamente al nombre
-->
de la configuración
-->
y entonces ahí tienes
-->
esos labels.
-->
Aclaro,
-->
hay unos labels
-->
que son de toda
-->
la herramienta
-->
y hay unos labels
-->
que son de la configuración.
-->
En el caso,
-->
por ejemplo,
-->
si Daniel crea un label
-->
de tipo de configuración
-->
solamente aplica
-->
en la configuración de él.
-->
Ahora,
-->
este,
-->
no vamos a agregar
-->
ningún label ahí
-->
o coloque el label
-->
que se llama
-->
DG daños catálogo
-->
por favor.
-->
DG daños catálogo
-->
simplemente para la práctica
-->
de agregar un label.
-->
Listo.
-->
Ahí.
-->
Dale click
-->
por fuera de ese
-->
combo para que
-->
le tome la...
-->
Dale en safe
-->
porque el cambio
-->
le da safe.
-->
En pocas palabras,
-->
si yo intento
-->
buscar ahora
-->
todos los objetos
-->
que tengan el label
-->
DG daños catálogo
-->
me va a llevar
-->
a ese objeto.
-->
A esta configuración
-->
que creó Daniel
-->
y la que hemos creado
-->
todos actualmente.
-->
Ahora vete a la parte
-->
de responsibility,
-->
al menú del lado
-->
por favor.
-->
Responsibilities.
-->
Por defecto,
-->
hay
-->
un conjunto de roles
-->
que definen la herramienta
-->
pero esta parte de
-->
responsabilidades
-->
se crea
-->
para definir
-->
quién tiene acceso
-->
al objeto como tal.
-->
Esta responsabilidad
-->
lo vas a encontrar
-->
exactamente igual
-->
independiente del objeto
-->
que crees
-->
en la herramienta.
-->
Ahí vas a definir
-->
quiénes tienen permiso
-->
y qué tipo
-->
de permiso tienen.
-->
Normalmente,
-->
eso lo define
-->
el administrador
-->
del software.
-->
Quizás tú eres
-->
usuario final
-->
y te dan permiso
-->
para hacer algo.
-->
Pero esta parte
-->
de asignar permiso
-->
a otros usuarios
-->
es una tarea
-->
netamente
-->
del administrador.
-->
Más tarde les
-->
explico
-->
cómo sería
-->
entonces para
-->
darle permiso
-->
a otro usuario.
-->
Vete a la sección
-->
de versión.
-->
Versión.
-->
Le había comentado
-->
que una de las diferencias
-->
que tiene la licencia
-->
especialmente la estándar
-->
con la Avance
-->
es que la Avance
-->
le permite tener
-->
varias versiones.
-->
Ahora,
-->
lo interesante
-->
de la herramienta
-->
es que tú tienes
-->
versiones por objeto.
-->
Por ejemplo,
-->
yo puedo tener
-->
cinco versiones
-->
para objeto A
-->
y cuatro versiones
-->
para lo objeto C.
-->
O sea,
-->
las versiones son
-->
por objeto,
-->
no por proyecto,
-->
no por configuración.
-->
O sea,
-->
cada uno va a tener
-->
su propia versión.
-->
A excepción
-->
de los glosarios
-->
que nada más
-->
tiene una pequeña diferencia ahí.
-->
Pero note entonces
-->
que aparece
-->
una versión
-->
que esa versión
-->
corresponde
-->
con cuando
-->
se expande
-->
la configuración
-->
me coloca un número
-->
que está ahí.
-->
Ese número
-->
indica la versión.
-->
En esa versión
-->
va a registrar
-->
todos los elementos
-->
y cambios que hicieron
-->
en esa versión
-->
en particular.
-->
Listo.
-->
Dale click ahora
-->
en lock, por favor.
-->
Aparece
-->
la bitácora
-->
de cambios
-->
que todavía
-->
no se han hecho nada
-->
todavía,
-->
prácticamente lo que hicimos
-->
fue crear
-->
y vete por último
-->
al history
-->
y el history
-->
le va a servir
-->
por ejemplo
-->
a un auditor
-->
especificar
-->
qué hizo
-->
cada quien
-->
y a qué hora
-->
lo hizo
-->
específicamente
-->
en el software.
-->
Me da de cuenta
-->
que ahí
-->
Daniel dice
-->
Shunata
-->
Confiratributo
-->
bueno ahí
-->
tú puedes hacer
-->
una auditoría
-->
de qué está haciendo
-->
cada quien
-->
dentro del software.
-->
El caso particular
-->
pues lo
-->
acasamos a ver
-->
porque tenemos
-->
un perfil
-->
que es administrador
-->
que es prácticamente
-->
dueño de toda la herramienta
-->
como tal.
-->
Ahora
-->
si son tan amables
-->
denle click
-->
al
-->
nombre de la versión
-->
que sería
-->
cuando se expande
-->
el TDC
-->
te aparece
-->
como si fuese un hijo
-->
dale click
-->
acá abajo
-->
del lado izquierdo
-->
por favor
-->
en el nombre
-->
de la versión
-->
en el
-->
en el 2024
-->
1101
-->
dale click
-->
ahí por favor.
-->
Y ahora
-->
cada
-->
objeto va a tener
-->
su propia versión
-->
de esta parte
-->
tengo solamente
-->
una
-->
si es tan amable
-->
del lado derecho
-->
donde aparece
-->
el relojito
-->
le das click
-->
y si deseas
-->
un lapicito
-->
y pon ahí
-->
este
-->
desarrollo
-->
cambia el nombre
-->
y le colocas
-->
desarrollo.
-->
Creo que para mí
-->
es buena práctica
-->
dejarle
-->
esa fecha
-->
porque vas a ver
-->
exactamente
-->
que
-->
que feches
-->
hiciste
-->
los cambios
-->
como tal.
-->
Listo
-->
desarrollo
-->
2024
-->
dale click
-->
para ver
-->
dale click
-->
por fuera
-->
o enter
-->
ah y tiene un chulito
-->
por favor dale click
-->
ahí en el
-->
en el
-->
aquí te
-->
recomiendo
-->
es que
-->
definas
-->
un formato
-->
estándar
-->
de definir esas
-->
versiones
-->
por lo menos
-->
te recomendaría
-->
que dejar
-->
la fecha
-->
para saber
-->
cuando se
-->
creó
-->
el objeto
-->
o cuando se creó
-->
esa
-->
versión de
-->
ese objeto
-->
como tal.
-->
Perfecto
-->
listo
-->
hicimos
-->
la primera parte
-->
vamos
-->
con lo
-->
segundo
-->
partimos
-->
del hecho
-->
en que
-->
ya tú tienes
-->
un proyecto
-->
de catálogo
-->
de datos
-->
ok
-->
ahora vamos
-->
a definir
-->
nuestros
-->
objetos
-->
de este
-->
proyecto
-->
vamos a
-->
definir
-->
con objetos
-->
de tipo
-->
técnico
-->
modelos
-->
de tipo
-->
o sea
-->
metadatos
-->
de tipo
-->
técnico
-->
vamos a empezar
-->
por ahí
-->
para definir
-->
estos metadatos
-->
de tipo
-->
técnico
-->
entonces
-->
primero
-->
debe saber
-->
dónde están
-->
si no sabes
-->
dónde están
-->
pues no lo puedes
-->
definir
-->
entonces el perfil
-->
de esta persona
-->
el técnico
-->
metadatos
-->
técnicos
-->
yo creo que
-->
no tiene que tener
-->
unos conocimientos
-->
técnicos
-->
tan alto
-->
lo que sí es
-->
saber
-->
es que
-->
debe
-->
conocer
-->
dónde se
-->
encuentra
-->
el elemento
-->
al cual quiere hacer
-->
metadatos
-->
técnicos
-->
entonces vamos
-->
a lo siguiente
-->
para definir
-->
dos tipos
-->
de metadatos
-->
que son los
-->
técnicos
-->
y los
-->
operativos
-->
creamos
-->
un modelo
-->
nuevamente repito
-->
para los
-->
metadatos
-->
de tipo
-->
técnicos
-->
y operativos
-->
vamos a
-->
definir
-->
un modelo
-->
quiere decir
-->
que todos
-->
nos
-->
posicionamos entonces
-->
en la
-->
carpeta
-->
en la carpeta tuya
-->
listo
-->
te posiciono en la
-->
carpeta
-->
exactamente
-->
dale click ahí por
-->
favor
-->
vamos a darle
-->
new
-->
y vamos a
-->
escoger
-->
a ir a
-->
aparecer
-->
new
-->
model
-->
en ese
-->
new
-->
model
-->
preguntan
-->
inicialmente
-->
el nombre
-->
el nombre
-->
se llama
-->
vamos a
-->
colocar el siguiente
-->
nombre si es tan
-->
amable
-->
daniel y todos
-->
acme
-->
acme de
-->
empresa
-->
acme de
-->
los
-->
muñequitos
-->
de antes
-->
tenían una
-->
los
-->
los
-->
dibujos
-->
de antes
-->
tenían una
-->
empresa se
-->
llamaba
-->
acme
-->
acme
-->
espacio
-->
sporting
-->
sporting
-->
wear
-->
W-E-A-R
-->
soy
-->
malo
-->
para
-->
el
-->
ingles
-->
pero
-->
bueno
-->
perfecto
-->
no
-->
es
-->
wear
-->
de
-->
uso
-->
es
-->
de
-->
E-A-R
-->
W-E-A-E-A-R
-->
E-A-R
-->
creo que
-->
si
-->
listo
-->
expande
-->
por
-->
favor
-->
el combo
-->
de
-->
server
-->
si es tan
-->
amable
-->
dale click
-->
en el combo
-->
ese que dice
-->
import server
-->
dale click
-->
por favor
-->
ahí si es tan
-->
amable
-->
note que ahí solamente
-->
existen
-->
dos tipos
-->
de
-->
de servidores
-->
esto lo voy a
-->
explicar
-->
y muy
-->
pendiente
-->
a quien va a ser
-->
administrador de
-->
la herramienta
-->
entonces
-->
voy a
-->
esto lo voy a
-->
mostrar
-->
con esta
-->
gráfica de acá
-->
en primer lugar
-->
la arquitectura
-->
que tenemos actualmente
-->
es una
-->
arquitectura
-->
bueno
-->
en realidad el software
-->
del talent data cloud
-->
se está ofreciendo
-->
como SaaS
-->
entonces vamos a tener
-->
lo siguiente
-->
vas a tener
-->
por aquí
-->
el talent
-->
el TDC
-->
lo tienes por acá
-->
este TDC
-->
en realidad
-->
talent no tiene ninguna
-->
infraestructura
-->
talent lo que está
-->
utilizando en algún
-->
cloud tipo
-->
AWS cloud
-->
para poder ofrecer
-->
la infraestructura
-->
del talent data cloud
-->
significa que
-->
esto puede estar
-->
en AWS
-->
ese caso
-->
con AWS
-->
o se caso
-->
con Azure
-->
es decir
-->
que el talent
-->
que estamos
-->
actualmente
-->
está montado
-->
en alguno
-->
de estos
-->
cloud computing
-->
está lo mismo
-->
al final
-->
sobre cuál está
-->
para el ejemplo
-->
que voy a mostrar
-->
por acá estamos
-->
nosotros como
-->
client
-->
voy a colocar
-->
aquí un PC
-->
voy a colocar
-->
aquí PC
-->
este de aquí
-->
en el medio
-->
tenemos la nube de internet
-->
voy a colocar
-->
aquí un cloud de nube
-->
y este señor
-->
conecta aquí
-->
y conecta acá
-->
entonces estamos
-->
conectados con otras
-->
máquinas
-->
con la nube de internet
-->
y llegamos acá
-->
listo entonces
-->
primero vamos a ver
-->
entonces
-->
yo quiero conectarme
-->
a una base de datos
-->
para conectarme
-->
a una base de datos
-->
entonces hay que ver
-->
desde que punto
-->
me voy a conectar
-->
por defecto
-->
dice default server
-->
que era
-->
la imagen
-->
que tenía acá
-->
Daniel
-->
default server
-->
vamos a ver
-->
qué pasa con el default server
-->
si está configurado
-->
en default server
-->
significa que
-->
la conexión
-->
se hace
-->
desde acá del talent data cloud
-->
hacia la base de datos
-->
que tú tengas
-->
pocas palabras
-->
vamos a colocar
-->
aquí una base de datos
-->
de la nube
-->
que puede estar
-->
en AWS
-->
o el servicio
-->
que tú quieras
-->
va en Azure
-->
y ahora
-->
si yo digo
-->
default server
-->
significa que
-->
la conexión
-->
va de allá
-->
de aquí
-->
hacia acá
-->
o sea
-->
del talent data cloud
-->
hacia la base de datos
-->
que tú tengas
-->
¿qué problemas puede tener esto?
-->
un par
-->
primero
-->
si el talent data cloud
-->
está hecho
-->
sobre Java
-->
si el driver de conexión
-->
hacia esa base de datos
-->
no está
-->
en el talent data cloud
-->
no lo puedo subir
-->
o sea
-->
el software
-->
digamos la
-->
la empresa
-->
actualmente
-->
no me permite a mí
-->
subir datos
-->
allá directamente
-->
como archivos
-->
de conexión
-->
de drivers
-->
no lo permite hacer
-->
significa que
-->
prácticamente
-->
no me podría conectar
-->
esa base de datos
-->
si no tengo el driver
-->
y el segundo
-->
y principal
-->
aunque yo creo que el problema
-->
está ahí no
-->
porque la mayoría de drivers
-->
están montados
-->
allá arriba
-->
entonces
-->
imagínate que esta es tu empresa AXA
-->
esto está aquí está AXA
-->
digamos de esa forma
-->
y tienes acá
-->
tu servidor
-->
está aquí interno
-->
ok
-->
no está en adoración este interno
-->
si yo cojo default server
-->
significa ahora que
-->
va a intentar conectarse
-->
de aquí
-->
a acá
-->
el problema de conectarse
-->
de nube
-->
a tu
-->
a tu
-->
red privada
-->
es que
-->
yo creería que pues
-->
ningún
-->
ninguno de seguridad
-->
te va a permitir
-->
hacer eso
-->
porque no te va a abrir
-->
el puerto
-->
para que este señor se conecte
-->
si abre este puerto aquí
-->
sobre esa base de datos
-->
pues es un
-->
agujero de seguridad
-->
no creo
-->
que te lo haga
-->
que es lo que hace
-->
entonces el talent data cloud
-->
te ofrece
-->
en que tu
-->
técnicamente se llama
-->
instales un motor
-->
de harvenes
-->
te voy a colocar
-->
la palabra acá
-->
harvenes
-->
harvenes
-->
conté
-->
harvenes aquí
-->
harvenes
-->
si así
-->
que
-->
instales el motor
-->
un motorcito aquí
-->
en software
-->
pocas palabras
-->
lo instales
-->
aquí en tu red
-->
perdón
-->
lo instales aquí en tu red
-->
y ahora este motor
-->
harvenes se conecta
-->
a este motor
-->
tuyo
-->
y este harvenes se conecta
-->
al talent cloud
-->
entonces este harvenes
-->
se conecta
-->
a tu base de datos
-->
recupera los metadatos
-->
y los envía
-->
al TDC
-->
a través del
-->
motor ese de harvenes
-->
que llaman
-->
actualmente tienes dos
-->
tienes el que se llama
-->
default server
-->
que es el
-->
harvenes
-->
el motor de harvenes
-->
que está en TDC
-->
o sea que está en cloud
-->
y tienes el que se llama
-->
voy nuevamente acá
-->
el que se llama
-->
RFDCA
-->
que es el motor de harvenes
-->
que tienes
-->
instalado a nivel local
-->
en tu red
-->
en tu red de la empresa
-->
entonces
-->
si nos fuéramos
-->
a conectar
-->
a una fuente de datos
-->
y cuando hablamos
-->
fuente de datos
-->
no solamente lo vea
-->
desde el punto de vista
-->
base de datos
-->
sino un archivo
-->
CSV
-->
un archivo Excel
-->
si me quiero conectar
-->
a un archivo
-->
CSV
-->
que está dentro
-->
del campus
-->
de AXA
-->
debería usar
-->
RFDCA
-->
pero como yo no puedo
-->
acceder
-->
allá a su red
-->
y vamos a conectar
-->
a una base de datos
-->
que está en la nube
-->
entonces cogemos
-->
default server
-->
por favor
-->
si es el caso particular
-->
en que
-->
en que deseas configurar
-->
eso ya en su empresa
-->
por favor
-->
no dudes en escribirme
-->
yo te puedo asesorar
-->
un poco
-->
en esa parte
-->
en cómo se hace
-->
para configurar
-->
ese motor internamente
-->
listo
-->
ya decidí entonces
-->
el motor de conexión
-->
básicamente ese motor
-->
es el lugar
-->
donde está
-->
en esto estaríamos
-->
en el talent data cloud
-->
ahora ve
-->
al concepto de bridge
-->
expande ahí por favor
-->
expande ahí
-->
ese bridge
-->
y me voy
-->
a la diapositiva
-->
que tengo por acá
-->
que se las voy a entregar
-->
al final
-->
que es un bridge
-->
un bridge
-->
simplemente es un
-->
conector
-->
hacia una fuente de datos
-->
que puede ser
-->
una base de datos
-->
un data lake
-->
una carpeta compartida
-->
etc
-->
cualquier fuente de datos
-->
es un bridge
-->
entonces
-->
como me quiero conectar
-->
es a una base de datos
-->
que está en pogres
-->
porque he definido
-->
la base de datos en pogres
-->
por favor a lo siguiente
-->
en ese filtro
-->
que está ahí
-->
coloca la palabra
-->
postgres
-->
ahí lo tienes
-->
y escoges
-->
el segundo por favor
-->
si quieres
-->
voy a dar lo mismo
-->
primero o segundo
-->
el segundo
-->
le da dos
-->
seleccionalo
-->
listo
-->
hay veces que le das
-->
doble clic
-->
que se cierre la ventana
-->
en algunos casos
-->
o lo siguiente
-->
que estamos definiendo
-->
vamos a definir
-->
un modelo técnico
-->
como sé que es un modelo
-->
técnico
-->
porque me estoy conectando
-->
una base de datos
-->
si me estuviese conectando
-->
a una herramienta
-->
de un job
-->
pipeline
-->
workflow
-->
significaría
-->
que estoy
-->
creando un modelo
-->
de
-->
operativo
-->
un metáton operativo
-->
dale por favor
-->
ok si está amable
-->
note que el menú
-->
es muy parecido
-->
con algunos elementos
-->
pero le agrega
-->
algo adicional
-->
vamos con el overview
-->
por favor
-->
vamos con la descripción
-->
que es sumamente importante
-->
documentar todo
-->
en estos proyectos
-->
de catálogo de datos
-->
descripción
-->
coloca por favor ahí
-->
Daniel
-->
base de datos transaccional
-->
base de datos transaccional
-->
base
-->
de acme
-->
de acme
-->
así transaccional
-->
de acme
-->
colócalo
-->
en el mismo label
-->
que es
-->
dgdaños
-->
que era creo que
-->
en el label
-->
vete al label
-->
y le das
-->
dg
-->
escoges el que se llama
-->
creo que se llama ahora
-->
dg
-->
dgdaños
-->
datos
-->
el primero que aparece
-->
puede solicitud
-->
dale clic
-->
por fuera
-->
para que te
-->
salga
-->
salde de ahí
-->
clic por fuera
-->
del canvas
-->
para que salga
-->
de ese menú
-->
y esto es
-->
por favor
-->
para
-->
guardar
-->
bien
-->
note que hay una
-->
opción que hice
-->
propagar
-->
documentación
-->
mire lo siguiente
-->
cada objeto
-->
vamos a tener
-->
sus propias versiones
-->
yo tengo
-->
versión uno
-->
versión dos
-->
versión tres
-->
y versión cuatro
-->
suponte que
-->
la versión uno
-->
como el caso
-->
que estábamos en pantalla
-->
que Daniel lo hizo
-->
Daniel entonces
-->
agregó
-->
base de datos
-->
transaccional de acme
-->
en cierto
-->
versión uno
-->
pero en versión
-->
cuatro cambia
-->
la descripción
-->
por aquí le agrega
-->
un nuevo elemento
-->
le agrega
-->
más datos
-->
la detalla
-->
mucho más
-->
entonces
-->
si la opción
-->
propagar
-->
documentación
-->
está desactivada
-->
que es la puerta
-->
de efecto
-->
solamente el cambio
-->
que hace
-->
la nivel de
-->
documentación
-->
se mantiene
-->
en la versión
-->
en que está
-->
en este caso
-->
el ejemplo que colocó
-->
versión cuatro
-->
lo que coloque
-->
perdón
-->
versión cuatro
-->
si yo activo
-->
y chuleo
-->
ese propagar
-->
documentación
-->
entonces significa
-->
lo siguiente
-->
en versión cuatro
-->
hice un cambio
-->
en documentación
-->
significa que si está
-->
chuleado
-->
todos los cambios
-->
que hice en esa versión
-->
se va a ver
-->
reflejado en las
-->
versiones anteriores
-->
eso es lo que hace
-->
hay que tener
-->
mucho cuidado
-->
con respecto a eso
-->
porque quizás
-->
pierdes un poco
-->
de estas habilidades
-->
de todo lo que has hecho
-->
y los cambios
-->
que has realizado
-->
entonces
-->
eso es
-->
meramente si de pronto
-->
te equivocaste
-->
y quieres agregar
-->
algo de pronto
-->
en esa versión
-->
en la actual
-->
y la que está hacia atrás
-->
aclaro que eso es a nivel
-->
de documentación
-->
nada más
-->
vete por favor
-->
ahora a la sección
-->
que dice
-->
import setup
-->
si le están amable
-->
y vamos a configurar
-->
las credenciales
-->
de acceso
-->
hacia la base
-->
de datos
-->
entonces vamos
-->
a lo siguiente
-->
por favor
-->
vete al
-->
al programa de archivos
-->
de Windows
-->
si te vas a la carpeta
-->
descargas
-->
si le están amable a todos
-->
descargas
-->
entra en todo
-->
por favor
-->
la carpeta que se llama
-->
TDC
-->
y acceden
-->
a credenciales
-->
Postgres
-->
la carpeta
-->
a su carpeta
-->
credenciales
-->
Postgres
-->
y accede al archivo
-->
credenciales
-->
entonces vamos
-->
a definir esas credenciales
-->
de acceso
-->
espere un momento
-->
listo que hay algunos
-->
que
-->
que están abriendo los
-->
archivos
-->
entonces podemos
-->
esperar un momento
-->
perfecto
-->
algunos que todavía
-->
verónica está listo
-->
TDC
-->
por favor verónica
-->
si está amable
-->
credenciales
-->
Postgres
-->
y hay un archivito
-->
que está dentro
-->
por favor lo
-->
lo edita
-->
doble clic
-->
listo
-->
empecemos entonces
-->
vamos
-->
y tomamos
-->
del host
-->
toma la URL
-->
que tienes ahí
-->
que dice
-->
por favor tómate la URL
-->
y colocala
-->
y sobreescriba
-->
sobre localhost
-->
que es donde dice
-->
la sesión host
-->
está localhost
-->
sobreescribe ahí
-->
por favor
-->
enter
-->
le das enter al final
-->
vete ahora
-->
a la parte
-->
de base de datos
-->
vete un momento al archivo
-->
perdón
-->
y en
-->
debe
-->
tómate la base de datos
-->
que está al final
-->
debe
-->
copiate
-->
esa base
-->
copiate todo eso
-->
y lo colocas en
-->
debe
-->
database
-->
colocalo en database
-->
lo pegas ahí
-->
en la
-->
en el valor de database
-->
el usuario si quiere
-->
lo escribe
-->
para lo que está copiando
-->
es AXA
-->
con A mayúscula
-->
y el password
-->
¿qué tal?
-->
vea si tiene que ir
-->
a copiar
-->
perfecto
-->
ahora
-->
recordarás ya
-->
esto es más particular
-->
de tecnología
-->
que hay
-->
algunas bases de datos
-->
que maneja
-->
el concepto de esquemas
-->
tipo Oracle
-->
tipo
-->
Oracle
-->
Postgres
-->
puede ser
-->
manejar el concepto de esquemas
-->
que básicamente
-->
tiene un esquema
-->
es que me permite
-->
organizar
-->
internamente
-->
unos objetos
-->
es como si fuese una subcarpeta
-->
dentro
-->
de una base de datos
-->
entonces me permite
-->
organizar de manera
-->
mucho más
-->
sencilla
-->
algunos elementos
-->
tengo uno solo
-->
base de datos
-->
y tengo varios esquemas
-->
cada esquema
-->
tiene un conjunto
-->
de objetos
-->
en este caso
-->
Postgres maneja
-->
varios esquemas
-->
y por defecto
-->
el esquema es public
-->
pero en este caso
-->
hay un esquema
-->
que se llama
-->
ACME SportyWeb
-->
exactamente como
-->
la base de datos
-->
entonces
-->
golpe del nombre
-->
de la base de datos
-->
nuevamente
-->
ahí en esa misma interfaz
-->
y lo pegas
-->
en esquemas
-->
perfecto
-->
te pregunto ahora
-->
tablas y vistas
-->
ahí lo que puedes hacer
-->
es filtrar
-->
de pronto
-->
no quieres todas las tablas
-->
de la base de datos
-->
sino que tú deseas
-->
puedes filtrar
-->
tablas
-->
que inician
-->
que terminen
-->
vamos a
-->
vamos a traernos todo
-->
hay una opción
-->
que dice
-->
importar índices
-->
esos índices que importan
-->
son índices creados
-->
en el momento
-->
de los primary key
-->
y los foreign key
-->
y además
-->
índices que haya creado
-->
el ingeniero de datos
-->
o el diseñador
-->
de la base de datos
-->
cuando definió
-->
la base de datos
-->
dele true por favor
-->
esa signatura
-->
que está ahí
-->
es
-->
si me deseo
-->
traer los procedimientos
-->
almacenados
-->
que tenes en esa base de datos
-->
en este caso
-->
no hay ninguno
-->
por lo tanto
-->
haría lo mismo
-->
si lo dejo
-->
no lo dejo
-->
y ese misiláneos
-->
que está ahí
-->
es para mandarle
-->
algunas características
-->
de configuración
-->
a la conexión
-->
por ejemplo
-->
más memoria
-->
etcétera
-->
importante
-->
dale safe
-->
note que hay un asterisco
-->
ahí
-->
en el import
-->
hay un asterisco en negro
-->
diciéndole que hay un cambio
-->
que no ha sido guardado
-->
por favor
-->
dale safe
-->
para guardar
-->
perfecto
-->
cierra
-->
por favor
-->
bueno
-->
vamos bien listo
-->
vamos
-->
y ya configuramos la parte
-->
de
-->
configuración
-->
del import
-->
vamos al import option
-->
que está aquí al lado
-->
primero
-->
chulemos
-->
esa sesión
-->
que dice
-->
data sampling
-->
chuleala por favor
-->
y
-->
le explico lo siguiente
-->
ese data sampling
-->
va a
-->
especificar
-->
el número
-->
en caso que
-->
esté chuleada
-->
cuanto
-->
registros
-->
de
-->
muestras
-->
desea
-->
subir a la herramienta
-->
no te
-->
me vaya a
-->
confundir ahora
-->
recuerda que
-->
la herramienta
-->
lo que está
-->
buscando es
-->
metadatos
-->
pero recuerda que
-->
la herramienta
-->
también te
-->
permite ser
-->
calidad de datos
-->
entonces
-->
si tú quieres
-->
subir
-->
registros
-->
es porque quieres
-->
analizar
-->
la calidad de esos
-->
registros
-->
no tanto es porque
-->
esos registros
-->
tengan algo que ver
-->
en los metadatos
-->
no más que todo
-->
eso lo tú
-->
lo vas a hacer
-->
es para
-->
digamos
-->
tener unos
-->
registros
-->
que puedas visualizar
-->
y que puedas
-->
verificar si
-->
cumple con
-->
reglas de calidad
-->
los registros
-->
en ese caso
-->
está
-->
estipulado
-->
diez registros
-->
vayese por
-->
favor
-->
y vete a
-->
la parte de
-->
data profiling
-->
dale click ahí
-->
a nivel
-->
de calidad
-->
de datos
-->
existen
-->
dos
-->
procesos
-->
un proceso que
-->
es para
-->
detectar
-->
la anomalía
-->
y un proceso
-->
que se llama
-->
limpieza
-->
o curación
-->
llámalo
-->
como tú quieras
-->
en este caso
-->
al activar
-->
data profiling
-->
estoy
-->
diciendo mira
-->
al tener
-->
mil
-->
mira vas a tomar
-->
y le vas a hacer
-->
vas a tomar
-->
mil
-->
una muestra
-->
de mil registros
-->
y de esa
-->
muestra de mil
-->
registros
-->
vas a hacer
-->
profiling
-->
profiling por ejemplo
-->
que puede ser
-->
que me cuente
-->
cuántos números hay
-->
que me cuente
-->
cuántos duplicados tiene
-->
que me cuente
-->
cuántos números
-->
únicos hay
-->
que me de el patrón
-->
de esos elementos
-->
eso es para
-->
detectar
-->
anomalía
-->
la herramienta
-->
no te hace
-->
clicking
-->
o sea
-->
no te hace
-->
limpieza
-->
solamente para
-->
detectar
-->
ojo
-->
esos mil
-->
que toma ahí
-->
es diferente
-->
a los diez
-->
del sampling
-->
el sampling
-->
lo que quiere es que
-->
yo los voy a ver
-->
los diez registros
-->
y estos mil
-->
es que va a tomar
-->
mil
-->
y los va entonces
-->
a hacer profiling
-->
cuente el número
-->
de nulos
-->
de distintos
-->
únicos
-->
etcétera
-->
si colocas
-->
cero
-->
ahí te dice
-->
que no te lo recomienda
-->
significa que va a hacer
-->
data profiling
-->
a todos los
-->
registros de la tabla
-->
entonces
-->
si la tabla es muy
-->
grande
-->
te puede demorar
-->
mucho tiempo
-->
y por eso que no te lo
-->
recomienda
-->
si la tabla es pequeña
-->
pues tú puedes colocar
-->
cero
-->
vamos a ver entonces
-->
el siguiente
-->
dale
-->
chulealo por favor
-->
ese profiling
-->
solo que estos
-->
que no han sido profilados
-->
tiene sentido
-->
cuando tú tienes
-->
varias versiones
-->
me explico
-->
en la primera
-->
versión
-->
el tomo mil
-->
registros para
-->
profiling
-->
si eso está chuleado
-->
en la segunda
-->
versión que yo tenga
-->
esos mil registros
-->
no son los mismos
-->
va a tomar
-->
otros mil registros
-->
por eso que es
-->
mejor opción
-->
porque
-->
vas a tener
-->
digamos como tienes
-->
varias versiones
-->
vas a tener
-->
una muestra
-->
mucho más grande
-->
de registros
-->
esa parte
-->
de high data
-->
si lo dejan así
-->
lo que pasa
-->
es que
-->
me toca
-->
explicar el concepto
-->
que va de
-->
sensibilidad
-->
nosotros lo dejamos quieto
-->
vamos a donde dice
-->
data classification
-->
por favor
-->
está chuleada
-->
por defecto
-->
verdad
-->
ahora
-->
que va a hacer
-->
la herramienta
-->
la herramienta
-->
va a intentar
-->
clasificar
-->
los datos
-->
como los
-->
clasifica
-->
a partir
-->
del contenido
-->
en algunos casos
-->
y en otros a partir
-->
del nombre
-->
del
-->
de la columna
-->
José para no
-->
perdón
-->
José
-->
Daniel
-->
que me ayudaba
-->
en otro curso
-->
entonces
-->
Daniel
-->
si estás mal
-->
le das safe
-->
para no perder
-->
démosle
-->
todo safe
-->
para no perder
-->
la configuración
-->
esa
-->
y vete
-->
vayamos todos
-->
al menú
-->
manage
-->
expande
-->
por favor
-->
si está mal
-->
Daniel
-->
y hay una opción
-->
que dice
-->
data classes
-->
que está
-->
en el menú
-->
customization
-->
y si estuvo
-->
presente
-->
en el curso
-->
de talent data
-->
staywars
-->
recuerde que
-->
yo lo he dicho
-->
mira
-->
es un dato semántico
-->
presta atención
-->
que es
-->
prácticamente
-->
lo mismo
-->
que el talent data catalog
-->
esos
-->
nombres
-->
que están ahí
-->
son
-->
exactamente
-->
los mismos
-->
que tienes
-->
allá
-->
en el
-->
talent data
-->
staywars
-->
y allá
-->
los llamó
-->
datos semánticos
-->
ve aquí está
-->
aeropuerto
-->
animal
-->
ahí vas a encontrar
-->
email
-->
listo
-->
permítame
-->
si recordarás
-->
los
-->
en el caso
-->
del talent data staywars
-->
tú tenías
-->
datos semánticos
-->
y esos datos
-->
semánticos
-->
eran de dos tipos
-->
o el dato
-->
semántico
-->
era un diccionario
-->
diccionario
-->
o era
-->
una expresión regular
-->
había un tercero
-->
que era un compuesto
-->
pero prácticamente
-->
estaba compuesto
-->
de diccionarios
-->
o expresiones regulares
-->
acá
-->
esos elementos
-->
que están viendo ahí
-->
no los llama
-->
el dato semántico
-->
sino
-->
como le cambia
-->
el nombre a la herramienta
-->
tiene que
-->
cambiarle
-->
a nivel de comercio
-->
de mercadeo
-->
el nombre al dato
-->
entonces lo llama acá
-->
data class
-->
o clase de datos
-->
data class
-->
lo llama acá
-->
con una pequeña
-->
ligera diferencia
-->
que acá
-->
los diccionarios
-->
se llaman
-->
enumeraciones
-->
y tiene
-->
también
-->
expresiones
-->
regulares
-->
pero es
-->
exactamente
-->
lo mismo que tienes allá
-->
entonces mira
-->
cómo va a ser
-->
ya la herramienta
-->
tiene definidos
-->
unos data classes
-->
pero tú puedes crear
-->
también tus propios
-->
data classes
-->
cómo funcionan
-->
los data classes
-->
imagínate que tú tienes
-->
la tabla clientes
-->
y entonces
-->
en clientes
-->
tiene identificación
-->
tienes
-->
nombres
-->
y tienes apellidos
-->
identificación tienes
-->
aquí uno
-->
tienes el nombre
-->
por ejemplo
-->
Arturo
-->
que está aquí
-->
voy a dejar
-->
estos nombres aquí
-->
dos
-->
tenemos
-->
Denise
-->
Denise
-->
que se escribí
-->
con 2s
-->
y tengo acá
-->
Verónica
-->
listo
-->
con el data profiling
-->
que tú tienes
-->
o sea
-->
recuerda que
-->
el data profiling
-->
colocamos 10
-->
ese data profiling
-->
visualizo los
-->
diferentes elementos
-->
y ahora
-->
voy a intentar
-->
hacer lo siguiente
-->
voy a intentar
-->
listo
-->
tengo unas
-->
clases
-->
y voy a ver
-->
a qué
-->
pertenecen esas clases
-->
me explico
-->
de esta manera
-->
aquí a diferencia
-->
del señor
-->
Data Stewardy
-->
hay una
-->
hay una
-->
clase que se llama
-->
FirstNet
-->
este que es un diccionario
-->
que tiene
-->
muchos nombres
-->
aquí puede tener
-->
John
-->
puede tener
-->
por ejemplo
-->
el mismo Arturo
-->
aquí
-->
puede tener
-->
a
-->
Daniel
-->
acá
-->
y puede tener
-->
acá
-->
a Verónica
-->
entonces
-->
él intenta
-->
contar
-->
cuántos
-->
elementos
-->
de tu data set
-->
están
-->
incluidos
-->
en este
-->
diccionario de acá
-->
que él lo llama
-->
en numeración
-->
pero es un diccionario al final
-->
una lista
-->
si entonces
-->
por defecto
-->
tiene la
-->
la tarea
-->
que si está por encima
-->
del 60%
-->
él lo clasifica
-->
a ese tipo
-->
por ejemplo
-->
aquí tengo
-->
Arturo
-->
y listo
-->
lo tengo acá
-->
tengo prácticamente
-->
el 66%
-->
de los nombres
-->
de aquí
-->
lo tengo acá
-->
entonces
-->
¿qué hace él?
-->
como la regla
-->
por defecto está
-->
si está por encima del 60
-->
clasifica a ese tipo
-->
significa que este nombre
-->
lo clasificaría
-->
como FirstNet
-->
pero fácilmente
-->
también
-->
se pudo ver
-->
los clasificados
-->
también de dos tipos
-->
a donde quiero llegar
-->
que la misma forma
-->
de clasificación
-->
puede llevar
-->
a error
-->
a la herramienta
-->
por la forma
-->
en que trabaja
-->
y también
-->
tiene la otra parte
-->
que si tiene
-->
una expresión regular
-->
la que tú quieras
-->
por ejemplo
-->
no sé
-->
D3 aquí por ejemplo
-->
y hay algún
-->
elemento que
-->
coincida
-->
en este caso
-->
por defecto
-->
está 60%
-->
60% de los elementos
-->
de una columna
-->
coinciden
-->
con la expresión
-->
de esa forma
-->
es que funciona
-->
la clasificación de datos
-->
si eres tan amable
-->
dale click
-->
en animal un momento
-->
Daniel
-->
dale click en animal
-->
si eres tan amable
-->
animal
-->
ahí está
-->
es que vena
-->
hay varias
-->
te dice
-->
o dale
-->
dale a segunda columna
-->
dale click
-->
ahora está
-->
ahí está
-->
mira que
-->
acá dice
-->
acá dice
-->
enumeración
-->
patrón
-->
y regular expresión
-->
la mismo
-->
cuenta que tengo
-->
allá esto
-->
es una linda
-->
exactamente
-->
igual
-->
e filtra
-->
por favor
-->
ahí y
-->
coloca
-->
e-mail
-->
allá en el filtro
-->
para buscar uno
-->
que se llama
-->
e-mail
-->
filtra
-->
e-mail
-->
dale click
-->
en e-mail
-->
ahí por favor
-->
en el primero
-->
listo
-->
mira que
-->
acá lo que tiene
-->
es una expresión
-->
regular
-->
pero es
-->
prácticamente
-->
la misma idea
-->
que viene
-->
allá
-->
y tiene
-->
la misma idea
-->
que tiene
-->
es la
-->
misma
-->
exactamente
-->
la misma idea
-->
lo único
-->
que ahora
-->
cada columna
-->
que tenga
-->
va a intentar
-->
clasificarla
-->
dentro del número
-->
que tiene
-->
listo
-->
entonces
-->
vete nuevamente
-->
al
-->
repositorio
-->
si ya estás
-->
amable
-->
al repositorio
-->
acto
-->
seguido
-->
por favor
-->
vete nuevamente
-->
a la
-->
configuración
-->
del modelo
-->
acme
-->
dale click
-->
ahí en el
-->
estábamos
-->
en import
-->
options
-->
por favor
-->
entonces
-->
si yo chuleo
-->
esa data
-->
clasificación
-->
él va a intentar
-->
clasificar los
-->
datos
-->
según las clases
-->
que están
-->
en ese data class
-->
y basado
-->
en el porcentaje
-->
de aciertos
-->
que tengan
-->
pues
-->
o ya sea
-->
la presión
-->
regular
-->
o el diccionario
-->
que acá lo llama
-->
la herramienta
-->
enumeración
-->
bueno
-->
sigamos entonces
-->
vamos
-->
a la otra parte
-->
que es
-->
gestión de la
-->
versión
-->
note que
-->
por defecto
-->
tiene
-->
sec new
-->
version
-->
como default
-->
significa
-->
lo siguiente
-->
deschulea
-->
el siguiente
-->
para que podamos
-->
entender
-->
porque pronto el
-->
deschulea
-->
el siguiente
-->
quise crear
-->
nuevo
-->
el siguiente
-->
quise crear
-->
nuevo por favor
-->
si lo tengo de
-->
esta forma
-->
indica lo siguiente
-->
que cada vez que yo hago
-->
un import
-->
hacia esa base
-->
de datos
-->
desde esa base
-->
de datos
-->
significa que va a
-->
crear una nueva
-->
versión
-->
cada vez que yo hago
-->
un import
-->
se crea una nueva
-->
versión
-->
dale ahora click
-->
en el create
-->
por favor
-->
y en este
-->
caso
-->
solamente
-->
se va a crear
-->
una versión
-->
y solo
-->
sí
-->
la versión
-->
el import
-->
nuevo tiene
-->
algún cambio
-->
me
-->
explico
-->
de esta manera
-->
el cambio
-->
puede ser
-->
porque
-->
agregué
-->
una nueva
-->
columna
-->
en este
-->
caso
-->
una tabla
-->
o le
-->
cambié
-->
el nombre
-->
a la
-->
columna
-->
en esos
-->
dos
-->
casos
-->
que hay
-->
un cambio
-->
entonces
-->
si tengo
-->
si tengo
-->
chuliado
-->
la opción
-->
create new
-->
solamente
-->
se va a
-->
crear
-->
si existe
-->
un cambio
-->
en el modelo
-->
original
-->
si no
-->
no se crea
-->
y la
-->
última
-->
opción es
-->
sumamente
-->
interesante
-->
te lo
-->
aconsejaría
-->
que le
-->
hicieras
-->
dale la
-->
opción
-->
que es
-->
copy
-->
vamos a
-->
hacer
-->
un ejemplo
-->
de esa
-->
parte
-->
es que
-->
recordarás
-->
por una cuestión
-->
netamente
-->
de documentación
-->
el
-->
diseñador
-->
de la base
-->
de datos
-->
pudo agregar
-->
comentarios a las
-->
columnas
-->
comentarios a las
-->
tablas
-->
entonces
-->
cuando yo digo
-->
ese
-->
copy
-->
model
-->
description
-->
lo que voy
-->
a hacer
-->
es que
-->
esos
-->
comentarios que
-->
diseñador
-->
no no
-->
ahí
-->
hicimos todo
-->
esa
-->
vete a la
-->
sesión que
-->
dice
-->
naming
-->
estándar
-->
eso
-->
voy a
-->
hacer un
-->
ejemplo
-->
mucho más
-->
vete donde
-->
dice
-->
responsibilities
-->
ya
-->
entendemos
-->
entonces que
-->
este menú
-->
va a ser
-->
común en
-->
debería
-->
estar
-->
vacía
-->
darle
-->
clic en
-->
versión
-->
debería
-->
estar
-->
vacía
-->
efectivamente
-->
porque
-->
porque
-->
la
-->
versión
-->
solamente
-->
se crea
-->
cuando
-->
yo hago
-->
primer
-->
import
-->
como
-->
no
-->
he hecho
-->
import
-->
entonces
-->
la
-->
versión
-->
ya está
-->
creada
-->
vete donde
-->
dice
-->
log
-->
por
-->
listo
-->
ahora
-->
vete
-->
no tengo
-->
ningún log
-->
y vete a
-->
history
-->
que me da
-->
la
-->
descripción
-->
de todo lo que
-->
he hecho
-->
con ese
-->
objeto como
-->
tal
-->
entonces
-->
el menú
-->
overview
-->
responsibility
-->
version
-->
log
-->
history
-->
es
-->
exactamente
-->
igual cuando
-->
lo veas
-->
en cualquier
-->
objeto de
-->
la
-->
herramienta
-->
vete
-->
nuevamente
-->
al
-->
overview
-->
dale
-->
clic en
-->
overview
-->
listo
-->
ahora
-->
el
-->
proceso
-->
de
-->
tomar
-->
los
-->
data
-->
los
-->
metadata
-->
que
-->
está
-->
en un
-->
modelo
-->
se
-->
llama
-->
proceso de
-->
jarvenes
-->
jarvenes
-->
como lo
-->
copiado hace
-->
poquito
-->
jarvenes
-->
ese
-->
jarvenes
-->
es el
-->
proceso en el
-->
cual
-->
se van a
-->
cosechar según
-->
la herramienta
-->
se cosechan
-->
los
-->
metadata
-->
con los
-->
cuales
-->
tu vas
-->
a trabajar
-->
al final
-->
un
-->
jarvenes
-->
es un
-->
import
-->
pero
-->
la
-->
herramienta
-->
le dice
-->
que se
-->
llama
-->
jarvenes
-->
dale
-->
clic por
-->
favor
-->
en import
-->
ahora sí
-->
todos
-->
el import
-->
está
-->
en la
-->
parte superior
-->
exactamente
-->
dale
-->
clic en
-->
ese
-->
import
-->
y
-->
entonces
-->
aquí
-->
me
-->
pide
-->
varias
-->
configuraciones
-->
de
-->
el
-->
elemento
-->
de
-->
el
-->
import
-->
te
-->
recomendaría
-->
lo
-->
siguiente
-->
primero
-->
te
-->
aparece
-->
si
-->
la
-->
fuente
-->
deseas hacer
-->
un
-->
import
-->
incremental
-->
un
-->
un
-->
full
-->
import
-->
yo
-->
te
-->
recomendaría
-->
un
-->
full
-->
import
-->
que
-->
diferencia
-->
hay
-->
la diferencia
-->
es la siguiente
-->
suponte que
-->
en tu
-->
primera
-->
versión
-->
tienes
-->
identificación
-->
nombre
-->
y
-->
apellido
-->
en la
-->
segunda
-->
versión
-->
tienes
-->
la
-->
tabla
-->
cambiada
-->
con
-->
las
-->
columnas
-->
identificación
-->
nombre
-->
y
-->
apellido
-->
es
-->
primera
-->
versión
-->
pero
-->
la
-->
columna
-->
por
-->
ejemplo
-->
teléfono
-->
cuando
-->
hablamos
-->
de
-->
incremental
-->
es
-->
que
-->
lo
-->
que
-->
se
-->
va
-->
guardar
-->
en el
-->
nueva
-->
versión
-->
solamente
-->
el
-->
incremento
-->
prácticamente
-->
el nombre
-->
la
-->
nueva
-->
columna
-->
o
-->
el nombre
-->
la
-->
columna
-->
que
-->
cambió
-->
entonces
-->
para mí
-->
me
-->
parece
-->
que
-->
es
-->
mucho
-->
mejor
-->
que
-->
tenga
-->
todo
-->
lo
-->
todo
-->
digamos
-->
toda
-->
la
-->
información
-->
y que
-->
después
-->
compara
-->
la diferencia
-->
y
-->
aclaro
-->
que es lo
-->
que
-->
va a guardar
-->
simplemente
-->
un nombre
-->
de
-->
columna
-->
eso no te
-->
va a
-->
llevar
-->
a tener una
-->
gran cantidad
-->
de
-->
almacenamiento
-->
entonces
-->
yo te
-->
recomendaría
-->
que
-->
hicieras
-->
yes
-->
en la
-->
primera
-->
pregunta
-->
ahí dice
-->
full
-->
source
-->
escoge
-->
yes por
-->
favor
-->
import
-->
ee
-->
quien
-->
quien
-->
me
-->
habló
-->
ah ya la vi
-->
el import
-->
ya voy
-->
un momento
-->
la
-->
parte
-->
superior
-->
derecha
-->
tiene un
-->
botón allá
-->
que dice
-->
import
-->
si lo caso
-->
a ver
-->
superior
-->
derecha
-->
un poquito más
-->
abajo
-->
ese
-->
dele click ahí por
-->
favor si están
-->
amables
-->
si ok
-->
dele click ahí
-->
por favor
-->
en la
-->
primera
-->
opción
-->
dele por
-->
favor yes
-->
para que
-->
guarde todo
-->
el modelo
-->
preguntas
-->
si hay
-->
algún
-->
inconveniente
-->
en el momento
-->
el import
-->
y si desea
-->
guardar
-->
los locks
-->
o sea
-->
los problemas
-->
aceptaron
-->
dale click ahí
-->
en yes
-->
claro que sí
-->
en la
-->
segunda opción
-->
dele yes
-->
para que
-->
cualquier
-->
detalle
-->
de problema
-->
que tuve
-->
pues lo
-->
importen
-->
daniel
-->
dale yes
-->
tú por
-->
favor si
-->
está
-->
amable
-->
listo
-->
los
-->
demás
-->
me activa
-->
yes yes
-->
no hay
-->
problema
-->
me
-->
incluir detalles
-->
de la
-->
entrada
-->
claro que sí
-->
salvar el
-->
modelo
-->
importado
-->
en la
-->
base de
-->
datos
-->
o esa
-->
base de
-->
datos
-->
de
-->
la
-->
herramienta
-->
por
-->
defecto
-->
usa el
-->
motor
-->
postgres
-->
la
-->
herramienta
-->
usa
-->
postgres
-->
y si
-->
vas a
-->
notificar
-->
esta parte
-->
la parte
-->
superior
-->
de la parte
-->
derecha
-->
ya
-->
superior
-->
y una engranaje
-->
que está dando vuelta
-->
dale click en
-->
engranaje
-->
por favor
-->
si está
-->
amable
-->
y ahí
-->
de
-->
si
-->
ha click en
-->
engranaje
-->
te va
-->
a mostrar
-->
que parte esta
-->
haciendo
-->
bueno
-->
vamos a tomarnos
-->
cinco minutos
-->
porque demora
-->
a veces demora un
-->
Bien, ya parece que terminó el proceso de hardness, o prácticamente, a nivel práctico,
-->
bueno, ahora sí, qué pena, ah, listo. Terminó de manera exitosa el proceso de hardness, entonces,
-->
por favor, como terminó, sí, para ver si está mal, muéstrame su, ¿Quién me habló?
-->
Ah, ok, listo, listo, perfecto, por favor comparte su pantalla si está mal. Muéstrame
-->
por favor si está mal el Import Auction, váyase del, sí, sí, ya la veo, entonces, si está mal,
-->
váyase del lado derecho, está Overview, Import Setup, Import Auction, váyase a Import Auctions,
-->
dale click en Import Auction, sí, ahí está Overview, cerquita de Overview, está Import Setup
-->
y el que viene, el que viene, Import Auctions, el que viene, ese que está ahí, por favor,
-->
no, pero sí, lo hizo, lo detectó bien, ah, pero Metadata, ah, ya entiendo, no apareció
-->
la clasificación, ¿Por qué? Si quiere, dele nuevamente Import, un momento, a ver, dele click
-->
en Import, aquí aclaremos, no crearía una nueva versión porque por defecto, yes, yes,
-->
porque por defecto el modelo no ha cambiado, entonces cualquier cambio que haga quedaría
-->
en la misma versión, si noté, es como si pareciese que, yo pensé inicialmente que esa
-->
parte de data clasificación la tenía desconfigurada, es decir, que lo tenía, no había chuliado
-->
la opción, vamos a esperar un momento a ver si le sale, listo, ahí no vuelve a
-->
colocarnos, seguramente, veamos si, yo creo que le quedó exactamente igual a todos,
-->
si hay una pequeña diferencia, me aviso yo y volvemos nuevamente y hacemos el proceso,
-->
¿Quién me habló? Denys, damos un momento a ver qué pasó, si, noche para verlo,
-->
dele, ah, claro, claro, claro, si, si, si, hagamos lo siguiente, dele click por favor
-->
en el cuadro que dice import model version, ahí no tiene log, le da click y va a mostrar
-->
el mensaje, ahí en todo el, no, el otro import donde dice, donde tiene el símbolo
-->
de exclamación del error, dele click ahí, ahí exactamente, dele click ahí, bueno,
-->
al parecer creo que hubo un error en el momento, vamos a tratar de darle import nuevamente
-->
a ver, dele close, intente nuevamente darle import a ver qué pasa, en, no, sí, sí,
-->
exactamente, en ese import que tiene ahí exactamente, si quiere oculte ahí eso,
-->
le da hide y le da nuevamente import como usted quiera, y esa todo prácticamente
-->
y le dele import, agarramos un momento a ver, no, entonces hago lo siguiente,
-->
váyase al import setup que lo tiene del lado izquierdo, ah, al lado de overview
-->
dele import setup, dele click ahí por favor, ahí está el problema, el problema es que
-->
la url del host está mal, váyase nuevamente al archivo, el texteo tiene el archivo,
-->
el notepad, tome la url que tiene ahí, exactamente, no se copió, sí,
-->
exactamente, tenia eso en el portavapel, tenia eso, minimiza, pégale un notepad
-->
cerca del import que hice test, dele test para probar la conexión, abajito el,
-->
del import ha quedado un cancel y abajo del cancel está un test, dele test ahí,
-->
ok, ah, sí, sí, close, dele en close, y ahora sí,
-->
tiene que darle import para ver, dele guardar antes, tiene que salvar antes,
-->
sí, sí, hay import, sí, sí, exactamente ahí,
-->
sí, parece que sí, vamos a esperar para ver si termina de forma exitosa,
-->
sí, ahora sí, cargó, list, perfecto, entonces, si va del lado izquierdo al
-->
repositorio y expande el modelo que creamos que se llama Acme, ahora sí,
-->
pero diga el modelo, en este caso el modelo es Acme Sporting Web, está del lado
-->
izquierdo en el repositorio y te apareció ahí un más para que expandas
-->
ahí, ahí no está, sí, exactamente, ahí en el más que está al principio y
-->
ahí te está mostrando un elemento, cada vez que yo expanda un objeto en
-->
talent data catalog, el número de hijos que tengo corresponde al número de
-->
versiones, en este caso nada más tengo una versión de ese objeto que
-->
está ahí, en este caso una conexión hacia baseados,
-->
haz lo siguiente, vete entonces a la, cuando diga, cuando diga la versión
-->
tienes que irte hacia lo que te dice, vamos a la versión, a la primera
-->
versión, dale click ahí, en esa primera versión dale click,
-->
vete a la sesión de model, en el lado derecho te aparece un submenu y el
-->
segundo elemento del item es model y expande por favor cada elemento de
-->
esos, si quieres expande, ahí te está diciendo la base de datos y está
-->
diciendo las tablas que pertenecen a esa base de datos, confirma que
-->
todos estamos conectados a la misma base de datos, por lo tanto el modelo
-->
tiene que estar exactamente igual.
-->
Sí, oculta, oculta eso más bien, sí, dale ahí, por favor.
-->
Ahora, todos hagamos lo siguiente, vete ahora al nombre, en realidad que es
-->
el nombre del esquema, que se llama Acme Sporting Web, dale click ahí,
-->
todos, démosle click a Acme Sporting Web, clic derecho y le das open.
-->
Open, y te aparece entonces este menú, desglucemos un poco este menú entonces.
-->
El primero me da un overview, recuerde que el overview, ese sí es común para
-->
todos, va a estar en todos, me va a dar un resumen, el resumen que me está
-->
mostrando, el esquema que abrí, son la cantidad de tablas que tiene, en
-->
este caso tiene cinco tablas. Listo, en el mismo menú, si te das cuenta,
-->
hay un elemento que dice R Diagrama Entidad Relación, ya lo viste al
-->
lado de overview, dale click por ahí.
-->
La herramienta te va a permitir crear diagramas relacionales, identidad
-->
relación, te preguntarás para qué. Lo que pasa es que la idea de esto que
-->
está aquí es pensando en que tú tengas, por ejemplo, algunos elementos en un
-->
Data Lake y que tengas alguna base de datos y quieres enlazar algunas
-->
tablas con archivos que están en el Data Lake, para hacer, digamos, un
-->
documento, entonces esa es la principal elemento que se tiene para por qué
-->
crear o por qué se tiene este entidad, diagrama entidad relación. Vamos a
-->
crear uno pequeño ahí, ahí donde está, dice un botón que dice Create,
-->
llámalo entonces, ACME Diagrama.
-->
Ok, dale click, ahí te aparece una tablita con cuatro, inicialmente con
-->
cuatro columnas. En la columna Name, dale click en el nombre que dice ACME
-->
Diagrama, que fue el que creamos, ACME Diagrama.
-->
Y en la parte superior derecha tienes un botón que dice Start
-->
Editing, tienes que darle click ahí en Start Editing, superior derecha.
-->
Ese que está ahí, dale Start Editing.
-->
Y en este caso te va a mostrar, para este caso en particular, todas las
-->
tablas de la conexión que tienes. Para llevar una conexión, si tú quieres
-->
llévate, coge las cuatro tablas que tienes, selecciona las cuatro
-->
tablas y las llevas al canvas, que sería el centro. Selecciona las
-->
cuatro o llévalas una por una.
-->
Dennis tiene que darle click allá arriba en Start Editing, parte superior
-->
derecha, la derecha, y hay un botoncito que dice Start Editing.
-->
Debajito de la mano que tiene allá, o debajito del menor hamburguesa,
-->
el menor hamburguesa los tres puntos. Debajito de los tres puntos,
-->
el lado derecho, está un botoncito que dice Start Editing, lado derecho.
-->
Está ahí, ahí te va a ir, está ese que está ahí, perfecto.
-->
Dale click ahí.
-->
Si desea, por favor, lleva las cuatro tablas al centro.
-->
Y él va a mostrar, bueno, si las tablas están referenciadas, pues
-->
mostraría la referencia de las cuatro tablas.
-->
Puedo unir ahí, puedo agregar más columnas, bueno, ahí puedo hacer
-->
muchas cosas con ese elemento que está ahí.
-->
Listo, perfecto. En este caso, pues no nos vamos a complicar la vida de
-->
crear modelos simplemente para que sepa eso que está ahí.
-->
Y ahora, dele Save, por favor, para guardar.
-->
Salte de ahí, devuélvete a donde estabas anteriormente,
-->
dale atrás en el browser para que te devuelvan al menú anterior,
-->
atrás en el browser.
-->
Ya vimos el menú que dice Diagrama Entealación.
-->
Dale click en Tables, por favor.
-->
Tables, ahí aparece cinco, indicando el número de tablas.
-->
El siguiente menú.
-->
Puedo acceder a cualquiera de esas tablas directamente desde ahí
-->
y ver la configuración que tienen.
-->
Ve al siguiente menú que dice Proceso Relacionados.
-->
El acto, ese que está ahí.
-->
Eso que me va a mostrar ahí es si esa base de datos
-->
tiene procedimientos almacenados.
-->
Porque recordará, cuando hicimos el Import Setac,
-->
me preguntaba si deseaba importar los procedimientos almacenados.
-->
En este caso, no tiene.
-->
Váyase al Dataflow, que te quise un poquito más importante,
-->
Dataflow, al menú que sigue, Dataflow.
-->
Ese Dataflow lo que me va a permitir mostrar es
-->
si existe una relación de alguna tabla de la base de datos
-->
con algún job, es decir, con un metadato de operativo.
-->
En este caso, no lo hay.
-->
Aparecen nada más los nombres de las tablas que tengo,
-->
pero no existe ningún job,
-->
pipeline o workflow que me permita definir un flujo de datos
-->
con esas tablas que están ahí.
-->
Vete al siguiente que viene, Semantic Flow.
-->
Este Semantic Flow lo que tiene es que me va a permitir
-->
mostrar si el modelo, el metadato técnico
-->
está relacionado con un metadato de negocio.
-->
En pocas palabras, si tengo relación de alguna tabla
-->
con algún glossario que haya definido.
-->
En este caso todavía está vacío,
-->
y vamos a hacer eso más adelante.
-->
Sigue por favor donde dice Comment.
-->
Dale click en Comment.
-->
Ahí por favor podemos adicionar cualquier comentario.
-->
Dice entonces, adicione el siguiente comentario por favor.
-->
Actualmente, actualmente
-->
los metadatos técnicos
-->
no tienen asociados metadatos operativos
-->
y metadatos de negocio.
-->
Dale Enviar.
-->
Submit para que te quede ahí.
-->
Submit.
-->
La idea cuál sería esto?
-->
Es que tú puedas comunicarte internamente
-->
partiendo del hecho que tú puedas compartir estos modelos.
-->
Entonces, cualquier persona puede leer tu comentario,
-->
quién lo hice, y ahí puedes hacer entonces,
-->
digamos que un conjunto de incidencias de qué estás haciendo,
-->
qué te falta por hacer,
-->
es una forma de comunicarte con la persona que estás compartiendo
-->
el objeto como tal.
-->
Vete por favor donde dice Attachment.
-->
Este Attachment lo que va a permitir es que
-->
seguramente quizás si estás bien organizado
-->
a nivel de los, digamos, de tus bases de datos,
-->
quizá tengas algún documento que sea algún manual
-->
entonces puedes subir un manual que dé información más detallada
-->
quizás de la base de datos que estás hablando.
-->
En este caso no vamos a hacer el ejemplo,
-->
pero para eso funciona el Attachment.
-->
Y listo.
-->
Hay Responsabilites y History, ya lo vimos.
-->
Responsabilites sería aquí le di permiso.
-->
History, pues todo lo que he hecho con ese objeto como tal.
-->
Vete nuevamente al menú Overview si quieres grabarle.
-->
Y dale click ahora en la tabla que se llama Anonymized Order.
-->
Dale click por favor.
-->
Y vamos a desclosar entonces este señor que está aquí.
-->
En primer lugar, aparece un User Tag,
-->
bueno aparece Overview Documentation que te lo voy a explicar más adelante,
-->
pero vamos a ubicarnos dice Column.
-->
Ahí me está mostrando 10 de 16 columnas.
-->
Si te das cuenta, ahí en Column, si le das click ahí en el mayor,
-->
llevaría a la siguiente pestaña donde estaría demás columnas.
-->
Dale click ahí por favor.
-->
Y te debería mostrar entonces las siguientes columnas.
-->
Devuélvete por favor nuevamente.
-->
El User Tag te lo explico más tarde,
-->
pero entonces, ¿qué sería prácticamente la metadata que tengo,
-->
de metadata técnica que tengo de esa base de datos?
-->
Sería imágenes particularmente de esa tabla.
-->
Te diría el nombre de la columna, el tipo de la columna, la longitud y la escala.
-->
Guarda toda la metadata que pueda de esa base de datos.
-->
Y si es Nullable, es decir, los primeros campos que es Name, Data Type, Length, Escala y Nullable,
-->
son la metadata técnica de esa tabla.
-->
Es la que guarda internamente el talent data catalog.
-->
Ahora, si te posicionas en Column Statistic,
-->
ahí aparece como una especie de azul,
-->
pasa el mouse por encima de ese azul que tienes ahí.
-->
En ese Column Statistic, en cualquiera de las columnas,
-->
el mouse lo es.
-->
Entonces, ahí te va a dar un recuento,
-->
te da de forma general,
-->
y esto viene para la parte de calidad de datos.
-->
Entonces, te había dicho que la herramienta permite hacer Profiling,
-->
detectar alguna anomalías.
-->
Entonces, quizás tú entiendas los datos
-->
y puedas, con la información que está dando, encontrar un error.
-->
Ahí solamente me muestra valores vacíos,
-->
distintos valores y valores duplicados.
-->
No hay ningún valor duplicado.
-->
Sigue a la siguiente columna que es Histograma,
-->
Histograma de Columnas.
-->
Nota que solamente aparecen elementos en algunas.
-->
Histograma solamente va a aparecer cuando la columna es tipo numérico.
-->
Entonces, ahí lo que hace es que
-->
hace un agrupamiento de datos para Profiling.
-->
Por ejemplo, ahí me está diciendo que ha creado grupos.
-->
Cada grupo tiene un solo elemento.
-->
¿Por qué tiene un solo elemento? Porque no hay duplicados.
-->
En pocas palabras, lo que está haciendo es que está creando grupos
-->
en geocode que tengan exactamente iguales.
-->
Ahí hay que formar un grupo por cada uno,
-->
ya habiendo cinco registros apenas.
-->
Entonces, ahí lo que estamos diciendo es que todos los
-->
elementos que están ahí no hay ningún duplicado.
-->
Si hubiese duplicado, te mostraría el histograma
-->
de cuántos duplicados y a qué grupo pertenece.
-->
Viene la sección esa que dice Conditional Labels.
-->
Ese Conditional Labels,
-->
que es otra forma de documentar,
-->
son de forma genérica.
-->
Entonces, si eres tan amable un momento,
-->
sálgase de ahí y va a estar la sección de Manage.
-->
Manage, vete un momento a Manage.
-->
Al menú Manage.
-->
Y vas a encontrar
-->
un submenú que se llama Conditional Labels.
-->
En el menú superior, Daniel, el principal.
-->
Dice Object Collection.
-->
Manage.
-->
Ya el de arriba, el de abajo arriba.
-->
Vete al Manage, exactamente.
-->
Y vete al...
-->
Hay una opción debajo del Label que ya lo vimos
-->
que dice Conditional Labels.
-->
Dale clic por favor ahí.
-->
Sigue bajando.
-->
Ese que está ahí.
-->
Bien. Y este Conditional Labels lo que va a definir
-->
es el grado de sensibilidad
-->
que pueda tener, digamos,
-->
perdón, es el grado de confidencialidad
-->
que querías tener a nivel del
-->
del dato como tal, de la columna.
-->
Para que recuerdo algo.
-->
Bien.
-->
En concepto de privacidad de datos
-->
hay dos elementos fundamentales.
-->
El concepto de lo que es sensibilidad
-->
y el concepto de lo que es
-->
confidencialidad.
-->
Entonces, sensibilidad significa que el grado
-->
es importante y tengo que darle un elemento
-->
de seguridad mucho mayor.
-->
Esa sensibilidad me puede llevar a que el
-->
dato esté encriptado.
-->
Por ejemplo, es sensible
-->
la clave de un empleado
-->
o la clave de un cliente.
-->
Entonces, ese dato tengo que
-->
marcarlo como sensible.
-->
Ahora, el grado de seguridad se define
-->
dependiendo del nivel de sensibilidad que tenga
-->
el dato.
-->
Y existe otro elemento que es el nivel
-->
de confidencialidad.
-->
¿Qué es?
-->
Listo. Por ejemplo, historial médico.
-->
Por defecto en caso,
-->
creo que a nivel mundial,
-->
un médico no puede compartir
-->
el historial médico de un paciente
-->
con un tercero.
-->
A menos que sea pues colegue que trabaja
-->
en la misma clínica. ¿Por qué? Porque
-->
esos datos son confidenciales. Entonces,
-->
este conditional level, lo que
-->
le va a indicar es el grado
-->
de confidencialidad que pueda tener
-->
entonces el dato.
-->
Por defecto, desde cuenta que aquí hay varios.
-->
Creo que estos no han sido cambiados.
-->
Entonces, tengo confidencial,
-->
altamente comentado, altamente
-->
confidencial, y tengo uno interesante
-->
que se llama PII, que es
-->
información
-->
de identificación personal.
-->
Que puede ser
-->
nombre, apellido,
-->
ubicación.
-->
Devuélvase un momento, por favor, ahora sí.
-->
Dale atrás mejor
-->
en el browser para que se haga sencillo.
-->
Nos ubicamos
-->
en la misma.
-->
Note que ahí aparece el
-->
símbolo en naranja y el naranja
-->
correspondería allá en los niveles que teníamos allá
-->
como PII,
-->
información de
-->
identificación personal. ¿Por qué?
-->
Él lo identificó como city.
-->
City es una ubicación. Lo marcó bien.
-->
Ahora, dese cuenta en el
-->
data classification.
-->
Note que lo clasificó
-->
de diferentes. Hizo
-->
una clasificación bastante alta.
-->
Para ver mejor eso entonces, y
-->
para ver lo que está ahí,
-->
le vamos a dar click en el nombre de la columna.
-->
Devuélvete hacia atrás y dale click en el nombre
-->
de la columna, por favor.
-->
Sería city.
-->
La columna donde dice name,
-->
dale click en city.
-->
Y aquí
-->
detallo.
-->
Un momento que cargue.
-->
Bueno, nuevamente este
-->
menú es para calidad de datos.
-->
Lo que está buscando
-->
esta herramienta es que a partir de la información
-->
que te está mostrando,
-->
tú puedas hacer una análisis y determinar que el
-->
dato pueda estar errado.
-->
La herramienta no te corrige.
-->
No hace limpieza de datos.
-->
Lo máximo que podía hacer tú es un issue, una incidencia
-->
para que haya una persona encargada
-->
y haga la correlación del dato.
-->
Bueno, en primer lugar, dice que
-->
el dato es string. ¿Por qué es string?
-->
Porque recuerde que esto está en Java.
-->
Y un tipo de datos en Java es string.
-->
Entonces, él asocia el bar chart que es texto en un
-->
Entonces, él asocia la columna
-->
string acá para Java.
-->
Note que me hace una análisis de patrones.
-->
Esa análisis de patrones me está diciendo
-->
mira, el 60%
-->
de los datos
-->
empiezan con una letra
-->
en mayúscula y siguen
-->
con dos y cinco letras
-->
en minúscula.
-->
El 20% tiene
-->
una letra en mayúscula y cuatro
-->
en minúscula.
-->
Y el 20% restante tiene
-->
una letra y empieza con otra mayúscula
-->
y restan y le siguen tres letras
-->
en minúscula. ¿Para qué puede
-->
ser esto? Bueno, quizás
-->
hay algunos formatos que ya tú
-->
sabes. Por ejemplo, hay formatos de correo
-->
de clientes. ¿Cuál sería el formato que ya tú lo
-->
conoces más o menos? ¿Cuál sería
-->
el formato de los códigos postales?
-->
Entonces, este análisis a nivel
-->
de lo que es de patrones podría identificar
-->
qué datos están guardados.
-->
¿De dónde saca esto? Si se le cortará coincidimos
-->
en el import option, hicimos
-->
data profile mil.
-->
Ese mil quiere decir entonces que él va
-->
a tomar mil elementos
-->
y a esos mil elementos le va a sacar esto
-->
que está aquí. Eso no es a todos los
-->
registros, es solamente
-->
el que hayas definido.
-->
Solamente sería todo si le marcaba cero.
-->
Del otro lado,
-->
lo dice a frecuencia,
-->
me va a indicar cuántas veces aparece cada
-->
elemento. En este caso solamente
-->
hay cinco registros. Me parece Roma
-->
una vez. O sea, veinte por ciento
-->
del cien por ciento sería entonces
-->
como hay cinco registros, el veinte
-->
correspondería a uno.
-->
Berlín tengo nada más veinte por ciento, uno
-->
solo, Madrid veinte por ciento,
-->
Londres veinte por ciento y París veinte por ciento.
-->
Y lo demás son datos estadísticos que son
-->
fundamentales en todo proceso de calidad,
-->
que sería cuántos elementos hay,
-->
cuántos distintos hay, cuánto duplicado,
-->
cuánto vacío,
-->
etcétera.
-->
Por ejemplo, si tú vas a hacer
-->
que te digo yo, una campaña
-->
de mercadeo por correo y
-->
nota que el correo, hay un correo,
-->
hay correos que están vacíos, ya hay
-->
un problema de calidad, ¿por qué? Porque no les va a llegar
-->
a todos esa campaña de mercadeo.
-->
Pero tú puedes identificar muchos
-->
problemas acá.
-->
Listo. Note entonces
-->
que me aparecen muchos elementos y acá
-->
me aparece un label.
-->
Un label, no te cuenta, el lado derecho.
-->
Y este label va a estar
-->
para todos los objetos que te encuentres
-->
en
-->
en la herramienta.
-->
Va a haber label,
-->
como estoy conectado a una base de datos,
-->
puede hacer un label a nivel de tablas
-->
o puede ser label a nivel de columnas.
-->
Este label que está allá es a nivel de columnas.
-->
Pero con una característica interesante.
-->
Dale click por favor. Por favor en label.
-->
En add label dale click por favor.
-->
Dale click.
-->
En add label.
-->
Y dale click en combo box.
-->
Si se da cuenta,
-->
los labels que aparecen acá
-->
no son los mismos labels
-->
que aparecían como de Gdaños.
-->
Porque estos labels ya son propios
-->
de la configuración.
-->
Significa que solamente van a ser compartidos
-->
dentro de la configuración. Por ejemplo,
-->
para agregar un label, dale entonces
-->
coloca ahí la palabra
-->
ubicación.
-->
Si eres tan amable, ubicación.
-->
Y para guardarlo, dale click ahí
-->
en el chulito que está abajo.
-->
Listo.
-->
Listo.
-->
Déjemelo aquí, esto ahí.
-->
Ahora vemos los labels entonces.
-->
Vamos ahora con dicho label
-->
que fue el que aparecía. Ese me va a dar
-->
el nivel de
-->
confidencialidad de la columna
-->
en este caso. Y note,
-->
bueno, collection te lo voy a decir más adelante.
-->
Collection era como decir una
-->
subcarpeta dentro de la carpeta de configuración.
-->
Me quiero centrar mucho en la
-->
parte de data classification.
-->
Nota lo siguiente.
-->
Dice last name.
-->
100%.
-->
Significa
-->
en que el 100%
-->
de los
-->
registros que tengo
-->
ahí en este caso del data sampling,
-->
el 100%
-->
corresponde a un diccionario llamado
-->
last name. En pocas palabras,
-->
esos nombres
-->
de ciudades
-->
seguramente están
-->
como nombres de apellido en ese diccionario,
-->
el 100%. Y por eso te lo clasifico
-->
de esa manera. Sigue
-->
first name.
-->
Se da cuenta que first name
-->
está al cento por ciento, al ladito
-->
del listo. ¿Qué quiere decir
-->
eso first name? Quiere decir
-->
entonces que el 60%
-->
de esos registros que están ahí
-->
están allá en el
-->
diccionario que se llama first name.
-->
Y así sucesivamente con cada uno de ellos.
-->
Aquí podíamos a quitar
-->
y agregar. Por favor,
-->
quita por favor ese last name.
-->
Si colocas el mouse sobre last name
-->
te va a aparecer como una X.
-->
Dale ahí,
-->
dale en la X, quítale
-->
last name.
-->
Quítale first name.
-->
Y deja las demás.
-->
Mira como la clasifico.
-->
La clasifico como PI,
-->
PI first name, PI identification
-->
y PI last name. Que pena. Ahí me quedo
-->
con el PI first name, quítale el PI
-->
first name y quítale PI last name, por favor.
-->
El PI first name.
-->
Oh, la herramienta
-->
en esta parte de clasificación
-->
se puede equivocar y se puede equivocar mucho.
-->
Porque el parte del hecho de tomar
-->
los datos del data sampling
-->
y antecedido verificar si están en algún
-->
diccionario o en su
-->
efecto en alguna expresión regular.
-->
Bien, aquí nos muestra las características
-->
de la columna.
-->
No dice pues tipo
-->
de columna, tipo de
-->
datos que es columna, posición
-->
de la columna, tipo de datos, longitud
-->
y me interesa
-->
la sección
-->
que dice
-->
has semantic definition
-->
y has
-->
data lineage.
-->
Ese truque está aquí
-->
quiere decir entonces que tiene
-->
la columna tiene algún tipo
-->
de documentación ya establecida.
-->
Y el data lineage a talent force
-->
indica que todavía no hay un
-->
job que esté unido
-->
a esa columna como tal.
-->
Bueno, eso es
-->
para terminar ya, el comment ya sabemos
-->
attachment que está en la parte de, ah, perdón.
-->
Sube
-->
por favor.
-->
Dice overview
-->
dale click en
-->
reportes relacionados.
-->
Dale click en reportes relacionados.
-->
Significa que si hay
-->
algún report, tablú,
-->
quilk
-->
o power
-->
b que tenga relación con esa columna
-->
o que te usó esa columna, no hay ninguno.
-->
Dale click en procesos
-->
relacionados, por favor.
-->
Si esa columna está en algún
-->
procedimiento macinado, no.
-->
Vete en data flow.
-->
Si la columna tiene
-->
alguna relación con algún job
-->
al estar nada más, no.
-->
Está apareciendo más de solo.
-->
Y vete a semantic flow, por favor, ya.
-->
Para finalizar porque lo demás es igual.
-->
Aquí dice
-->
vete a un momento donde dice diagram
-->
del lado izquierdo
-->
te va a aparecer una opción que dice
-->
list y diagram.
-->
Dale click en diagram.
-->
Y ahí lo que te está diciendo
-->
es de dónde pertenece la columna.
-->
Es decir, la columna está metida dentro
-->
de un esquema llamada,
-->
perdón, la columna Citi está metida
-->
dentro de una tala llamada Ano y Mais.
-->
Ano y Mais está metida dentro de un esquema
-->
llamada ACME Sporting.
-->
Y ACME Sporting está dentro de un modelo llamado
-->
ACME Sporting Web. Eso es lo que está marcando
-->
de datos semánticos
-->
de esa columna como tal.
-->
Dale atrás allá en el
-->
browser, por favor.
-->
Dale nuevamente atrás
-->
y lo dejas ahí.
-->
Bien, entonces
-->
dale, devuélvete
-->
o dale click Ano y Mais.
-->
Ahí está metada y va a avanzar. Dale click, por favor.
-->
Listo, estamos ahí.
-->
Dale click ahora en label, por favor.
-->
Ustedes dale click en label.
-->
El label de la esquina superior
-->
derecha.
-->
Dale click ahí.
-->
Y expande, por favor, el combo voz.
-->
Date cuenta que te aparece el label
-->
que agregaste esa hora.
-->
¿Por qué? Porque esos labels son
-->
a nivel de la configuración
-->
que tengas.
-->
Los labels de, por ejemplo,
-->
Dennis son diferentes a los labels que tiene
-->
Daniel y los labels que tiene Verónica.
-->
Porque ahora, como cada uno tenemos
-->
una configuración, esos labels que están ahí
-->
son de la configuración que estés
-->
definida.
-->
Listo. Si quieres, baja un poco
-->
más. Y vamos entonces.
-->
Note que ese data sample
-->
cuando hicimos el import
-->
recordará que el data sample estaba en 10.
-->
Aquí aparece en 5 nada más.
-->
¿Por qué? Porque nada más en esa tabla hay 5
-->
registros. Si apareciera
-->
más de 10, pues solamente tardaría 10.
-->
Listo. Aquí
-->
también cuando hicimos el import le dije
-->
tráeme los índices.
-->
Aquí me está mostrando entonces que hay
-->
varios índices. Un índice
-->
a nivel de orden, o sea, cuando
-->
tú creas por definición, creas una tabla
-->
y a tabla le creas un primary key.
-->
El primary key por defecto
-->
lo que crea es un índice.
-->
Crea un índice.
-->
Y entonces tengo también un índice
-->
a nivel de primary key y un índice
-->
a nivel de foreign key.
-->
También recordará que
-->
las bases de datos han avanzado mucho.
-->
Entonces para hacer el join
-->
y tú tienes un foreign key, entonces se hace
-->
un índice para que ese join sea mucho más
-->
eficiente. Solamente la tabla esa en
-->
particular tiene dos índices.
-->
El de primary key y el de foreign key.
-->
Listo. Aquí me sigue
-->
el profiling statistic. Me está diciendo
-->
de cuántas hizo estadísticas.
-->
Nada más de 5, aunque yo haya cogido 1000.
-->
Solamente
-->
hizo 5 de 5 porque nada
-->
más hay esa cantidad de registros.
-->
Y el data request SQL
-->
es que yo podía sacar
-->
algunos datos con una consulta
-->
SQL para hacer la parte de
-->
profiling. Entonces un poquito más avanzada o
-->
no sé si al final
-->
nunca la he usado porque
-->
al final lo que busco es que coloco el data
-->
profiling y que cada vez que yo haga un nuevo
-->
import me coja un dataset
-->
diferente.
-->
Listo. En esa no hacemos
-->
más nada. Creo que expliqué todo
-->
en ese señor que está ahí.
-->
Vete al
-->
repositorio por favor ahora.
-->
Perfecto. Nos quedamos en el repositorio.
-->
Vamos a hacer
-->
faltando ya 20 minutos para dos horas.
-->
Vamos a
-->
adelantar un poquito el break. Escazo un poco la
-->
arcanta. Volvemos en
-->
10 minutitos, ¿OK?
-->
Para continuar
-->
con esta parte.
-->
Ya vengo, volvemos en 10
-->
minutos. Listo.
-->
El
-->
Bienvenido al
-->
Corea
-->
de Corea