5:46
2024-10-25 10:23:32
7:00
2024-10-30 10:32:08
3:47:42
2024-10-30 10:42:07
1:18:31
2024-10-31 13:42:51
2:49:34
2024-11-01 09:09:55
36:40
2024-11-04 11:30:04
1:29
2024-11-05 09:32:07
Visit the TAC, Data Catalog, Stewardship course recordings page
WEBVTT--> Y de allá te va a enviar un código de acceso. --> SÃ. --> Por un momento he visto ahà sÃ, cómo no, claro que sÃ. --> Se me perdió aquà la... aquà que tengo. --> Listo, Dennis, ahà está. ¿Quién más me decÃa? ¿Quién me notaba para copiarle la URL? --> Arturo, perfecto, Arturo. Voy a tu máquina entonces. --> Bueno, usted podrÃa acceder desde su máquina, pero el problema que tengo es que no lo alcanzó a ver. --> Entonces, cuando tenga un error me queda un poco más complicado de resolver. --> Es el inconveniente nada más. --> Perfecto, Arturo. Ahà está entonces la URL. --> Daniel, estoy en tu pantalla y por favor para verificar los permisos si están correctos. --> Nota que ahà te salen varias configuraciones o varios accesos. --> Escoge la última que dice Test Job Migration. --> Dale click ahÃ. --> Le da doble click o click. --> Aunque abajo hay un... listo, perfecto. --> Vete al menú Manage que está en la parte horizontal. --> Dale click ahà en Manage, un momento. --> Perfecto, listo. Tenemos los permisos correctos entonces. --> Perfecto, voy a dejarte presentar aquÃ. --> Bueno, querÃamos confirmar para ver si los permisos, porque ya tuvimos experiencia con un problemita que tuvimos inicialmente a nivel de permisos con el primer curso. --> Entonces, lo que querÃamos comprobar inicialmente era si tenÃamos los permisos correctos. --> Bueno, está todo bien. --> Vamos a conectarnos nuevamente a ese software más o menos como en una hora. --> PermÃteme hacer una introducción teórica. --> Bueno, buena pregunta. --> ¿Denis? --> SÃ. --> SÃ, ¿Denis, verdad? --> ¿Quién me habló? --> Ah, Verónica, vamos con usted. --> Bueno. --> Verónica, si no le está tomando el password, indica dos cosas. --> Hay un error en el password, no está creado como usuario. --> Vamos a confirmar si usted está creado. --> Daniel, voy con tu... --> Que ya tú te lo guÃas, vete al siguiente menú. --> Manage, un momento, Daniel, si es tan amable. --> En el menú Manage que está en la parte horizontal, el menú horizontal, dale click ahÃ. --> Y está uno que dice User, por favor. --> Lo viste ahÃ, el tercero. --> Confirma por favor si está el caso de Verónica ahÃ, si le alcanza a saber. --> Ahà está como usuario. --> SÃ, está como usuario. --> Intente, o sea, en el software sà está como usuario y tiene los permisos correctos. --> Entonces, verifique nuevamente para ver tanto el correo como la contraseña. --> Mire que no tenga de pronto activado el teclado en mayúscula. --> O si usted quiere comprobarlo de la siguiente forma. --> Acceda desde su máquina, no desde la máquina virtual. --> Y confirme desde su máquina si se puede conectar. --> Si está en amable, y mejor lo hace allá para confirmar si se puede conectar. --> Los que puedan acceder, Daniel, ¿me colaboras por favor dándole click ahà en Manage? --> Cuando acceden al software van a la última configuración que dice Test John Migration. --> Es lo último que aparece. --> Le da click ahà por favor si eso está en amable. --> Y confirmen si le aparece el menú exactamente igual como lo tiene Daniel o como estoy presentando actualmente. --> Doble click. --> Listo proceder. Perfecto, Alfonso. --> Dale click en Manage, Alfonso, que estoy viendo que te conectaste. --> Manage. --> El menú horizontal de la parte de arriba donde está Object, Collection, Worship, Manage. --> Dale click ahÃ. --> SÃ, perfecto. --> Estamos todos en sintonÃa a nivel de permisos. --> FaltarÃa comprobar el caso de Verónica si puede acceder y el caso de Enes. --> Pero si no puede acceder desde esta máquina es porque tuvo algún error. --> Entonces déjelo inicialmente en su máquina y podamos iniciar. --> Lo que querÃamos comprobar era primero si el usuario estaba activado. --> Ya comprobamos que todos los usuarios están activados. --> Y segundo que los permisos se hayan definido de manera correcta y asà es. --> Entonces podÃamos iniciar inicialmente la pared teórica. --> Y después decidimos si hace la práctica directamente en su máquina o lo hace en la máquina virtual. --> Lo que necesito es que por lo menos uno lo haga en la máquina virtual porque no pudo acceder al software. --> Entonces me toca tomar la pantalla de alguien y llevarme a partir de esa pantalla. --> Bueno, vamos, como les decÃa, eso lo vamos a ver como en una hora más o menos vamos a utilizar el software. --> PermÃtame entonces si hago una introducción teórica para poder entender qué es lo que se busca --> y cómo podrÃa utilizar el software en su diario vivir, en sus procesos de negocio como tal. --> Entonces voy a confirmar, estoy presentando, perfecto, listo. --> Bien, este curso titulado Talent Data Catalog es una herramienta en el ecosistema de talent. --> Como su nombre lo dice, para catalogar datos no es la única herramienta que hay en el mercado. --> En realidad que está la de Oracle, la IBM, la de AWS, la de Microsoft. --> Particularmente yo tengo experiencia con Talent Data Catalog en versión 6 a nivel profesional en una empresa. --> Y con Oracle tengo experiencia pero más que todo a nivel académico. --> Si hago una comparación entre lo que es el Talent Data Catalog con el de Oracle, el Talent Data Catalog es superior --> principalmente porque la interfaz es muy instituida, es muy fácil de usar, no es compleja. --> Y además que tienes unas opciones que en realidad que en Oracle no las encuentras. --> La idea es poder, digamos, que usted analice todas las opciones que tenga el software --> y aprovechar cómo podÃa utilizar, digamos, la herramienta en el diario vivir de su empresa. --> Listo, entonces ¿cómo va a ser la metodologÃa? --> Pues la metodologÃa va a ser prácticamente la misma del curso anterior. --> Vamos a ver unos conceptos teóricos que esto puede durar entre una hora, quizás máximo una hora y 30. --> Acta seguido entonces toda la parte teórica la implementamos a nivel del software, a nivel teórico práctico. --> Con la única y pequeña diferencia es que no puedo acceder al software. --> Entonces me toca tomar la pantalla de alguien e ir guiándolo para que cada uno de ustedes --> a partir de esa pantalla puedan configurar de forma exitosa cada uno de las prácticas que tenemos planificadas. --> Entonces no hay mucha diferencia, la única es que no puedo acceder al software en este caso. --> Listo, ¿por qué no acceder al software? En realidad Talent desde que fue comprada por Quill. --> Talent ofrecÃa una versión trial del Talent Data Catalog para que usted hiciera la prueba. --> Yo actualmente no estoy muy de acuerdo con ciertos elementos a nivel de negocio que ha tenido la empresa desde que la compró Quill. --> Actualmente la empresa lo que si usted quiere, por ejemplo, está interesado en esta herramienta Talent Data Catalog, --> lo máximo que podÃa hacer es conectarse con un partner y el partner le va a mostrar la herramienta pero usted no lo va a utilizar. --> Entonces creo que hay una falla fuerte porque cómo voy a comprar algo que en realidad yo no sé si me va a funcionar --> o se va a adaptar precisamente a lo que yo requiero. --> Entonces ahà parece que hay una pequeña falla a nivel de negocio desde mi punto de vista, claro, desde Talent. --> Esto es una herramienta verdaderamente cara, carÃsima, carÃsima la herramienta, --> tanto a nivel de comprar el core del software más cada uno de los usuarios que se tiene. --> Bueno, vamos entonces. --> Quizás la primera pregunta para hacer entonces la introducción que nos podrÃamos formular es --> por qué una empresa hoy en dÃa quisiese adoptar una solución a nivel de catálogo de datos --> partiendo en que hay muchas soluciones en el mercado. --> Bueno, para poder entender, digamos, por qué o qué beneficios tendrÃa una empresa --> adoptar una herramienta de catálogo de datos independiente del nombre que sea, --> ya sea de Oracle, de Talent o de Microsoft. --> Veámoslo de esta forma. --> ImagÃnese que usted va a montar un negocio. --> El negocio entonces es venta de algo, venta de algún producto. --> Usted inicia, digamos, en una empresa muy pequeña con un nicho de mercado muy, muy pequeño. --> Y cuando usted tiene pocos clientes, usted se puede dar, digamos, --> que el lujo de llevar el control de sus ventas de forma manual. --> Es decir, lo apunta en algún cuaderno o libreta cada una de sus ventas --> y al final suma, digamos, cuánto vendió y puede sacar algunas cuestiones interesantes a nivel manual. --> Pero si, digamos, esa empresa empieza a ser exitosa, --> empieza a crecer como tal ese número de clientes. --> Cuando crece ese número de clientes, ya empieza a ser un poco, --> mucho más lento el proceso y mucho más complicado si lo lleva manual. --> Entonces, usted empieza a encontrar entonces un módulo de software --> que le ayude a automatizar la venta de esos productos. --> Si su empresa empieza a crecer, empieza a crecer seguramente en departamentos y áreas y empleados. --> Entonces, seguramente su empresa empieza a tener, digamos, un departamento de nómina, --> un departamento de recursos humanos. --> Y cuando tengo varios departamentos, entonces, como ya tenÃa un módulo para ventas, --> tendrÃa que comprar un módulo para nómina, un módulo para recursos humanos, etcétera. --> Y cuando yo integro esos módulos entre sà para que se conecten, --> es lo que yo llamo una solución o que se llama para una solución ERP. --> Entonces, hay mucho ERP en el mercado y el ERP tiene como función precisa, --> es decir, aportar o apoyar o automatizar el proceso core de la empresa. --> En este caso, por ejemplo, ventas. --> Listo, cuando usted empieza a crecer, tiene varias sucursales. --> Entonces, al nivel, digamos, en el tiempo, empieza a ser exitoso --> y empieza a montar sucursales en diferentes partes. --> Esas sucursales necesitan mucho dinero y usted seguramente empieza --> y necesita crecer en clientes. --> Necesita incrementar su cliente como tal. --> Para eso, entonces, usted empieza a montar soluciones tipo CRM, --> que lo que busca el CRM entre muchas cosas es tratar de fidelizar al cliente, --> o sea, que el cliente sea fiel, no se le vaya para la competencia. --> Segundo, hacer lo que uno llama la trazabilidad de cliente, --> cómo convierto un cliente potencial en un cliente real. --> Entonces, eso lo hace un CRM, pero ya vas a tener dos software, --> un software tipo ERP y un software tipo CRM. --> Cuando tenga estos dos software, son de diferentes proveedores, --> seguramente empiezas a tener un problema de duplicidad, --> porque datos que van a estar del lado del ERP, --> lo vas a subir del lado del CRM y empiezas a tener una duplicidad. --> Si la empresa lo que hace, por ejemplo, es crear productos, --> o sea, fabricar productos, que compre materia prima, --> entonces tú necesitas buscar la mejor materia prima en el mejor costo. --> Entonces montas un software de tipo CCM. --> CCM lo que hace es conectar tu empresa contra los proveedores que tienes. --> Y eso entonces empiezas ahora, nuevamente tienes ahora dos software como tal. --> Empiezas entonces quizás a duplicar información, --> porque no eres el mismo proveedor. --> Y empiezas a tener entonces algunos problemas de duplicidad, --> pero solucionó con cada tipo, digamos, lo que quiero buscar en mi empresa. --> Empiezas a madurar mucho más en el mercado --> y empiezas a mejorar tu proceso de análisis, --> como hago yo para mejorar, digamos, mi proceso de toma de decisiones. --> Y entonces empiezas a montar soluciones tipo data warehouse, --> que básicamente un data warehouse es una base de datos decisional. --> O empiezas a montar un data lake, o empiezas a montar un data lake house, --> que te ayude a mejorar, que te genere información --> y con eso te ayude a mejorar esa toma de decisiones que tienes hoy en dÃa. --> Pero eso cuenta en que yo empiezo a incrementar en sistemas --> y quizás empiezo a duplicar como tal mucha información y mucho dato que tengo. --> Pero cuando yo empiezo a crecer, --> se empieza a tener un problema de gobernabilidad de datos. --> Y esa gobernabilidad de datos, cuando tienes, digamos, ese stack tecnológicos, --> se ve desde el punto de vista en que no tienes un inventario centralizado de tus activos. --> En este caso, activos de datos. --> Me explico de esta forma. --> Tienes base de datos ERP, tienes CRM, tienes SCM, tienes bodega de datos. --> Y entonces tú dices, de pronto Mercadero dice, --> vamos a hacer una campaña que busque segmentar mis clientes por edad y por ubicación. --> Y entonces Mercadero pregunta, --> tenemos los datos necesarios para hacer el segmento? --> Entonces tendrÃas que llamar al ingeniero de datos --> y preguntarle qué datos tiene de tus clientes. --> El ingeniero de datos va a la base de datos, --> consulta a sus clientes y tiene, por ejemplo, identificación, nombre --> y no tiene, por ejemplo, fecha de nacimiento. --> Con eso raro uso hoy en dÃa. --> Pero no tiene fecha de nacimiento. --> Si tú no tienes fecha de nacimiento, no podÃas segmentarlo por edad. --> Te tocarÃa hacer una campaña de autorización de datos de esos clientes. --> Pero ve el tiempo que te puede gastar en tener que llamar a una persona --> y preguntar con qué datos se cuenta para poder ver si la campaña es viable o no es viable. --> Y ahà viene esa parte de inventario de datos o de inventario del catálogo de tus datos. --> Entonces tú serÃas mucho mejores y mucho más sencillo --> en que tú tuvieses una fuente central --> y cualquiera persona podrÃa consultar qué datos cuento --> y dónde están esos datos. --> Porque de pronto no tienes el problema de qué datos tienes. --> Si no tienes otro problema es dónde se encuentran esos datos. --> Entonces empiezas a tener un problema de gobernabilidad porque tienes muchas fuentes --> y les toca preguntar hasta llegar, digamos, a la solución que tú quieres. --> De igual forma, seguramente, si tú empiezas a vender productos, --> necesitas una polÃtica de privacidad de datos. --> Y en esa polÃtica de privacidad de datos tienes que definir qué datos son sensibles y confiables. --> Entonces lo mejor serÃa tener una herramienta que te permita consultar de manera muy rápida --> si estás implementando o no esas polÃticas de privacidad de datos. --> De igual forma, seguramente, te estás casando con algún cumplimiento normativo, --> sea GDPR, sea CCPA. --> Normalmente acá en Latinoamérica creo que usamos mucho GDPR. --> Pero GDPR me permite también definir algunas polÃticas --> y tener una herramienta que me permita definir si la estoy cumpliendo o no. --> SerÃa interesante, por ejemplo, polÃticas en que si yo tengo clientes en Europa, --> por polÃticas de Europa yo no puedo sacar de la Unión Europea, perdón, --> por polÃticas de la Unión Europea, --> todos los datos que sean de un cliente de Europa no pueden salir de Europa. --> Tienen que quedar en la Unión Europea en el Bundler Center, --> pero que esté ubicado en la Unión Europea. --> Entonces, ¿cómo yo podÃa verificar si eso es posible? --> Entonces, tú puedes tener una herramienta de catalogo de datos --> que te diga qué datos tiene y dónde se encuentran esos datos. --> Y tú rápidamente podrÃas verificar que eso se está cumpliendo como tal. --> Y por último, serÃa interesante tener lo que uno llama una trazabilidad de datos, --> llámalo trazabilidad, ciclo de vida o linaje, --> que te permita entender de dónde vienen los datos, --> qué transformaciones hay, quiénes las hizo --> y quiénes están utilizando esos datos. --> Por ejemplo, tú tienes un problema de quizás unos correos que están, digamos, --> errados o en su defecto están desactualizados. --> Entonces, tú puedes verificar de dónde viene, quién lo está transformando, --> si el problema que está en la transformación --> que me daña por lo menos los correos. --> Entonces, tú puedes tener una trazabilidad que te ayude a entender --> de dónde vienen esos datos, qué se están haciendo y hacia dónde van. --> Esa es la idea fundamental de un catalogo de datos. --> De igual forma, vas a tener otros beneficios. --> ¿Por qué? Porque va a ser muy fácil entender y descubrir nuevos datos. --> Hago un paréntesis aquÃ. --> Cuando hablo de datos, estoy hablando de metadata. --> Entonces, no estoy hablando... --> Yo tengo, por ejemplo, una tabla de clientes. --> La tabla de clientes tiene las columnas identificación, nombre y apellido. --> Cuando hablo de este activo de datos, de estas herramientas de catálogo de datos, --> son herramientas que lo que hacen es guardar como tal la metadata. --> Y en este caso, la metadata de clientes serÃa los nombres --> y los tipos de datos de esa columna. --> No tanto me interesa en esta herramienta, no le interesa mucho los registros. --> Es decir, los nombres de empleados no le interesa. --> Lo que le interesa principalmente es la metadata que tú conservas --> de tus activos de datos. --> Ahora, como esos datos, tú ahora los vas a ligar --> y los puedes ligar con metadatos que pueden ser de negocio --> porque tú seguramente tienes unas definiciones, unos metadatos --> que te ayuda a descubrir, por ejemplo, las definiciones --> y que tengas en que todos hablen el mismo idioma. --> Por ejemplo, a nivel de supermercados, --> bueno, creo que la mayorÃa deben ser asÃ. --> En caso de Colombia, todos los empleados del supermercado --> tienen que dar respuesta a cualquier pregunta. --> Es decir, tienen que tener un conocimiento horizontal. --> En pocas palabras, yo le puedo preguntar al cajero --> del supermercado que es donde puedo encontrar un producto --> y él debe llevarme a esa sección. --> O decirme dónde está ubicada, sección 4, sección 5. --> Eso es lo que llaman, digamos, un conocimiento a nivel horizontal. --> Y ahora, como hay una metadata y como tú quieres que todos --> hablen el mismo idioma, entonces tú puedes, digamos, --> guardar tus metadatos para que cada uno los consulte --> y podemos hablar exactamente el mismo idioma. --> Por ejemplo, yo en una empresa que alcancé de hacer un proyecto, --> ellos tenÃan un glosario de términos de negocio --> y me pareció interesante la definición que tenÃan de clientes. --> Para ellos, un cliente es un empleado más, --> en el sentido que se conserva como una persona --> que la trata de manera muy familiar. --> Y entonces la idea era insertar en los empleados --> en que los clientes es como si fuesen familia de ellos, --> como si estuvieses, digamos, con toda la confianza --> y la idea de ellos es que la mayorÃa, pues, de todos, --> te atendiera el cliente de igual forma. --> Eso me parece interesante, pues, cada uno lo define --> y, digamos, lo transmite de forma diferente. --> Ahora, las herramientas también de catálogo de datos --> te van a permitir algo que ya hemos venido trabajando, --> que es el concepto de calidad de los datos. --> Entonces, por lo menos, la herramienta te va a permitir hacer dos cosas. --> Te va a permitir definir, por ejemplo, --> si se están cumpliendo las reglas de calidad --> y te va a permitir monitorear cómo se están usando esas reglas de calidad como tal. --> Al final, pues, aquà hay un gan y gana de este tipo de herramientas --> porque, por ejemplo, para un analista de datos --> le sirve mucho encontrar datos rápidamente --> para hacer algún trabajo especÃficamente --> o para entender el significado de esos datos. --> Y para un equipo de negocios puede ser, por ejemplo, --> en que tú puedas tener una herramienta de autoservicio --> y puedas consultar fácilmente la ubicación de un dato, --> quién lo tiene, dónde está, quién lo está manejando. --> Y al final, pues, tener una comprensión de todos los datos de igual manera, --> que es lo que uno llama el conocimiento horizontal. --> Eso serÃa, digamos, que las ventajas del por qué --> pensar en una herramienta de catálogo de datos --> es claro que estas herramientas se implementan --> cuando ya hay un nivel de madurez muy superior en una empresa --> y que seguramente quizás ya tú tengas definido algunos metadatos --> y ahora vas a tener entonces una herramienta centralizada --> en que todas tus sucursales van a manejar exactamente el mismo idioma. --> En pocas palabras, vas a tener una única fuente de verdad --> y en este caso de tus activos de datos. --> Esas serÃan las principales ventajas a nivel de lo que es, digamos, --> montar una herramienta de catálogo de datos. --> Vamos entonces a iniciar con unos conceptos básicos --> para que todos empecemos de la misma forma. --> No sé, creo que sÃ. Estoy presentando entonces. --> En este caso voy a hacer una pequeña introducción netamente teórica. --> Primero vamos a definir el concepto de metadato, --> que es sumamente importante este concepto --> en una herramienta de catálogo, sea cualquiera. --> Esa palabra meta permite estar por encima de lo que usted coloque. --> Por ejemplo, yo cuando digo meta-lenguaje, --> entonces significa que es un lenguaje que me permite crear nuevos lenguajes. --> Entonces, por ejemplo, el tÃpico es C. --> Cuando tú viste de pronto en la universidad --> o de pronto en el nivel práctico, --> tú has notado que cuando tú accedes un avaseato, --> por ejemplo, tipo Postgres, --> te aparece un avaseato ya internamente que se llama Postgres. --> Cuando entras a MySQL, es un avaseato que se llama MySQL. --> Cuando entras a Oracle ya hay unos esquemas que están predefinidos. --> Esos esquemas tienen una meta-tablas. --> ¿Por qué se habla de meta-tablas? --> Porque son tablas que hablan acerca de tablas, --> o que te informan acerca de tablas. --> Tenemos el concepto ahora de metadatos, --> que básicamente la mejor definición metadatos --> son datos que describen otros datos. --> Entendemos en que el dato puede carecer de significado, --> pero ahora yo puedo agregarle más datos --> y progresar esos datos y me da más información. --> O yo podÃa tener un metadato --> que básicamente no tiene la información de ese dato. --> Entonces, ahà es un poco la forma en que cómo lo concibas. --> Metadatos, datos que hablan acerca de datos, --> o información que te habla acerca de datos. --> Ya esto es, por ejemplo, esto ya es bastante antiguo. --> Por ejemplo, cuando solo tenemos una imagen, --> pues esa imagen en realidad guarda muchos metadatos. --> De aquà vienen que a veces pasa lo siguiente, --> en que tú tienes una imagen y la compartes. --> Pero cuando la compartes, --> hay alguna partecita que no quieres que la vean. --> Entonces, tú digamos que le colocas ahà --> como una especie de marcador en negrito --> para que nadie lo vea. --> Pero hay algunas aplicaciones que cuando tomas la imagen, --> internamente guarda una copia de la imagen --> que va dentro de la imagen. --> O sea, guarda la original dentro de un metadato --> de tal forma en que si se pierde esa imagen --> tú la puedas recuperar. --> Entonces, tú a veces compartes eso --> y creyendo en que ocultas esa parte, --> pero si tú entras en cierta metadata, --> te va a dar entonces, por ejemplo, que está la original. --> Exactamente, sin el marcador que la hayas colocado. --> De igual forma, pues hay veces que tú tomas la imagen --> y por defecto, si tienes tu celular, --> te puede mandar o tomar la ubicación. --> Entonces, tú comparte esa imagen --> y se te va la ubicación. --> Entonces, cualquier persona podÃa saber --> dónde estás en ese momento, --> en ese lugar que tomaste la imagen. --> Asimismo, vas a encontrar metadatos --> a nivel de lo que es música. --> Tengo no solamente el nombre, --> tengo el álbum, por ejemplo, el género --> y muchos elementos que puedo tener a nivel de metadatos --> o a nivel de un documento de texto. --> Por ejemplo, si hablamos de un documento de texto --> enriquecido tipo Word, --> se guarda mucha metadata, --> muchÃsima metadata del autor, --> que cuando lo modificó, --> qué elementos modificó. --> Entonces, ese es el concepto de lo que se llama metadata. --> Entonces, estos metadatos --> vamos a utilizarlo mucho acá --> dentro del concepto del catálogo de datos. --> Hay una definición interesante que los metadatos --> se definen como el ADN de los datos. --> Y aquà empezamos con lo siguiente. --> Tienes que ubicarte --> desde ya en qué vas a hacer --> dentro del software. --> No sé si alguien me comentó algo por ahÃ. --> Ok, perfecto. --> Listo. --> Tienes que ubicarte el perfil --> que vas a hacer en la herramienta. --> Y vamos a empezar esa ubicación --> partiendo de los tipos de metadatos --> que la herramienta te va a permitir manejar. --> En primer lugar, --> un metadato que llaman técnico. --> Ese es el metadato --> que vamos a recuperar --> de los archivos, las tablas --> o cualquier activo de datos --> que tengas en tu empresa. --> Entonces imagina que tienes una base de datos --> y vas a sacar los metadatos de las tablas. --> Básicamente vas a sacar --> los nombres de la columna --> y los tipos de datos. --> Ese perfil no es tan técnico --> pero el perfil tiene un pequeño problema --> en que para poder definir --> el metadato técnico --> tendrÃas que saber la ubicación --> de ese metadato. --> Y quizás quien sabe la ubicación --> normalmente puede ser el ingeniero de datos. --> Quizás gobierno y gestión --> de datos quizás no sabe. --> Sabe que existe el dato --> pero no sabe dónde está. --> Aclaro, aquà el problema no es técnico --> aquà el problema es de saber la ubicación --> porque en realidad la herramienta --> te permite muy fácilmente --> a partir de ya tu sepas dónde está --> poderlo ubicar. --> Entonces aquà podrÃamos hablar entonces --> ya sea de base de datos --> data lake y cualquier elemento --> que sea un activo de datos en tu empresa. --> Vamos ahora --> con el metadato de negocio. --> Ese metadato de negocio está --> más ubicado para aquella persona --> que tenga un perfil --> y conoce más la empresa. --> Esta es la persona que va a --> definir entonces digamos --> la metadata a nivel de los --> glosarios de términos de negocio. --> ¿Por qué? Porque es la que ha trabajado --> entiende mejor y entonces --> es la que va a manejar esta parte. --> Quizás ya hay algunos --> metadatos definidos que quizás las tengan --> en archivos SV en alguna tabla, en un Excel --> y la idea es que esos --> metadatos que tienes ya --> definido los podamos reutilizar en la --> herramienta. Pero claro este negocio --> es lo que va a definir básicamente son --> como tal --> las definiciones de la metadata que --> tú tengas. --> Listo y vamos ahora con otro que es --> este si es un poco más técnico --> que es la metadata --> a nivel de linaje. --> Entonces esta linaje lo puedes --> llamar de tres formas o lo llamas --> linaje o lo llamas trasabilidad --> o lo llamas ciclo de vida de los datos. --> Cualquiera de los tres nombres es sinónimo --> llámalo como tú quieras. --> Yo tengo unos datos técnicos --> y entonces esos datos técnicos --> seguramente pueden sufrir algunas --> transformaciones. Y la idea es que --> el dato del linaje, el dato del linaje --> me diga entonces ¿qué --> transformaciones se hicieron? --> ¿Quién las hizo? ¿En qué fecha --> se actualizó esa transformación? --> Es tal forma en que yo haga la trasabilidad --> del dato desde que inicia, se --> transforma hasta que se consume. --> ¿Por qué digo que debe ser --> más técnico? Porque aquà es que entran --> a juego los --> jobs, --> pipeline, workflow como tú quieras llamarlo --> que tengan de alguna herramienta ETL. --> Por ejemplo, seguramente quizás --> estás casado con PowerCenter o con --> Talent Studio. Entonces --> hay unos jobs que tienes ya --> definidos ahà y esos jobs son los que te van a --> definir el linaje o el ciclo de vida --> de los datos. Aclaro que --> puede ser posible en --> que definas proyectos --> de catálogo de datos sin linaje. --> Pero con el linaje la herramienta es mucho --> más poderosa porque gráficamente te va a --> decir dónde inicia, --> qué se transforma y hacia dónde --> llega. Y ahà podÃas hacer --> una análisis de impacto en si yo --> cambio un valor, ¿cómo ese valor --> afecta a esa cadena? --> A esa cadena que se lee, --> a esa cadena que se transforma y esa cadena que se --> consume. Entonces aquà es un poco --> más técnico. Quizás --> puede que en este momento no --> tengas los jobs o quizás --> tienes que definir cómo vas a hacer la --> polÃtica de integrar esos jobs --> dentro de la herramienta. De todos modos va a ser un --> ejemplo de cómo se hace eso --> y cómo quedarÃa la herramienta --> con esos tres tipos de metadata. --> Y por último --> tenemos entonces un poco un rol más --> de calidad de datos. Y básicamente --> ese rol de calidad de datos, --> lo que la herramienta te va a permitir --> es verificar --> si están cumpliendo algunas normativas --> o reglas de calidad de datos. --> Aquà puede haber cuatro perfiles --> o dos perfiles o un solo perfil. --> Lo que pasa es que tienes que ubicarte --> en qué es lo que vas a hacer --> y cómo vas a trabajar con la herramienta. --> Técnicamente a nivel de usuario final, pues --> o eres técnico o eres de negocio --> o eres de linaje o eres de calidad --> o eres todos. --> Pero es lo que te va a permitir la --> herramienta especÃficamente. --> Bueno, voy a continuar entonces --> aquÃ. Sigo acá. --> Voy a definir ahora --> este concepto de --> unos conceptos que seguramente ya los --> conocemos, pero para reforzar --> y que todos partamos de la misma base. --> ¿Por qué voy a agregar estos --> conceptos? Porque ahora estos elementos --> que voy a agregar aquà son --> fuentes donde yo puedo tomar --> mil activos de datos. --> Son fuentes para yo --> poder hacer los metadatos técnicos --> como tal. --> Primero empezamos con el concepto este --> de Data Warehouse, que en realidad --> este concepto hay algunos --> que creen que Data Warehouse es una --> tecnologÃa y en realidad no lo es. --> Data Warehouse --> simplemente es un modelo de datos --> en los cuales yo voy a crear --> otra base de datos. --> Y en esa base de datos --> yo voy a mantener entonces mis datos --> decisionales. --> Por ejemplo, digamos que --> tú quieres segmentar --> tus clientes por --> edad, digamos. --> Y en ese momento de mercado --> vas a colocar entonces los datos que son --> relevantes para tus segmentos. Por ejemplo, --> carece de sentido mucho --> en que yo tenga en Data --> Warehouse, por ejemplo, --> un teléfono de un cliente. Por ejemplo, ¿por qué? --> Porque quizás ese teléfono no --> me da más información o --> me agrega información decisional del cliente. --> Normalmente yo lo que hago en Data Warehouse es llevar --> aquellos datos que son relevantes --> para tomar una decisión. Y por eso --> que algunos lo llaman como base de --> datos decisional. --> Pero no es una tecnologÃa nueva. --> En realidad no es otro motor de base de datos. --> Si hay casos como --> de pronto usted ha escuchado en --> AWS una tecnologÃa que se llama Redshift --> dice, no, Data Warehouse --> es un poco más comercial ese --> nombre que está ahÃ. ¿Por qué? Porque --> lo que busca ellos es ofrecerte una plataforma --> partiendo del hecho --> en que el Data Warehouse va a tener, entre comillas, --> doble, una gran cantidad y un volumen de datos --> muy alto. Entonces te ofrece una infraestructura --> pensando en el escalamiento de tus --> datos. Pero al final tú lo que vas a --> subir es un modelo y los datos que --> se asocian a ese modelo como --> tal. Entonces seguramente --> puede ser que algunos --> metadatos lo tomes --> del Data Warehouse, por ejemplo. --> Por eso es que lo menciono aquÃ. --> Y tenemos el concepto que es Datamar. --> Datamar básicamente que hay diferencia --> en un Datamar es un subconjunto de un --> Data Warehouse. Cuando hablamos de un --> Data Warehouse significa que yo tengo un modelo --> de datos en el cual --> tengo toda la parte adicional --> de mis áreas o departamentos de mi empresa. --> Por ejemplo, nómina, cuentas por pagar, --> todos los departamentos de tu empresa --> si están en un modelo de datos, se habla --> de un Data Warehouse. --> Si por el contrario, tú no más tienes --> solamente el modelo de datos --> para entender adicionalmente --> un área, se llama Datamar. --> De ahà viene que un Datamar --> es un subconjunto de un Data Warehouse. --> En teorÃa, la sumatoria de tus Datamar --> te da un Data Warehouse. --> Bien, pero esto lo menciono vuelvo y repito --> porque seguramente quizás tengas en --> tu empresa un Data Warehouse. --> Y es posible que podamos sacar --> alguna metadata técnica de ese Data Warehouse. --> Vamos nuevamente con el concepto este de --> inteligencia de negocio --> en que cuando yo empezaba --> a estudiar esos temas y yo empecé mucho --> con inteligencia de negocio hace muchos tiempos. --> Y cuando entra este concepto de Big Data --> entonces se decÃa que Big Data iba a acabar --> con la inteligencia de negocio, pues --> ese era un --> problema de definición que no lo tienen claro. --> En realidad Big Data es una tecnologÃa --> más de almacenamiento y progresamiento --> en que al final tú lo que terminas --> haciendo es haciendo lo mismo que en la --> computación tradicional, pero ahora --> con un volumen de datos elevado y porque tú quieres --> con unos tiempos de respuesta que sean --> muy cortos. Entonces hoy --> en dÃa se habla de un concepto interesante --> que se llama Big Data AnalÃtica, --> que ahora esa analÃtica que le colocan --> ahÃ, la idea es que yo define a un --> proyecto de Big Data que me permita analizar, --> pero para analizar algo --> Big Data no está para analizar, porque --> para analizar algo tú tienes que --> entender primero el contexto de tus datos --> y que esos --> datos normalmente te los grafiquen o te los resumen --> en una tabla y tú a partir de tu --> decisión de conocimiento, tú puedas --> ver y analizar qué está pasando en tu empresa. --> Entonces Big Data como tal no es --> una tecnologÃa de análisis, --> hoy en dÃa se agregó ese concepto Big Data --> AnalÃtico, sÃ, vaya venga, porque ahà sà está --> pensado en que se procese --> y que al final generes unas gráficas para que la --> persona idónea en el área --> pueda entender los datos. --> Al final dese cuenta que a nivel de --> Big Data, --> a nivel de Data Lake, tú puedes tener --> muchos datos no estructurados, por ejemplo un audio --> o una imagen, pero al final --> tú necesitas estructurar eso para tomar una edición, --> o sea, o para mostrarlo, necesitas estructurarlo. --> Entonces, en realidad --> Intel ese negocio todavÃa sigue en el mercado, --> y aquà muestro la arquitectura --> por lo siguiente, entonces se cuenta que --> aquà en esta parte aparecen --> unos datos de ventas, ERP, --> CRM, como tal, --> y que llegan a un área de --> data stacking, --> un área de stage, --> es un área intermedia, normalmente --> esa es otra base de datos en el cual --> hago unas conversiones para hacer más fácil --> el proceso de TL, --> pero aquà lo interesante de esta --> arquitectura es que yo podÃa tomar --> metadatos técnicos, ya sea --> de las fuentes de entrada, que son las bases de datos --> de ERP o CRM, la que tú tengas, --> podÃa tomar metadatas del área --> intermedia que es la de stage, --> podÃa tomar metadatas del --> data warehouse, --> podÃa tomar metadatas de los --> centros, --> podrÃa tomar metadatas --> de las --> herramientas de explotación --> de Business Intelligence, por ejemplo --> Power BI, --> tú tienes un reporte en Power BI, --> y la herramienta te va a permitir --> conectarte hacia Power BI --> y sacar la metadata de ahÃ, --> lo mismo te va a pasar con Tableau, --> con los servicios de Quill, --> IBM y con SAP, --> aclaro que, vuelvo a repetir, la herramienta está --> pensada para tomar metadatas técnicas, --> ya sea de bases de datos, --> o ya sea, por ejemplo, en este caso, --> de herramientas de explotación. --> Esa es la interesante de la herramienta comutal. --> Por eso que mostré esta gráfica, simplemente --> para evidenciar, --> o para que, digamos, si ustedes entienden que yo podÃa --> sacar metadatas técnicas de cualquier --> elemento que está en esa arquitectura de ahÃ. --> Entonces, esos metadatos técnicos --> y operativos, lo que van a buscar es entender --> la origen de los datos, --> entender qué se está haciendo en la empresa --> con esos datos, o sea, la transformación de esos datos, --> la frecuencia de actualización --> y los responsables. --> A nivel de metadatos de negocios, lo que buscamos --> entender es definir términos de negocios, --> definir los glosallos --> como tal, definir las --> generaciones que hay entre esos términos, --> quienes usan los datos, --> para qué los usan, entonces, ahà --> esto va más de entender --> la empresa. No técnicamente, --> sino desde el punto de vista del negocio. --> Quizás --> eso sea para algunos --> un perfil. Entonces, quizás --> de pronto tú vas a entrar --> en la herramienta para definir --> estos conceptos y para después --> explotar estos conceptos como tal. --> Por aquà hay otro elemento --> que se llama un MDM, --> Master Data Management, --> ese que está ahÃ. --> En realidad, que esto no es --> otra tecnologÃa, tampoco es --> nueva, esto es otra base de datos. --> Que esta base de datos prácticamente --> qué hace? Quizás --> tú tengas varias sucursales --> que tengas --> replicados algunos datos ahÃ. --> Quizás hoy en dÃa se habla --> de conceptos de un cliente 360, --> entonces, ver el cliente --> de diferentes puntos de vista. --> Y tú necesitarÃas una fuente --> de verdad de esos datos transaccionales. --> Entonces, tú montas un MDM. --> Un MDM va a tener los datos clave --> de tu empresa, datos como cliente, --> productos, proveedores, ubicaciones de esos señores. --> Lo mantienes en esa base de datos centralizada --> y que determina --> una fuente de verdad para muchas --> sucursales que tienes datos replicados. --> Entonces, ahà viene el concepto de SMDM, --> que tecnológicamente no es --> una tecnologÃa nueva, --> simplemente es otra base de datos --> en que mantienes datos actualizados de esos --> por ejemplo los clientes, los datos más importantes --> o más relevantes que tengas en tu empresa. --> De igual forma, --> al final, como es una base de datos, podÃa sacar --> también datos técnicos de SMDM --> como tal. --> Listo, entonces aquà tenemos --> esa parte --> seguramente usted la entiende --> mucho mejor que yo. Yo no tengo este perfil. --> Pero básicamente --> cuando uno habla de gobierno --> de datos, habla de la definición --> de reglas, ¿cierto? Definición de reglas --> estándares que van --> a regir la parte esta de --> calidad de datos, en este caso en particular, --> pero no solamente calidad de datos, sino --> para muchas cosas. --> Este perfil, prácticamente --> yo soy un poco más técnico, no me meto mucho --> en este perfil, seguramente usted lo entiende. --> Y básicamente ese gobierno de datos --> abarca lo que uno llama el PPT, --> personas, procesos y tecnologÃas. --> Al final, --> lo que busco con esta presentación es que --> tienes que saber cómo --> vas a integrar esa parte --> de gobierno de datos, tanto --> a nivel de reglas de estandarización --> como reglas de definición de cuáles --> son los datos dentro de la herramienta, --> cómo la vas a usar. --> Y además de eso es --> cómo a partir de una regla --> definida o un estándar definido en gobierno, --> cómo puedo verificar --> en la herramienta si se está cumpliendo o no se está --> cumpliendo. Eso es lo interesante --> de cómo puedes utilizar la herramienta --> en función de esta parte de gobierno de datos. --> Bueno, la parte de gestión lo que busca --> es, yo tengo pues un conjunto de reglas, estándares --> y la parte de gestión es --> implementarlo como tal, --> esas reglas para el procesamiento de esos datos. --> De igual forma, --> con la herramienta te va a permitir también --> entender qué se está haciendo con esos datos, básicamente --> con el ciclo de vida o el linaje --> o tasadida como tú quieras llamarlo. --> Y vuelve y juega --> nuevamente esta parte de calidad. --> La herramienta, su función --> principal no es encontrar --> anomalÃas de datos, --> aunque te da un pequeño --> módulo para poder, --> digamos, encontrar --> si existe alguna anomalÃa. --> Por ejemplo, si un dato no está --> en el formato indicado. --> Eso te lo promete la herramienta, pero su función --> principal no es esa, aclaro. --> Si te vas a meter mucho con calidad de datos, --> ahà tienes varias herramientas, herramientas --> que van desde el Talent Data Quality, --> otra herramienta que se llama el --> Talent Data Preparation, el Talent Data Quality --> es más técnico, el Talent Data Preparation --> no es tan técnico. --> Herramientas de curación social como --> Tilo Talent Data Stewards, que te va a --> ayudar en esa parte, pero, --> aclaro, se puede hacer --> algunas cositas con la herramienta de calidad, --> pero su función principal no es --> determinar anomalÃas que puedan tener --> los datos. Se puede decir, pero no es su función --> principal. --> Y aquà voy a mencionar este concepto --> que se llama arquitectura --> empresarial, básicamente --> para entender lo siguiente. --> La herramienta tiene una sección --> que se llama arquitectura empresarial, --> en el cual yo no estoy --> muy de acuerdo con el nombre, --> porque --> la arquitectura empresarial --> que --> uno de los marcos más usados --> se llama TOGAF, básicamente --> busca --> digamos --> sincronizar la estrategia --> de negocio con la tecnologÃa. --> Eso --> no es tan fácil de hacer. --> Es como yo --> alineo esa estrategia --> con la tecnologÃa y no es tan fácil --> en ciertos casos. --> Necesita mucha madurez en el mercado. --> Yo creo que yo tengo un ejemplo --> claro de cómo la tecnologÃa --> no se alinea con la estrategia. --> Yo he trabajado en algunas universidades --> de la región y lo habÃa comentado. --> Y en esas universidades, --> digamos --> que las universidades --> para ser franqueadas --> a nivel mundial y bueno, --> especÃficamente en Colombia, --> hay un factor de predominante que es --> la investigación. Y en esa investigación --> es cuántos artÃculos y cuántos impactos --> ha tenido sobre artÃculos. Entonces --> la universidad patrocina mucho en que los --> docentes escriban muchos --> artÃculos. --> En que desde mi punto de vista, --> eso es un negocio. --> Un negocio porque --> eso digo en el caso de Colombia, siendo una crÃtica --> corruptiva a la educación, --> tú terminas es --> yo te meto en mi artÃculo y tú me metes --> en mi artÃculo. Y al final --> según la persona que usted metió --> no sabe nada de eso. Lo que quiere --> es tener simplemente que escribió un artÃculo --> para poderse rankear y pagarle más en la universidad. --> Entonces al final --> tengo un conjunto de personas que escribió un --> artÃculo que no sé si saben --> o no saben lo que dice ahÃ. Y segundo --> que usted para publicar un artÃculo tiene que pagarlo. --> Pero usted le está pagando --> en el caso de Colombia, hay --> revistas que le están cobrando 20, 25 --> millones de pesos. Pero si entonces dice --> al final un negocio, --> lees la revista, tú le pagas para que te publique, eso no tiene sentido. --> Al final termina siendo un negocio --> la revista. Entonces creo --> que esa parte no --> no confÃo mucho en ciertos artÃculos --> que están ahà en el mercado. Entonces --> la universidad querÃa --> entender qué hacÃan los docentes --> en sus tiempos. --> O sea, cómo es la productividad, que ya meà esa productividad --> del docente para poder --> definir estos artÃculos diciendo --> bueno, pero si, ¿por qué no le da tiempo --> de escribir un artÃculo a un docente? --> Como dato particular, --> el caso --> de Colombia y creo que se podÃa --> extender a ciertos paÃses de Latinoamérica. --> Colombia es el paÃs que más trabaja, --> pero que menos produce. --> Usted dice, ¿cómo asÃ? Más trabaja, pero menos produce. --> Claro. Lo que pasa es que Colombia --> no entra a las ocho de la mañana, --> pero a las ocho de la --> mañana no empieza a trabajar. --> Empieza a trabajar a las nueve y media. --> Es decir, a las ocho empieza a echar cuenta de --> que si hubo un partido a Selección Colombia, empieza --> la Selección Colombia y todo lo que le pasó a su vida. --> O sea, no empiezas ocho en punto. --> Eso indica en que como empieza una hora más tarde --> a las nueve, no sale a las seis, --> que es tÃpico, sino sale a las siete de la noche. --> Entonces trabaja más, pero produce menos. --> Claro. Porque en teorÃa está más --> en la empresa, pero en realidad no está trabajando, --> pierde mucho tiempo. --> El europeo y el gringo es diferente. --> El europeo es el gringo --> más especÃficamente. Ese señor, --> el gringo clásico norteamericano, ese señor --> es, no es como latino jovial --> que habla mucho y echa cuenta. No, ese señor está --> dedicado exclusivamente a trabajar. --> Entonces es muy riguroso una empresa --> en Estados Unidos. Hay muchos, no hay --> esas amistades, no son tan fuertes como la parte --> latina. Entonces ellos sÃ, --> evidentemente trabajan menos en horas, pero --> producen más porque todas las horas que están ahà son dedicadas --> justamente a trabajar. --> Entonces, querÃa medir --> y la estrategia era poder medir, --> bueno, en la productividad, --> va al nivel táctico y el --> táctico propone tecnológicamente --> comprar un huellero. Un huellero en --> Colombia es, usted entra en una empresa, --> pasa su huella y esa huella --> lo único que va a marcar es la hora de entrada y hora de --> salida. Entonces, --> ahà no hay una alineación de lo que buscaba --> estrategia con la tecnologÃa, --> porque no hay garantÃa de que si usted llegó --> temprano a las 8 de la mañana, usted --> en realidad que estaba trabajando esas --> horas allá adentro. Porque fácilmente --> entró, se sentó, pero --> no hizo nada. Entonces, hay un claro --> ejemplo en que no hay una alineación --> de tecnologÃa con esa estrategia. --> Entonces, la arquitectura empresarial está pensada para eso. --> le voy a dar porque agregué esta parte. --> Entonces, esa arquitectura empresarial --> se divide en cuatro tipos de arquitectura. --> Tengo esa arquitectura de negocio, --> que es el que define la visión hacia donde vamos --> ahÃ, el CEO, el que conoce la empresa. --> Tengo la arquitectura a nivel de --> TI, es decir, a nivel de infraestructura, --> hardware, software, redes, --> es decir, sistemas operativos, --> lenguajes de programación, motores de base de datos. --> Tengo la arquitectura de datos, --> que es la interesante, que define la --> estructura y el flujo de datos en la --> alineación, que datos son necesarios para cada --> elemento, y está la --> arquitectura de aplicaciones. En esa arquitectura --> de aplicaciones, lo que --> hago es que sistema de información voy --> a montar que apoyen --> la estrategia de negocio que tenga la empresa. --> Esto lo menciono simplemente --> porque, dese cuenta, --> en que esta arquitectura está compuesta --> por cuatro, y en realidad que hay un marco, --> hay un marco de desarrollo --> que indican cómo va implementada --> esta arquitectura. Entonces, el software --> tiene una sección que dice arquitectura --> empresarial, y yo no estoy --> muy de acuerdo con ese concepto porque --> para mà es un diagrama arquitectónico, --> no es una arquitectura --> empresarial. Tenga presente --> estas cuatro y ustedes, de su punto --> de vista, me dirá si está bien el nombre o no. --> Por último, entonces, --> tenemos el concepto de lo que es --> el catálogo de datos. Básicamente es un --> inventario de tus --> metadatos. ¿Cuál es el tipo --> de metadatos? Se lo mencioné anteriormente. --> Técnico, de negocio --> y operativos. --> Son los tres tipos de metadatos --> que te va a manejar cualquier herramienta --> de catálogo de datos. --> Esos tres tipos como tal. --> Y por último, --> esta parte del concepto de glosario --> de términos es la definición --> de los términos y conceptos --> que tienes en tu empresa --> con el objetivo en que se hable --> exactamente el mismo idioma --> para todas las partes. --> Por ejemplo, en el caso de sistemas --> de nuestra carrera --> es un poco más compleja. --> A veces los contextos --> no me ayudan mucho. --> Por ejemplo, --> yo he trabajado en algunos --> trabajos --> en otros paÃses. Por ejemplo, el caso de --> trabajé una vez --> para Inglaterra --> y lo que me pillaron ahà --> textualmente era implementar --> una base de datos. --> Entonces, esa implementación de esa base --> yo entendÃa que yo iba --> a hacer el diseño --> de la base de datos a partir de unos requisitos --> e iba a montar esa base de datos --> en el motor que yo quisiera. --> Entonces, yo ese trabajo, --> yo apliqué --> ese trabajo. --> Noté que la suma de dinero --> que yo pedÃa era muy pequeña comparada --> con las demás y me han contratado --> a mÃ. --> Cuando yo hago la entrega, me dice el cliente --> eso no está incompleto. --> ¿Por qué? No, porque lo que yo quiero --> es un sistema de información. --> Prácticamente, no me voy a decir, era un sistema de información. --> Es decir, me tocaba definir la base de datos, --> me tocaba definir las interfaces gráficas --> y la conexión y todo, o sea, todo. --> Entonces, ahà hay un problema y la carrera --> tiene cinco pendientes. Hay veces, hay unos conceptos --> que en algunos paÃses --> son diferentes --> y se pueden entender de diferentes. --> La idea de un glosario de términos --> es que todo maneja en el mismo idioma. --> Además, si tú ves la que tú pensas --> de TOGAF, TOGAF tiene un --> glosario para que todos --> independientes del paÃs hablen exactamente --> lo mismo, que cuando hablen de un concepto --> técnico independiente del paÃs --> se hable exactamente y se entienda que es --> ese mismo independiente donde estés. --> Bien, esto entonces --> te va a mejorar mucho la comunicación --> y ya, pues creo que usted es más experto --> de esa parte. Eso es la --> introducción inicial. Ya vamos aquÃ, ya --> nos vamos a meter con la herramienta ya más --> especÃficamente, un poco más teórica aquÃ. --> Listo, entonces. --> Ahora sà nos vamos con la herramienta --> Talent Data Catalog como tal. --> Primero, --> la herramienta tiene --> tres versiones, una versión que llaman --> Standard, una versión que se llama --> Advanced y una que se llama Advanced Plus. --> Actualmente --> usted tiene la Advanced. --> Esa Advanced --> nos va a limitar --> con algunas cosas. --> Y más especÃficamente de esta --> forma. Seguramente ya tú tienes --> algunos metadatos, algunos glosarios --> y notarás que la estructura --> de datos de esos glosarios pueden variar. --> Digamos, tiene un glosario de ventas, --> un glosario de clientes, no sé, cualquier --> locura acá. Y esas estructuras --> de datos de lo que tú vas a guardar en --> el glosario pueden variar, porque cada glosario --> puede ser muy diferente. --> Con la Advanced no --> podÃamos definir una estructura para cada --> glosario. Entonces tú desde ya --> tienes que ir pensando. Bueno, yo tengo un --> glosario de términos, tengo unos metadatos, --> pero esos metadatos no todos son --> iguales. Y partimos del hecho en que no puedo --> crear una metadata particular --> para cada glosario, entonces me toca definir --> una metadata genérica. --> En poca palabra, un modelo de datos genérico --> que englobe cualquier tipo de glosario. --> Entonces al final te puede quedar --> una estructura muy grande --> para glosarios que puede ser un poco más compleja --> de entender. Eso es para cuando veamos --> a nivel práctico, vas a comprender --> mucho más. --> Listo, esas son las tres versiones que tú tienes actualmente --> en la Advanced como tal. --> Básicamente lo que --> va a permitir la herramienta a nivel --> de usuario final es poder --> descubrir datos. --> Más especÃficamente --> cualquier metadato, ya sea técnico --> de negocio --> o operativo como tú quieras llamarlo. --> Te va a permitir --> perfilar los datos, es decir, ahora --> los datos los puedes catalogar. --> ImagÃnate lo siguiente, --> tú tienes por ejemplo --> GDPR --> y en GDPR tú puedes --> catalogar algunos tipos de datos, por ejemplo tipos de datos --> personales, tipos de datos --> sensibles como por ejemplo que puede ser la historia --> médica de un usuario, entonces tú puedes --> perfilar esos datos y la herramienta te va a ayudar --> a perfilar esos datos. --> Te va a permitir organizar --> y te va a permitir documentar esos datos de manera --> mucho mejor, porque ahora la organización tú puedes --> buscarlo como tú quieras y vas a ver --> unos gráficos que te van a permitir --> entender esos datos --> en la organización que te presenta la herramienta. --> Ahora básicamente --> al final lo que buscamos --> con este tipo de proyectos de catálogo de datos --> es primero entender --> qué significan los datos para ti. --> Lo tanto para ti, bueno para cualquier --> empleado de tu empresa. Segundo --> de dónde provienen esos datos --> y hacia dónde van esos datos. --> Quién posee --> esos datos y quién tiene --> acceso a esos datos. --> Y cómo deben utilizar los datos. Entonces aquà ya tienes --> el inventario completo, el significado --> de dónde proviene, quién lo --> tiene, si está en una base --> de datos, si está en un data lake, cómo --> impactarÃa pasar un data lake --> de un S3 que tengas de pronto --> a un Azure, cómo se están trabajando. --> Entonces tú puedes entender muy fácilmente --> cualquier tipo de proyecto que tú quieras --> implementar hoy en dÃa. --> Bueno, sus funciones son principal --> descubrimiento, descripción de los datos --> y linaje como tal. --> Y ahora hay algo muy --> particular de la herramienta. La herramienta --> le va a permitir manejar el concepto de --> versiones. Ese concepto de --> versiones se ve mucho mejor con el ejemplo. --> Ese concepto. --> Pero ahora ve una versión de la siguiente --> forma. Tú tienes una tabla --> clientes, el cual tiene --> identificación, nombre y apellido. --> Digamos, a lo largo --> del tiempo tú puedes agregar --> más datos de clientes. Por ejemplo, lo que tengo yo --> teléfono. Entonces --> una versión uno puede ser cuando --> tenÃa los metadatos con los tres --> columnas. Y la versión dos --> es cuando tenga los metadatos con las cuatro --> columnas. Más o menos ese es --> el concepto de versión. Eso te va a permitir --> entender cómo ha sido el flujo --> de cambios en tu empresa. --> Te va a permitir ahora --> la gestión de acceso. Decir --> quiénes acceden a este catálogo y --> quiénes tienen permisos de ver esos datos. --> Y por último te va a permitir colaborar. --> ¿Por qué? Porque cualquier cosa que tú --> encuentres, podÃas compartirlo con otros usuarios --> que estén en la herramienta del --> talent data catalogo. --> Bueno, aquà ahora vas a --> encontrar entonces --> esos silos de información que puedes tener en diferentes --> sucursales. Ahora vas a tener uno solamente fuente de verdad. --> Vas a tener un solo inventario --> que te va a decir, si está bien o no, --> si las polÃticas están bien implementadas. --> Si te va a decir una fuente de verdad --> de esos metadatos que vas a tener. --> Vas a demorar --> menos tiempo buscando metadatos --> o datos como tal. --> Y vas a fomentar --> a utilizar esto --> en otros proyectos. No solamente de pronto --> quizás iniciarte el proyecto para --> un área, pero seguramente cuando --> veas las ventajas vas a pensar en definir --> proyectos a futuro para otras --> áreas del mercado como tal. --> Esta es la venta, esta es la --> ventana --> inicial del --> software. Esto es lo --> que se llama un, para ellos esta --> ventana inicial la llaman un dashboard. --> En ese dashboard hay --> unos elementos especÃficos que están por defecto. --> Tenemos un menú --> acá horizontal en la parte --> arriba y tengo unos enlaces. --> Y vea que en el enlace aparece el concepto --> que se llama arquitectura --> empresarial. --> Listo. --> ¿Qué seguimos? Ahora --> la --> ya ahora como tal la herramienta --> va a definir el concepto de --> objeto. Un objeto --> es cualquier metadato que tú tengas. --> Que pueda ser metadatos que --> obtengas a nivel de almacenamiento. --> Por ejemplo, que lo tengas guardado en una tabla, --> en un archivo, en un data-lay, --> en un data que son los archivos que manejan --> para --> estas redes sociales. Entonces --> tú puedes mantener objetos de ese tipo. --> Puedes mantener objetos a nivel de --> los esquemas, tablas, --> informes, archivos. --> Cuando digo informes ahà son PowerBee, --> Tableau, --> Quick. Puedes ahora --> agregar objetos --> que lo llaman herramienta --> objetos a nivel de flujo de datos. --> Es decir, todos los --> objetos. --> Puedes tener objetos --> a nivel de --> descripciones, --> columnas o etiquetas que quieras --> mencionar. --> Listo. --> Entonces aquà --> esto te lo voy a --> mostrar a nivel --> de implementación. --> Pero aquà me tomé la libertad --> de hacer un flujograma, --> un diagrama de flujo --> de cómo --> la herramienta funciona o cómo --> la herramienta trabaja. --> Entonces, todo esta parte --> teórica que tengo aquÃ, que --> configuraciones, worksheet, como --> tal. Todo esto que está aquà --> vamos a tomar --> la herramienta y voy a complementar --> con la herramienta a nivel práctico --> y me devuelvo a la parte --> de la presentación y podemos ver --> entonces la teorÃa y la --> práctica al mismo tiempo. --> Entonces, ¿qué vamos a hacer ahora? --> Ahora sÃ, --> vamos a acceder a la herramienta --> por favor, a la máquina virtual para --> algunos. Sé que --> otros van a --> decidir --> montarlo de su máquina --> original, pero --> por lo menos necesito que alguno se --> conecte a su máquina virtual --> para poder ver, yo --> debido a que no puedo acceder al software como tal. --> Daniel, --> no sé si me das, veo que estás --> conectado, no sé si me permites --> te guÃo --> y nos va mostrando el software como tal. --> Sé si hay problemas --> en tomar tu pantalla y poder visualizarla. --> Listo, --> perfecto. --> primero, vayamos, --> vamos a definir --> entonces los siguientes --> conceptos. Cuando yo diga, vayamos --> al home --> de la herramienta, vamos a hacer lo --> siguiente. --> Daniel, ¿notas que en la parte superior izquierda --> hay una T que tiene un color como --> salmón o rosado, ¿no? --> Al ladito hay un cÃrculo que tiene como --> un libro dentro, dale click ahÃ. --> Cuando yo diga home, es que nos vayamos --> ahÃ, dale click ahÃ. No, en el --> en el librito, en el cÃrculo, --> en el de al lado. --> Ahà también te da, bueno, perfecto. --> Entonces, eso te lleva al home. --> El caso de Arturo, --> por favor, escoge la última --> opción. Arturo, --> Arturo, voy a mostrar tu pantalla, por favor, para que --> Denise seguÃ. --> Denise y Arturo están en esta pantalla. --> Por favor, --> escogen, dale doble click al --> test job migration, que es la última opción --> que está ahÃ. Al final, --> en el listado, dale click a ese. --> Perfecto, y estamos --> exactamente en la misma ventana que --> está Daniel. --> Entonces, cuando yo diga al home, se van --> a esa parte y nos va a mostrar, --> esto se llama el dashboard. --> El dashboard está integrado entonces --> por los elementos que voy a mostrar aquÃ. --> Por defecto, tengo unos enlaces --> y tengo la palabra worship y --> dashboard. --> Listo. --> Sigamos entonces. --> Daniel, si eres tan amable, --> dale click abajito en el menú object. --> Dale click, --> por favor, esto es --> click ahà para expandir ese menú --> que tienes ahÃ. --> Estos objects, ¿qué son? --> Fue lo que mostré teóricamente. Un object puede ser --> una metadata que tomé --> de una tabla, --> una metadata que tomé de un archivo --> en un data lake, una metadata que tomé --> por ejemplo de un --> job en talent studio --> o una metadata que tomé de un glosario. --> Entonces, ese menú que está ahà me va a permitir --> encontrar los diferentes objetos --> que he creado como tal. --> Dale click, por favor, --> al siguiente. --> Dale click en --> colección. --> Listo. --> Entonces, pre-tradición a lo siguiente. --> Estamos en la herramienta. La herramienta --> tiene el concepto --> que se llama configuración. --> ImagÃnate la configuración --> como una carpeta --> donde yo voy a guardar todos los --> objetos de mi proyecto. --> Nuevamente, la herramienta --> maneja el concepto de configuración. --> Imagina la configuración como --> una carpeta donde yo voy a --> colocar todos los objetos de mi --> proyecto. Ahora, --> ¿qué es una colección? --> Imagina la colección como si fuese una --> subcarpeta dentro --> de la carpeta más grande del proyecto --> donde yo pueda agrupar, por ejemplo, --> subproyectos o pueda agregar --> elementos que tienen caracterÃsticas --> comunes. Entonces, configuración --> es como si fuese la carpeta --> dentro de los objetos y colección --> una subcarpeta que va a permitir agrupar --> los objetos. --> Vete a donde dice worship, --> por favor, click ahà en worship --> al ladito. --> ¿Qué es worship? --> Worship qué es? Va a ser la --> consulta que tú vas a hacer --> en la herramienta de catálogo de datos y que esa --> consulta tú la puedas compartir con otros --> usuarios. Eso es lo que es un --> worship. Vete a donde dice --> dashboard, por favor, click en dashboard. --> Click ahÃ, por favor. --> ¿Qué es dashboard? --> Dashboard simplemente es la --> interfaz gráfica --> de cómo tú quieres --> o qué elementos tú quieres mostrar, por --> ejemplo, cuando tú inicias --> el talent data catalog. Dese cuenta que --> por defecto me aparece un menú de acceso --> directo que dice welcome data catalog, --> me aparece worship y me aparece --> dashboard. Pero quizás tú --> quieres quitar esos elementos y te --> aparezca algo diferente. Entonces dashboard --> simplemente es la interfaz gráfica --> que te va a permitir configurar --> y agregar los elementos que tú quieres --> ver en la pantalla inicialmente, --> en esta pantalla que estamos actualmente. --> Y vete a donde dice manage, --> por favor. --> Dale click en manage. --> Y aquà --> nos vamos a dividir un poco. --> Porque aquà podrÃamos --> pensar en dos tipos de usuario, --> de la herramienta como tal. --> Un tipo de usuario netamente administrativo --> de la herramienta y un usuario --> final de la herramienta. --> El administrativo le va a tocar hacer --> varias cosas. Entre esas, por ejemplo, --> la que hizo la persona --> de su empresa, que fue la que --> creó los usuarios --> y le definió los permisos. --> Ese es un usuario netamente administrativo --> de la herramienta. Ahora, --> esa persona seguramente no va a definir --> modelos de datos, --> metadatos a nivel técnico, operativo, --> de negocio. No es su función. --> Su función principal es, bueno, configurar --> la herramienta para que aquella persona que va a --> crear los metadatos tenga los permisos --> correctos para crear los elementos que necesita. --> Este perfil administrativo --> no lo voy a explotar tanto --> porque ya la herramienta tiene algunos --> elementos configurados y podrÃamos --> dañar alguna cosa que sea ahÃ. Entonces, --> lo que sà voy a hacer es que --> les voy a decir teóricamente qué es lo que hace --> cada cosa y qué podÃa configurar --> con esos elementos a nivel administrativo. --> Entonces, aquà creo --> que la mayorÃa vamos a ser usuarios finales, pero --> de todos modos te voy a indicar --> si vas a ser administrador cómo vas --> a tener que administrar como tal --> la herramienta. --> Listo, perfecto. --> PermÃtame un momento --> ahora. Voy a abrir acá un archivo --> y vamos a crear --> nuestro primer proyecto --> de catálogo de datos. --> Es claro lo siguiente, --> para tú empezar un proyecto de catálogo --> de datos --> tú tienes que definir --> pues una planificación y el proyecto --> como tal. Quiere decir que la herramienta --> parte del hecho --> en que ya tú tienes --> definido un proyecto de catálogo --> de datos. O sea, no va a --> empezar por sà sola como tal. --> Listo, entonces, para esta parte --> voy a hacer lectura --> de este caso de estudio. --> Dice lo siguiente, --> descripción de la empresa --> Acme Sportingwear --> es una empresa de venta de ropa --> deportiva con presencia en Europa --> y Estados Unidos. --> Perfecto. --> Vende sus productos a través --> de su sitio web y tiendas fÃsicas. --> Y almacena información --> sobre sus clientes, pedidos --> y productos en una base de datos. --> Problemas --> que tiene la empresa hoy en dÃa. --> Falta de visibilidad y control --> sobre los datos de clientes --> y pedidos. No sabe --> qué datos está manejando cada sucursal. --> Tengo varias sucursales independientes --> pero cada --> sucursal maneja los datos de forma --> diferente o tiene datos diferentes. --> Dificultad para analizar las ventas --> y el comportamiento de los clientes --> en diferentes regiones. --> Incoherencia de la calidad --> y significado de los datos. --> Y pérdida de tiempo y recursos --> de la gestión manual de los datos. --> Hay un problema --> en que no sé qué datos está manejando. --> Por ejemplo, tengo unos informes --> y no sé esos informes --> qué datos está tomando la base de datos --> si en realidad hay una transformación de esos --> datos porque hay unos reportes que tienen --> algunos errores. Entonces --> tengo algunos inconvenientes. --> Solución. --> Implementación del TDCC. --> Aquà le coloque 2C. --> La segunda C es de Cloud. --> Talent Data Catalog Cloud. --> Para centralizar la gestión de los metadatos --> de las tablas. Ahà me coloca los --> nombres de las tablas. Implementar --> un gobierno de datos efectivos para garantizar --> la calidad y significado de los datos. --> Y facilitar el acceso --> y la colaboración en torno a los datos --> de clientes y pedidos. --> Y obtener información valiosa --> para la toma de decisiones estratégicas. --> Eso es lo que estamos buscando --> en el proyecto como tal. --> Ahora, permÃtame --> y voy a dibujarle el diagrama --> de cómo estamos actualmente en esa --> empresa. Entonces, permÃtame y voy a crear --> aquà un flujo de gramo. --> Un diagrama de flujo. --> Listo, voy a crear aquà un nuevo diagrama. --> Listo. Perfecto. --> Entonces, actualmente --> la empresa tiene montado --> un data lake. --> Un data lake. --> Un data lake. --> Este data lake lo tiene montado --> especÃficamente en un S3. --> Bueno, --> AWS3. --> Fácilmente puede ser tu empresa y yo creo que --> tu empresa lo tiene montado, si mi --> cálculo no le falla, lo tiene montado --> sobre --> Azure, tu data lake. --> Me parece a mi creo. Listo. --> Hay una base --> de datos --> en que tenemos --> estos datos que están acá arriba --> en el data lake. Y ahora --> estos, hay un job, --> hay un pipeline, hay un workflow --> que son palabras exactamente iguales --> para lo mismo prácticamente. --> Lo que pasa es que, por ejemplo, AWS --> llama pipeline a su job. --> Talent Studio llama los job --> job. Creo que Power Centro --> llama workflow. No recuerdo --> bien los nombres, pero es lo mismo al final. --> Entonces tienes acá un job. --> Voy a colocar aquà --> job para ver si me sale. --> Básicamente este job --> que está aquà es un ETL. --> Un job ETL que lo que está haciendo --> es tomo los datos de acá de TS3 --> y lo lleva acá a una --> base de datos. --> Ten en cuenta que esa base de datos la tienes --> replicada en diferentes partes a nivel mundial. --> Ahora, --> tenemos como hacemos para explotar --> esta base de datos. Entonces tengo --> unos informes que los tengo --> presentado en Tableau. --> Tengo aquà una --> tablita. --> Tableau se conecta a esta base de datos --> y Tableau, lo que está --> haciendo actualmente, --> es que muestra unos reportes, --> unos cuadros de mando --> a las diferentes personas --> encargadas de tomarte ediciones. --> Entonces, hay unos problemas a nivel --> de calidad. Hay unos problemas --> en que no sé qué campos --> maneja Europa, qué campos maneja --> Estados Unidos. No sé --> si el reporte está tomando los datos --> y qué datos está tomando de base de datos. --> No sé si en realidad que el job que --> está tomando los datos de TS3 --> a la base de datos lo está transformando --> y si lo está transformando bien. --> Porque puedo tener algunos errores de pronto acá --> a nivel de Tableau --> y de pronto el error que está mostrando aquà --> no es un problema ni directamente de base de datos, --> sino de pronto que el TS3 está malo. --> O sea el Tableau tiene el archivo --> malo. Bueno, tantas cosas pueden pasar --> aquÃ. --> Este serÃa el flujo de trabajo --> que vamos a resolver entonces. --> Listo. Vamos --> a la herramienta como tal. --> Me voy nuevamente ahora con Daniel --> que es muy amablemente. --> Daniel, te digo Daniel o te digo Giovanni, qué pena --> que noté que tu Daniel --> parece acá como Daniel. --> Listo, todavÃa no hay --> problema entonces. --> Primera pregunta que te vas a hacer. --> Ya tengo el proyecto de planificación. --> Ya entiendo cuáles son --> los problemas. --> Y listo. ¿Cómo hago para empezar --> un proyecto de catálogo de datos --> en la herramienta? --> Entonces, mi recomendación es --> vamos a crear una carpeta --> y en esa carpeta vamos a mantener --> todos los objetos del --> proyecto. --> Entonces, por favor, vayamos --> todos al siguiente menú. --> Vayamos entonces, cuando yo --> diga, vayamos al repositorio, --> significa que tienes que entrar al menú --> Manage y vas al menú --> que dice repositorio, por favor. --> Si eres tan amable. --> Y listo. --> Se ubicas ahà en el repositorio. --> Voy a --> verificar. PermÃtame. Voy a abrir acá --> un archivo --> para guiarme porque no tengo --> el software. Entonces, --> perdón. --> Listo. --> Me espera un momento, por favor. --> Listo. --> Ahora voy a verificar entonces --> si estamos --> en el caso tuyo, Arturo. --> Por favor, vete al menú --> repositorio. --> Que voy a salirte. --> Bien. Entonces, --> vamos a crear una carpeta. --> Para crear la carpeta, nos ubicamos, --> si eres tan amable, Daniel y todos, --> a la plaga repositorio que está ahà arriba --> del lado izquierdo, dale click ahà --> y le da click derecho. --> Click primero para seccionar, click derecho ahora. --> Te aparece un menú --> que dice new. Vete al new --> y le dices folder, por favor. --> Coge la opción --> folder. --> Y muy importante, vamos a llamar este --> folder para que sea muy rápido --> y muy fácil para --> la persona que está administrando al final del curso --> sepa qué es lo que va a borrar. Vamos a --> llamar el folder de la siguiente forma. --> Lo vamos a llamar --> test --> llámalo --> test --> underscore --> o rayita piso --> rayita --> rayita --> en la carpeta contenedora de --> los proyectos del curso --> talent data catalogo. Entonces, --> ya yo le pudiera indicar a la --> persona que es mi intrecirle, --> mira, borra de todas las --> carpetas que empiezan por --> test. Todos, por favor, --> vamos a ver si todos seguimos --> test guión piso o de record --> curso on record Daniel. --> Démole, OK, por favor. --> Perfecto. --> Bueno, creo que ya aclaro que --> aquà solamente veo las pantallas --> de la maquina actual, entonces, --> quizás haya alguien que no no --> lo hizo y no lo puedo ver si no --> lo si tiene algún problema me --> avisas porque no estoy viendo --> sus pantallas entonces cuando --> están trabajando ya directamente --> en su máquina. Listo, --> esta carpeta la creamos para --> organizar y meter todos los --> objetos del proyecto en --> cuestión. Ahora, --> lo siguiente, si el proyecto --> es nuevo, o si vas a definir un --> proyecto para un ambiente de --> desarrollo, sea desarrollo o --> producción, en estos dos casos --> vas a crear una configuración --> nueva. Nuevamente repito, si --> el proyecto es nuevo o lo que --> vas vas a definir es un --> proyecto a nivel de un --> ambiente de desarrollo, sea --> developer o producción, vas a --> crear una configuración. Te --> habÃa confi, te habÃa hecho la --> analogÃa, una configuración es --> como si fuese la carpeta que --> va a contener todos los --> objetos, ¿SÃ? Pero --> internamente para el señor --> Talendata Catalog. Esa --> herramienta que está acá para --> verlo visualmente, pero él --> ahora los objetos los une a --> través de una configuración --> interna. Entonces, para crear --> una configuración, vamos a lo --> siguiente. Se sitúa --> justamente en el nombre de la --> carpeta que creó y le va a --> dar clic derecho vamos al menú --> new y vamos a donde dice --> configuración por favor, --> escogemos la opción --> configuración --> vamos a llamarla todo --> exactamente igual, llama todo --> minúscula, ¿OK? Daniel, TDC, --> de tal en atacar las siglas, --> TDC, underscore, configuración, --> underscore, tu nombre. En ese --> caso no le vamos a agregar --> descripción. --> OK, perfecto. ¿Por qué creamos --> una configuración? Porque vamos --> a crear un nuevo proyecto. La --> configuración lo que va a --> mantener unido son los --> diferentes objetos --> internamente y la carpeta lo --> que me ha prometido que --> sale visualmente. Aclaro, --> tú puedes tener un proyecto --> que tenga objetos que --> tengan diferentes carpetas. --> Por eso creamos una carpeta --> de todos uno, una única --> carpeta de todos, de tal --> forma en que los objetos que --> creemos, cada quien pues no --> interviene con los objetos --> que crea otro usuario. --> Perfecto. Ahora, sumamente --> importante lo siguiente ahora. --> Cuando en el menú la parte --> superior derecha va a --> encontrar ahà un avatar, --> eso lo voy a explicar más --> tarde, pero antes del avatar --> aparece un combo voz que --> parece una, una, ella aparece --> como una pequeña flechita. --> Si le alcanzas a ver a Daniel --> superior derecha, al lado del --> avatar, vas para derecha, --> en la, en la, a la punta --> derecha, ves el avatar ahà --> que está como el, el usuario --> y dice test John Migración. --> SÃ, ¿Viste dónde dice test --> John Migración? Creo que --> todos estamos ahÃ. Dale click --> ahÃ, por favor, clic ahà y --> se va a expandir un menú. --> Ojo a lo siguiente, ese test --> John Migración me va a --> explicar en qué configuración --> estoy conectado actualmente. --> Como la idea es que cada uno --> eh vamos a crear un proyecto --> diferente, cada uno nos vamos --> a conectar a la configuración --> que hicimos. En el caso --> particular de de Daniel, --> serÃa a TDC configuración, si --> no aparece, dale more, --> por favor. Si no te --> aparece, dale more. Y busca --> tu configuración que se llama --> TDC. Debe estar abajo. Ah, ahà --> está, TDC, por favor, escójela, --> selecciona y dale, creo que --> doble clic te da. Vete a --> repositorio, cuando yo diga --> repositorio, manage, --> repositorio. Compruebe, por --> favor, que en la esquina --> superior derecha, le aparezca --> justamente la configuración --> que usted creó. --> Perfecto, comprobamos que es --> la configuración. Entonces, --> cuando vaya a acceder a el --> curso, el dÃa lunes y el dÃa --> martes, asegúrese, por favor, --> en que esté ubicado en la --> configuración suya. O más --> precisamente, a nivel dÃa de --> producción, que esté --> configurada, que esté en la --> configuración del proyecto que --> usted quiere trabajar. Bueno, --> hagamos un pequeño break de --> diez minutitos y volvemos --> entonces para continuar. Voy a --> buscar un poquito de café --> y volvemos en diez --> minutitos, ¿OK? --> Vamos a ver. --> Vamos a ver. --> Vamos a ver. --> Vamos a ver. --> Vamos a ver. --> Vamos a ver. --> Vamos a ver. --> Vamos a ver. --> Vamos a ver. --> Vamos a ver. --> Vamos a ver. --> Vamos a ver. --> Bueno, continuamos. ¿Estamos --> ahà conectados? SÃ. --> SÃ, sÃ, sÃ. Por favor, --> Daniel, antes, vete, dale clic --> en el nombre de la --> configuración, no en el número --> ese que está ahà en la fecha, --> sino arriba, en el nombre de --> la configuración que dice, --> TDC Configuration, Daniel. --> Dale clic ahÃ. Del lado --> izquierdo. --> Ah, perdón, tenÃa el... --> Estaba en silencio. --> Bueno, volvimos nuevamente. --> Daniel, si él está amable, --> en el repositorio, o sea, --> del lado izquierdo, dale clic --> en el nombre de la --> configuración, si él está --> amable. --> En el nombre dice, --> TDC Configuración, Daniel, --> dale clic, por favor, --> inicialmente ahÃ. --> Listo, empezamos entonces --> con esta parte. --> Cuando creas un oqueto --> en la herramienta, sale --> en unos menús que van a ser --> muy comunes. --> En primer lugar, aparece --> entonces el overview, que --> da un resumen del ojeto. --> Ese menú es común. --> Va a aparecer la descripción, --> que tú puedes agregar una --> descripción, por favor. --> Si está amable, Daniel, --> coloca entonces, descripción. --> Configuración de un proyecto --> de ejemplo. --> Y cada vez que tú haces un --> cambio, tienes que darle --> safe del lado derecho. --> Si notarás del lado --> derecho, te aparece un --> safe aquel lado. --> Perfecto. --> Me queda un momento con --> ese menú. --> Entonces, si está viendo mi --> pantalla, le habÃa dicho que --> voy entonces a ligar los --> conceptos de herramienta con --> la parte teórica de acá. --> Nota que ahà aparece en la --> parte de abajo de la --> descripción, que está --> apareciendo, aparece un --> label. --> Los labels son un elemento --> para que usted pueda --> documentar ciertos objetos que --> define la herramienta o que --> se define la herramienta como --> tal. --> Básicamente, un label es una --> etiqueta. --> Y con esa etiqueta, yo puedo --> hacer búsqueda. --> ¿Qué me va a permitir eso? --> Pues como lo estaba --> diciendo, mejorar las --> búsquedas y la revisión --> y me va a pedir centralizar --> en el proyecto los --> diferentes labels. --> Dele click, por favor. --> Ahora sà al label. --> Si es tan amable. --> Ahà hay un combo voz. --> Dale click al label. --> Dale click, por favor. --> Nota que aquà hay unos --> labels que ya están --> definidos. --> Esos labels se nos quedaron --> del otro curso, pero los --> labels que... --> Eso que hice anual, --> solicitud, no son... --> No deberÃan estar ahÃ. --> Fue del curso pasado que se --> agregaron ahÃ. --> Pero hay unos labels que ya --> están definidos que se --> llaman de G daños, --> catálogos de G daños, --> datos, etcétera. --> Ahora lo siguiente, por --> favor. --> Vete al menú Manage. --> Vete al menú Manage, --> si es tan amable, Daniel. --> Y hay una opción que dice --> labels. --> Si los ves ahÃ, --> dice labels. --> Dale click en labels. --> Esos labels que aparecen --> ahà por defecto son los --> labels que están --> agregados acá. --> CaracterÃstica de los --> labels. --> Yo puedo definir labels a --> nivel centralizado. --> Y hay unos labels que son --> muy particulares de la --> configuración. --> Los labels que son --> centralizados, --> significa lo siguiente. --> En que todos los usuarios --> de los proyectos --> obtienen esos mismos --> labels. --> Es decir, que si agregamos --> un nuevo label, --> todos los usuarios --> del Talent Data Catalog --> van a tener esos labels. --> En teorÃa, --> aquà es que lo vemos. --> Tú, --> independiente de la --> herramienta, hay veces que --> la herramienta pues no se --> va a adaptar completamente --> a tu proceso de negocio. --> Tú normalmente --> adaptas tus procesos --> a la herramienta --> como tal. --> Y este no es el caso. --> Entonces tú tienes que --> adaptarla. --> Normalmente, --> según recomendación, --> mira mi pantalla, --> voy aquà a crear un --> archivito notepad aquÃ. --> Según recomendación --> de la herramienta, --> esos labels --> deberÃan decirte a ti --> un estado --> del objeto como tal. --> Por ejemplo, --> lo ideal según lo que --> recomienda la herramienta --> es que ahà aparezca --> label que digan --> en revisión, --> por ejemplo, --> que te diga aprobado, --> voy a colocarlo más grande, --> aprobado, --> que te digan, --> por ejemplo, --> que te digo yo, --> no conforme --> o que te diga --> en desarrollo. --> ¿Cuál es la idea --> al final de la etiqueta? --> En que si yo marco, --> por ejemplo, --> esa configuración --> y digo en revisión, --> yo puedo hacer una búsqueda --> fácilmente y que --> me permita encontrar --> de manera muy rápida --> todas las configuraciones --> que están actualmente --> en revisión --> o yo puedo buscar --> todas las configuraciones --> que están actualmente --> no conforme. --> Esa es la idea --> de ese label --> en que yo pueda --> mejorar --> y encontrar --> más rápidamente --> algunos elementos --> que tienen alguna --> condición. --> Aclaro que --> para el caso particular --> de la forma en que --> está implementado, --> alguno pues seguramente --> en alguna reunión --> concibió que la mejor --> forma --> era definir --> eso que está ahÃ. --> Listo. --> Bueno, --> vayamos nuevamente --> al repositorio --> si es tan amable. --> Vete al repositorio --> al nombre --> de la configuración --> del Eclipse --> nuevamente al nombre --> de la configuración --> y entonces ahà tienes --> esos labels. --> Aclaro, --> hay unos labels --> que son de toda --> la herramienta --> y hay unos labels --> que son de la configuración. --> En el caso, --> por ejemplo, --> si Daniel crea un label --> de tipo de configuración --> solamente aplica --> en la configuración de él. --> Ahora, --> este, --> no vamos a agregar --> ningún label ahà --> o coloque el label --> que se llama --> DG daños catálogo --> por favor. --> DG daños catálogo --> simplemente para la práctica --> de agregar un label. --> Listo. --> AhÃ. --> Dale click --> por fuera de ese --> combo para que --> le tome la... --> Dale en safe --> porque el cambio --> le da safe. --> En pocas palabras, --> si yo intento --> buscar ahora --> todos los objetos --> que tengan el label --> DG daños catálogo --> me va a llevar --> a ese objeto. --> A esta configuración --> que creó Daniel --> y la que hemos creado --> todos actualmente. --> Ahora vete a la parte --> de responsibility, --> al menú del lado --> por favor. --> Responsibilities. --> Por defecto, --> hay --> un conjunto de roles --> que definen la herramienta --> pero esta parte de --> responsabilidades --> se crea --> para definir --> quién tiene acceso --> al objeto como tal. --> Esta responsabilidad --> lo vas a encontrar --> exactamente igual --> independiente del objeto --> que crees --> en la herramienta. --> Ahà vas a definir --> quiénes tienen permiso --> y qué tipo --> de permiso tienen. --> Normalmente, --> eso lo define --> el administrador --> del software. --> Quizás tú eres --> usuario final --> y te dan permiso --> para hacer algo. --> Pero esta parte --> de asignar permiso --> a otros usuarios --> es una tarea --> netamente --> del administrador. --> Más tarde les --> explico --> cómo serÃa --> entonces para --> darle permiso --> a otro usuario. --> Vete a la sección --> de versión. --> Versión. --> Le habÃa comentado --> que una de las diferencias --> que tiene la licencia --> especialmente la estándar --> con la Avance --> es que la Avance --> le permite tener --> varias versiones. --> Ahora, --> lo interesante --> de la herramienta --> es que tú tienes --> versiones por objeto. --> Por ejemplo, --> yo puedo tener --> cinco versiones --> para objeto A --> y cuatro versiones --> para lo objeto C. --> O sea, --> las versiones son --> por objeto, --> no por proyecto, --> no por configuración. --> O sea, --> cada uno va a tener --> su propia versión. --> A excepción --> de los glosarios --> que nada más --> tiene una pequeña diferencia ahÃ. --> Pero note entonces --> que aparece --> una versión --> que esa versión --> corresponde --> con cuando --> se expande --> la configuración --> me coloca un número --> que está ahÃ. --> Ese número --> indica la versión. --> En esa versión --> va a registrar --> todos los elementos --> y cambios que hicieron --> en esa versión --> en particular. --> Listo. --> Dale click ahora --> en lock, por favor. --> Aparece --> la bitácora --> de cambios --> que todavÃa --> no se han hecho nada --> todavÃa, --> prácticamente lo que hicimos --> fue crear --> y vete por último --> al history --> y el history --> le va a servir --> por ejemplo --> a un auditor --> especificar --> qué hizo --> cada quien --> y a qué hora --> lo hizo --> especÃficamente --> en el software. --> Me da de cuenta --> que ahà --> Daniel dice --> Shunata --> Confiratributo --> bueno ahà --> tú puedes hacer --> una auditorÃa --> de qué está haciendo --> cada quien --> dentro del software. --> El caso particular --> pues lo --> acasamos a ver --> porque tenemos --> un perfil --> que es administrador --> que es prácticamente --> dueño de toda la herramienta --> como tal. --> Ahora --> si son tan amables --> denle click --> al --> nombre de la versión --> que serÃa --> cuando se expande --> el TDC --> te aparece --> como si fuese un hijo --> dale click --> acá abajo --> del lado izquierdo --> por favor --> en el nombre --> de la versión --> en el --> en el 2024 --> 1101 --> dale click --> ahà por favor. --> Y ahora --> cada --> objeto va a tener --> su propia versión --> de esta parte --> tengo solamente --> una --> si es tan amable --> del lado derecho --> donde aparece --> el relojito --> le das click --> y si deseas --> un lapicito --> y pon ahà --> este --> desarrollo --> cambia el nombre --> y le colocas --> desarrollo. --> Creo que para mà --> es buena práctica --> dejarle --> esa fecha --> porque vas a ver --> exactamente --> que --> que feches --> hiciste --> los cambios --> como tal. --> Listo --> desarrollo --> 2024 --> dale click --> para ver --> dale click --> por fuera --> o enter --> ah y tiene un chulito --> por favor dale click --> ahà en el --> en el --> aquà te --> recomiendo --> es que --> definas --> un formato --> estándar --> de definir esas --> versiones --> por lo menos --> te recomendarÃa --> que dejar --> la fecha --> para saber --> cuando se --> creó --> el objeto --> o cuando se creó --> esa --> versión de --> ese objeto --> como tal. --> Perfecto --> listo --> hicimos --> la primera parte --> vamos --> con lo --> segundo --> partimos --> del hecho --> en que --> ya tú tienes --> un proyecto --> de catálogo --> de datos --> ok --> ahora vamos --> a definir --> nuestros --> objetos --> de este --> proyecto --> vamos a --> definir --> con objetos --> de tipo --> técnico --> modelos --> de tipo --> o sea --> metadatos --> de tipo --> técnico --> vamos a empezar --> por ahà --> para definir --> estos metadatos --> de tipo --> técnico --> entonces --> primero --> debe saber --> dónde están --> si no sabes --> dónde están --> pues no lo puedes --> definir --> entonces el perfil --> de esta persona --> el técnico --> metadatos --> técnicos --> yo creo que --> no tiene que tener --> unos conocimientos --> técnicos --> tan alto --> lo que sà es --> saber --> es que --> debe --> conocer --> dónde se --> encuentra --> el elemento --> al cual quiere hacer --> metadatos --> técnicos --> entonces vamos --> a lo siguiente --> para definir --> dos tipos --> de metadatos --> que son los --> técnicos --> y los --> operativos --> creamos --> un modelo --> nuevamente repito --> para los --> metadatos --> de tipo --> técnicos --> y operativos --> vamos a --> definir --> un modelo --> quiere decir --> que todos --> nos --> posicionamos entonces --> en la --> carpeta --> en la carpeta tuya --> listo --> te posiciono en la --> carpeta --> exactamente --> dale click ahà por --> favor --> vamos a darle --> new --> y vamos a --> escoger --> a ir a --> aparecer --> new --> model --> en ese --> new --> model --> preguntan --> inicialmente --> el nombre --> el nombre --> se llama --> vamos a --> colocar el siguiente --> nombre si es tan --> amable --> daniel y todos --> acme --> acme de --> empresa --> acme de --> los --> muñequitos --> de antes --> tenÃan una --> los --> los --> dibujos --> de antes --> tenÃan una --> empresa se --> llamaba --> acme --> acme --> espacio --> sporting --> sporting --> wear --> W-E-A-R --> soy --> malo --> para --> el --> ingles --> pero --> bueno --> perfecto --> no --> es --> wear --> de --> uso --> es --> de --> E-A-R --> W-E-A-E-A-R --> E-A-R --> creo que --> si --> listo --> expande --> por --> favor --> el combo --> de --> server --> si es tan --> amable --> dale click --> en el combo --> ese que dice --> import server --> dale click --> por favor --> ahà si es tan --> amable --> note que ahà solamente --> existen --> dos tipos --> de --> de servidores --> esto lo voy a --> explicar --> y muy --> pendiente --> a quien va a ser --> administrador de --> la herramienta --> entonces --> voy a --> esto lo voy a --> mostrar --> con esta --> gráfica de acá --> en primer lugar --> la arquitectura --> que tenemos actualmente --> es una --> arquitectura --> bueno --> en realidad el software --> del talent data cloud --> se está ofreciendo --> como SaaS --> entonces vamos a tener --> lo siguiente --> vas a tener --> por aquà --> el talent --> el TDC --> lo tienes por acá --> este TDC --> en realidad --> talent no tiene ninguna --> infraestructura --> talent lo que está --> utilizando en algún --> cloud tipo --> AWS cloud --> para poder ofrecer --> la infraestructura --> del talent data cloud --> significa que --> esto puede estar --> en AWS --> ese caso --> con AWS --> o se caso --> con Azure --> es decir --> que el talent --> que estamos --> actualmente --> está montado --> en alguno --> de estos --> cloud computing --> está lo mismo --> al final --> sobre cuál está --> para el ejemplo --> que voy a mostrar --> por acá estamos --> nosotros como --> client --> voy a colocar --> aquà un PC --> voy a colocar --> aquà PC --> este de aquà --> en el medio --> tenemos la nube de internet --> voy a colocar --> aquà un cloud de nube --> y este señor --> conecta aquà --> y conecta acá --> entonces estamos --> conectados con otras --> máquinas --> con la nube de internet --> y llegamos acá --> listo entonces --> primero vamos a ver --> entonces --> yo quiero conectarme --> a una base de datos --> para conectarme --> a una base de datos --> entonces hay que ver --> desde que punto --> me voy a conectar --> por defecto --> dice default server --> que era --> la imagen --> que tenÃa acá --> Daniel --> default server --> vamos a ver --> qué pasa con el default server --> si está configurado --> en default server --> significa que --> la conexión --> se hace --> desde acá del talent data cloud --> hacia la base de datos --> que tú tengas --> pocas palabras --> vamos a colocar --> aquà una base de datos --> de la nube --> que puede estar --> en AWS --> o el servicio --> que tú quieras --> va en Azure --> y ahora --> si yo digo --> default server --> significa que --> la conexión --> va de allá --> de aquà --> hacia acá --> o sea --> del talent data cloud --> hacia la base de datos --> que tú tengas --> ¿qué problemas puede tener esto? --> un par --> primero --> si el talent data cloud --> está hecho --> sobre Java --> si el driver de conexión --> hacia esa base de datos --> no está --> en el talent data cloud --> no lo puedo subir --> o sea --> el software --> digamos la --> la empresa --> actualmente --> no me permite a mà --> subir datos --> allá directamente --> como archivos --> de conexión --> de drivers --> no lo permite hacer --> significa que --> prácticamente --> no me podrÃa conectar --> esa base de datos --> si no tengo el driver --> y el segundo --> y principal --> aunque yo creo que el problema --> está ahà no --> porque la mayorÃa de drivers --> están montados --> allá arriba --> entonces --> imagÃnate que esta es tu empresa AXA --> esto está aquà está AXA --> digamos de esa forma --> y tienes acá --> tu servidor --> está aquà interno --> ok --> no está en adoración este interno --> si yo cojo default server --> significa ahora que --> va a intentar conectarse --> de aquà --> a acá --> el problema de conectarse --> de nube --> a tu --> a tu --> red privada --> es que --> yo creerÃa que pues --> ningún --> ninguno de seguridad --> te va a permitir --> hacer eso --> porque no te va a abrir --> el puerto --> para que este señor se conecte --> si abre este puerto aquà --> sobre esa base de datos --> pues es un --> agujero de seguridad --> no creo --> que te lo haga --> que es lo que hace --> entonces el talent data cloud --> te ofrece --> en que tu --> técnicamente se llama --> instales un motor --> de harvenes --> te voy a colocar --> la palabra acá --> harvenes --> harvenes --> conté --> harvenes aquà --> harvenes --> si asà --> que --> instales el motor --> un motorcito aquà --> en software --> pocas palabras --> lo instales --> aquà en tu red --> perdón --> lo instales aquà en tu red --> y ahora este motor --> harvenes se conecta --> a este motor --> tuyo --> y este harvenes se conecta --> al talent cloud --> entonces este harvenes --> se conecta --> a tu base de datos --> recupera los metadatos --> y los envÃa --> al TDC --> a través del --> motor ese de harvenes --> que llaman --> actualmente tienes dos --> tienes el que se llama --> default server --> que es el --> harvenes --> el motor de harvenes --> que está en TDC --> o sea que está en cloud --> y tienes el que se llama --> voy nuevamente acá --> el que se llama --> RFDCA --> que es el motor de harvenes --> que tienes --> instalado a nivel local --> en tu red --> en tu red de la empresa --> entonces --> si nos fuéramos --> a conectar --> a una fuente de datos --> y cuando hablamos --> fuente de datos --> no solamente lo vea --> desde el punto de vista --> base de datos --> sino un archivo --> CSV --> un archivo Excel --> si me quiero conectar --> a un archivo --> CSV --> que está dentro --> del campus --> de AXA --> deberÃa usar --> RFDCA --> pero como yo no puedo --> acceder --> allá a su red --> y vamos a conectar --> a una base de datos --> que está en la nube --> entonces cogemos --> default server --> por favor --> si es el caso particular --> en que --> en que deseas configurar --> eso ya en su empresa --> por favor --> no dudes en escribirme --> yo te puedo asesorar --> un poco --> en esa parte --> en cómo se hace --> para configurar --> ese motor internamente --> listo --> ya decidà entonces --> el motor de conexión --> básicamente ese motor --> es el lugar --> donde está --> en esto estarÃamos --> en el talent data cloud --> ahora ve --> al concepto de bridge --> expande ahà por favor --> expande ahà --> ese bridge --> y me voy --> a la diapositiva --> que tengo por acá --> que se las voy a entregar --> al final --> que es un bridge --> un bridge --> simplemente es un --> conector --> hacia una fuente de datos --> que puede ser --> una base de datos --> un data lake --> una carpeta compartida --> etc --> cualquier fuente de datos --> es un bridge --> entonces --> como me quiero conectar --> es a una base de datos --> que está en pogres --> porque he definido --> la base de datos en pogres --> por favor a lo siguiente --> en ese filtro --> que está ahà --> coloca la palabra --> postgres --> ahà lo tienes --> y escoges --> el segundo por favor --> si quieres --> voy a dar lo mismo --> primero o segundo --> el segundo --> le da dos --> seleccionalo --> listo --> hay veces que le das --> doble clic --> que se cierre la ventana --> en algunos casos --> o lo siguiente --> que estamos definiendo --> vamos a definir --> un modelo técnico --> como sé que es un modelo --> técnico --> porque me estoy conectando --> una base de datos --> si me estuviese conectando --> a una herramienta --> de un job --> pipeline --> workflow --> significarÃa --> que estoy --> creando un modelo --> de --> operativo --> un metáton operativo --> dale por favor --> ok si está amable --> note que el menú --> es muy parecido --> con algunos elementos --> pero le agrega --> algo adicional --> vamos con el overview --> por favor --> vamos con la descripción --> que es sumamente importante --> documentar todo --> en estos proyectos --> de catálogo de datos --> descripción --> coloca por favor ahà --> Daniel --> base de datos transaccional --> base de datos transaccional --> base --> de acme --> de acme --> asà transaccional --> de acme --> colócalo --> en el mismo label --> que es --> dgdaños --> que era creo que --> en el label --> vete al label --> y le das --> dg --> escoges el que se llama --> creo que se llama ahora --> dg --> dgdaños --> datos --> el primero que aparece --> puede solicitud --> dale clic --> por fuera --> para que te --> salga --> salde de ahà --> clic por fuera --> del canvas --> para que salga --> de ese menú --> y esto es --> por favor --> para --> guardar --> bien --> note que hay una --> opción que hice --> propagar --> documentación --> mire lo siguiente --> cada objeto --> vamos a tener --> sus propias versiones --> yo tengo --> versión uno --> versión dos --> versión tres --> y versión cuatro --> suponte que --> la versión uno --> como el caso --> que estábamos en pantalla --> que Daniel lo hizo --> Daniel entonces --> agregó --> base de datos --> transaccional de acme --> en cierto --> versión uno --> pero en versión --> cuatro cambia --> la descripción --> por aquà le agrega --> un nuevo elemento --> le agrega --> más datos --> la detalla --> mucho más --> entonces --> si la opción --> propagar --> documentación --> está desactivada --> que es la puerta --> de efecto --> solamente el cambio --> que hace --> la nivel de --> documentación --> se mantiene --> en la versión --> en que está --> en este caso --> el ejemplo que colocó --> versión cuatro --> lo que coloque --> perdón --> versión cuatro --> si yo activo --> y chuleo --> ese propagar --> documentación --> entonces significa --> lo siguiente --> en versión cuatro --> hice un cambio --> en documentación --> significa que si está --> chuleado --> todos los cambios --> que hice en esa versión --> se va a ver --> reflejado en las --> versiones anteriores --> eso es lo que hace --> hay que tener --> mucho cuidado --> con respecto a eso --> porque quizás --> pierdes un poco --> de estas habilidades --> de todo lo que has hecho --> y los cambios --> que has realizado --> entonces --> eso es --> meramente si de pronto --> te equivocaste --> y quieres agregar --> algo de pronto --> en esa versión --> en la actual --> y la que está hacia atrás --> aclaro que eso es a nivel --> de documentación --> nada más --> vete por favor --> ahora a la sección --> que dice --> import setup --> si le están amable --> y vamos a configurar --> las credenciales --> de acceso --> hacia la base --> de datos --> entonces vamos --> a lo siguiente --> por favor --> vete al --> al programa de archivos --> de Windows --> si te vas a la carpeta --> descargas --> si le están amable a todos --> descargas --> entra en todo --> por favor --> la carpeta que se llama --> TDC --> y acceden --> a credenciales --> Postgres --> la carpeta --> a su carpeta --> credenciales --> Postgres --> y accede al archivo --> credenciales --> entonces vamos --> a definir esas credenciales --> de acceso --> espere un momento --> listo que hay algunos --> que --> que están abriendo los --> archivos --> entonces podemos --> esperar un momento --> perfecto --> algunos que todavÃa --> verónica está listo --> TDC --> por favor verónica --> si está amable --> credenciales --> Postgres --> y hay un archivito --> que está dentro --> por favor lo --> lo edita --> doble clic --> listo --> empecemos entonces --> vamos --> y tomamos --> del host --> toma la URL --> que tienes ahà --> que dice --> por favor tómate la URL --> y colocala --> y sobreescriba --> sobre localhost --> que es donde dice --> la sesión host --> está localhost --> sobreescribe ahà --> por favor --> enter --> le das enter al final --> vete ahora --> a la parte --> de base de datos --> vete un momento al archivo --> perdón --> y en --> debe --> tómate la base de datos --> que está al final --> debe --> copiate --> esa base --> copiate todo eso --> y lo colocas en --> debe --> database --> colocalo en database --> lo pegas ahà --> en la --> en el valor de database --> el usuario si quiere --> lo escribe --> para lo que está copiando --> es AXA --> con A mayúscula --> y el password --> ¿qué tal? --> vea si tiene que ir --> a copiar --> perfecto --> ahora --> recordarás ya --> esto es más particular --> de tecnologÃa --> que hay --> algunas bases de datos --> que maneja --> el concepto de esquemas --> tipo Oracle --> tipo --> Oracle --> Postgres --> puede ser --> manejar el concepto de esquemas --> que básicamente --> tiene un esquema --> es que me permite --> organizar --> internamente --> unos objetos --> es como si fuese una subcarpeta --> dentro --> de una base de datos --> entonces me permite --> organizar de manera --> mucho más --> sencilla --> algunos elementos --> tengo uno solo --> base de datos --> y tengo varios esquemas --> cada esquema --> tiene un conjunto --> de objetos --> en este caso --> Postgres maneja --> varios esquemas --> y por defecto --> el esquema es public --> pero en este caso --> hay un esquema --> que se llama --> ACME SportyWeb --> exactamente como --> la base de datos --> entonces --> golpe del nombre --> de la base de datos --> nuevamente --> ahà en esa misma interfaz --> y lo pegas --> en esquemas --> perfecto --> te pregunto ahora --> tablas y vistas --> ahà lo que puedes hacer --> es filtrar --> de pronto --> no quieres todas las tablas --> de la base de datos --> sino que tú deseas --> puedes filtrar --> tablas --> que inician --> que terminen --> vamos a --> vamos a traernos todo --> hay una opción --> que dice --> importar Ãndices --> esos Ãndices que importan --> son Ãndices creados --> en el momento --> de los primary key --> y los foreign key --> y además --> Ãndices que haya creado --> el ingeniero de datos --> o el diseñador --> de la base de datos --> cuando definió --> la base de datos --> dele true por favor --> esa signatura --> que está ahà --> es --> si me deseo --> traer los procedimientos --> almacenados --> que tenes en esa base de datos --> en este caso --> no hay ninguno --> por lo tanto --> harÃa lo mismo --> si lo dejo --> no lo dejo --> y ese misiláneos --> que está ahà --> es para mandarle --> algunas caracterÃsticas --> de configuración --> a la conexión --> por ejemplo --> más memoria --> etcétera --> importante --> dale safe --> note que hay un asterisco --> ahà --> en el import --> hay un asterisco en negro --> diciéndole que hay un cambio --> que no ha sido guardado --> por favor --> dale safe --> para guardar --> perfecto --> cierra --> por favor --> bueno --> vamos bien listo --> vamos --> y ya configuramos la parte --> de --> configuración --> del import --> vamos al import option --> que está aquà al lado --> primero --> chulemos --> esa sesión --> que dice --> data sampling --> chuleala por favor --> y --> le explico lo siguiente --> ese data sampling --> va a --> especificar --> el número --> en caso que --> esté chuleada --> cuanto --> registros --> de --> muestras --> desea --> subir a la herramienta --> no te --> me vaya a --> confundir ahora --> recuerda que --> la herramienta --> lo que está --> buscando es --> metadatos --> pero recuerda que --> la herramienta --> también te --> permite ser --> calidad de datos --> entonces --> si tú quieres --> subir --> registros --> es porque quieres --> analizar --> la calidad de esos --> registros --> no tanto es porque --> esos registros --> tengan algo que ver --> en los metadatos --> no más que todo --> eso lo tú --> lo vas a hacer --> es para --> digamos --> tener unos --> registros --> que puedas visualizar --> y que puedas --> verificar si --> cumple con --> reglas de calidad --> los registros --> en ese caso --> está --> estipulado --> diez registros --> vayese por --> favor --> y vete a --> la parte de --> data profiling --> dale click ahà --> a nivel --> de calidad --> de datos --> existen --> dos --> procesos --> un proceso que --> es para --> detectar --> la anomalÃa --> y un proceso --> que se llama --> limpieza --> o curación --> llámalo --> como tú quieras --> en este caso --> al activar --> data profiling --> estoy --> diciendo mira --> al tener --> mil --> mira vas a tomar --> y le vas a hacer --> vas a tomar --> mil --> una muestra --> de mil registros --> y de esa --> muestra de mil --> registros --> vas a hacer --> profiling --> profiling por ejemplo --> que puede ser --> que me cuente --> cuántos números hay --> que me cuente --> cuántos duplicados tiene --> que me cuente --> cuántos números --> únicos hay --> que me de el patrón --> de esos elementos --> eso es para --> detectar --> anomalÃa --> la herramienta --> no te hace --> clicking --> o sea --> no te hace --> limpieza --> solamente para --> detectar --> ojo --> esos mil --> que toma ahà --> es diferente --> a los diez --> del sampling --> el sampling --> lo que quiere es que --> yo los voy a ver --> los diez registros --> y estos mil --> es que va a tomar --> mil --> y los va entonces --> a hacer profiling --> cuente el número --> de nulos --> de distintos --> únicos --> etcétera --> si colocas --> cero --> ahà te dice --> que no te lo recomienda --> significa que va a hacer --> data profiling --> a todos los --> registros de la tabla --> entonces --> si la tabla es muy --> grande --> te puede demorar --> mucho tiempo --> y por eso que no te lo --> recomienda --> si la tabla es pequeña --> pues tú puedes colocar --> cero --> vamos a ver entonces --> el siguiente --> dale --> chulealo por favor --> ese profiling --> solo que estos --> que no han sido profilados --> tiene sentido --> cuando tú tienes --> varias versiones --> me explico --> en la primera --> versión --> el tomo mil --> registros para --> profiling --> si eso está chuleado --> en la segunda --> versión que yo tenga --> esos mil registros --> no son los mismos --> va a tomar --> otros mil registros --> por eso que es --> mejor opción --> porque --> vas a tener --> digamos como tienes --> varias versiones --> vas a tener --> una muestra --> mucho más grande --> de registros --> esa parte --> de high data --> si lo dejan asà --> lo que pasa --> es que --> me toca --> explicar el concepto --> que va de --> sensibilidad --> nosotros lo dejamos quieto --> vamos a donde dice --> data classification --> por favor --> está chuleada --> por defecto --> verdad --> ahora --> que va a hacer --> la herramienta --> la herramienta --> va a intentar --> clasificar --> los datos --> como los --> clasifica --> a partir --> del contenido --> en algunos casos --> y en otros a partir --> del nombre --> del --> de la columna --> José para no --> perdón --> José --> Daniel --> que me ayudaba --> en otro curso --> entonces --> Daniel --> si estás mal --> le das safe --> para no perder --> démosle --> todo safe --> para no perder --> la configuración --> esa --> y vete --> vayamos todos --> al menú --> manage --> expande --> por favor --> si está mal --> Daniel --> y hay una opción --> que dice --> data classes --> que está --> en el menú --> customization --> y si estuvo --> presente --> en el curso --> de talent data --> staywars --> recuerde que --> yo lo he dicho --> mira --> es un dato semántico --> presta atención --> que es --> prácticamente --> lo mismo --> que el talent data catalog --> esos --> nombres --> que están ahà --> son --> exactamente --> los mismos --> que tienes --> allá --> en el --> talent data --> staywars --> y allá --> los llamó --> datos semánticos --> ve aquà está --> aeropuerto --> animal --> ahà vas a encontrar --> email --> listo --> permÃtame --> si recordarás --> los --> en el caso --> del talent data staywars --> tú tenÃas --> datos semánticos --> y esos datos --> semánticos --> eran de dos tipos --> o el dato --> semántico --> era un diccionario --> diccionario --> o era --> una expresión regular --> habÃa un tercero --> que era un compuesto --> pero prácticamente --> estaba compuesto --> de diccionarios --> o expresiones regulares --> acá --> esos elementos --> que están viendo ahà --> no los llama --> el dato semántico --> sino --> como le cambia --> el nombre a la herramienta --> tiene que --> cambiarle --> a nivel de comercio --> de mercadeo --> el nombre al dato --> entonces lo llama acá --> data class --> o clase de datos --> data class --> lo llama acá --> con una pequeña --> ligera diferencia --> que acá --> los diccionarios --> se llaman --> enumeraciones --> y tiene --> también --> expresiones --> regulares --> pero es --> exactamente --> lo mismo que tienes allá --> entonces mira --> cómo va a ser --> ya la herramienta --> tiene definidos --> unos data classes --> pero tú puedes crear --> también tus propios --> data classes --> cómo funcionan --> los data classes --> imagÃnate que tú tienes --> la tabla clientes --> y entonces --> en clientes --> tiene identificación --> tienes --> nombres --> y tienes apellidos --> identificación tienes --> aquà uno --> tienes el nombre --> por ejemplo --> Arturo --> que está aquà --> voy a dejar --> estos nombres aquà --> dos --> tenemos --> Denise --> Denise --> que se escribà --> con 2s --> y tengo acá --> Verónica --> listo --> con el data profiling --> que tú tienes --> o sea --> recuerda que --> el data profiling --> colocamos 10 --> ese data profiling --> visualizo los --> diferentes elementos --> y ahora --> voy a intentar --> hacer lo siguiente --> voy a intentar --> listo --> tengo unas --> clases --> y voy a ver --> a qué --> pertenecen esas clases --> me explico --> de esta manera --> aquà a diferencia --> del señor --> Data Stewardy --> hay una --> hay una --> clase que se llama --> FirstNet --> este que es un diccionario --> que tiene --> muchos nombres --> aquà puede tener --> John --> puede tener --> por ejemplo --> el mismo Arturo --> aquà --> puede tener --> a --> Daniel --> acá --> y puede tener --> acá --> a Verónica --> entonces --> él intenta --> contar --> cuántos --> elementos --> de tu data set --> están --> incluidos --> en este --> diccionario de acá --> que él lo llama --> en numeración --> pero es un diccionario al final --> una lista --> si entonces --> por defecto --> tiene la --> la tarea --> que si está por encima --> del 60% --> él lo clasifica --> a ese tipo --> por ejemplo --> aquà tengo --> Arturo --> y listo --> lo tengo acá --> tengo prácticamente --> el 66% --> de los nombres --> de aquà --> lo tengo acá --> entonces --> ¿qué hace él? --> como la regla --> por defecto está --> si está por encima del 60 --> clasifica a ese tipo --> significa que este nombre --> lo clasificarÃa --> como FirstNet --> pero fácilmente --> también --> se pudo ver --> los clasificados --> también de dos tipos --> a donde quiero llegar --> que la misma forma --> de clasificación --> puede llevar --> a error --> a la herramienta --> por la forma --> en que trabaja --> y también --> tiene la otra parte --> que si tiene --> una expresión regular --> la que tú quieras --> por ejemplo --> no sé --> D3 aquà por ejemplo --> y hay algún --> elemento que --> coincida --> en este caso --> por defecto --> está 60% --> 60% de los elementos --> de una columna --> coinciden --> con la expresión --> de esa forma --> es que funciona --> la clasificación de datos --> si eres tan amable --> dale click --> en animal un momento --> Daniel --> dale click en animal --> si eres tan amable --> animal --> ahà está --> es que vena --> hay varias --> te dice --> o dale --> dale a segunda columna --> dale click --> ahora está --> ahà está --> mira que --> acá dice --> acá dice --> enumeración --> patrón --> y regular expresión --> la mismo --> cuenta que tengo --> allá esto --> es una linda --> exactamente --> igual --> e filtra --> por favor --> ahà y --> coloca --> e-mail --> allá en el filtro --> para buscar uno --> que se llama --> e-mail --> filtra --> e-mail --> dale click --> en e-mail --> ahà por favor --> en el primero --> listo --> mira que --> acá lo que tiene --> es una expresión --> regular --> pero es --> prácticamente --> la misma idea --> que viene --> allá --> y tiene --> la misma idea --> que tiene --> es la --> misma --> exactamente --> la misma idea --> lo único --> que ahora --> cada columna --> que tenga --> va a intentar --> clasificarla --> dentro del número --> que tiene --> listo --> entonces --> vete nuevamente --> al --> repositorio --> si ya estás --> amable --> al repositorio --> acto --> seguido --> por favor --> vete nuevamente --> a la --> configuración --> del modelo --> acme --> dale click --> ahà en el --> estábamos --> en import --> options --> por favor --> entonces --> si yo chuleo --> esa data --> clasificación --> él va a intentar --> clasificar los --> datos --> según las clases --> que están --> en ese data class --> y basado --> en el porcentaje --> de aciertos --> que tengan --> pues --> o ya sea --> la presión --> regular --> o el diccionario --> que acá lo llama --> la herramienta --> enumeración --> bueno --> sigamos entonces --> vamos --> a la otra parte --> que es --> gestión de la --> versión --> note que --> por defecto --> tiene --> sec new --> version --> como default --> significa --> lo siguiente --> deschulea --> el siguiente --> para que podamos --> entender --> porque pronto el --> deschulea --> el siguiente --> quise crear --> nuevo --> el siguiente --> quise crear --> nuevo por favor --> si lo tengo de --> esta forma --> indica lo siguiente --> que cada vez que yo hago --> un import --> hacia esa base --> de datos --> desde esa base --> de datos --> significa que va a --> crear una nueva --> versión --> cada vez que yo hago --> un import --> se crea una nueva --> versión --> dale ahora click --> en el create --> por favor --> y en este --> caso --> solamente --> se va a crear --> una versión --> y solo --> sà --> la versión --> el import --> nuevo tiene --> algún cambio --> me --> explico --> de esta manera --> el cambio --> puede ser --> porque --> agregué --> una nueva --> columna --> en este --> caso --> una tabla --> o le --> cambié --> el nombre --> a la --> columna --> en esos --> dos --> casos --> que hay --> un cambio --> entonces --> si tengo --> si tengo --> chuliado --> la opción --> create new --> solamente --> se va a --> crear --> si existe --> un cambio --> en el modelo --> original --> si no --> no se crea --> y la --> última --> opción es --> sumamente --> interesante --> te lo --> aconsejarÃa --> que le --> hicieras --> dale la --> opción --> que es --> copy --> vamos a --> hacer --> un ejemplo --> de esa --> parte --> es que --> recordarás --> por una cuestión --> netamente --> de documentación --> el --> diseñador --> de la base --> de datos --> pudo agregar --> comentarios a las --> columnas --> comentarios a las --> tablas --> entonces --> cuando yo digo --> ese --> copy --> model --> description --> lo que voy --> a hacer --> es que --> esos --> comentarios que --> diseñador --> no no --> ahà --> hicimos todo --> esa --> vete a la --> sesión que --> dice --> naming --> estándar --> eso --> voy a --> hacer un --> ejemplo --> mucho más --> vete donde --> dice --> responsibilities --> ya --> entendemos --> entonces que --> este menú --> va a ser --> común en --> deberÃa --> estar --> vacÃa --> darle --> clic en --> versión --> deberÃa --> estar --> vacÃa --> efectivamente --> porque --> porque --> la --> versión --> solamente --> se crea --> cuando --> yo hago --> primer --> import --> como --> no --> he hecho --> import --> entonces --> la --> versión --> ya está --> creada --> vete donde --> dice --> log --> por --> listo --> ahora --> vete --> no tengo --> ningún log --> y vete a --> history --> que me da --> la --> descripción --> de todo lo que --> he hecho --> con ese --> objeto como --> tal --> entonces --> el menú --> overview --> responsibility --> version --> log --> history --> es --> exactamente --> igual cuando --> lo veas --> en cualquier --> objeto de --> la --> herramienta --> vete --> nuevamente --> al --> overview --> dale --> clic en --> overview --> listo --> ahora --> el --> proceso --> de --> tomar --> los --> data --> los --> metadata --> que --> está --> en un --> modelo --> se --> llama --> proceso de --> jarvenes --> jarvenes --> como lo --> copiado hace --> poquito --> jarvenes --> ese --> jarvenes --> es el --> proceso en el --> cual --> se van a --> cosechar según --> la herramienta --> se cosechan --> los --> metadata --> con los --> cuales --> tu vas --> a trabajar --> al final --> un --> jarvenes --> es un --> import --> pero --> la --> herramienta --> le dice --> que se --> llama --> jarvenes --> dale --> clic por --> favor --> en import --> ahora sà --> todos --> el import --> está --> en la --> parte superior --> exactamente --> dale --> clic en --> ese --> import --> y --> entonces --> aquà --> me --> pide --> varias --> configuraciones --> de --> el --> elemento --> de --> el --> import --> te --> recomendarÃa --> lo --> siguiente --> primero --> te --> aparece --> si --> la --> fuente --> deseas hacer --> un --> import --> incremental --> un --> un --> full --> import --> yo --> te --> recomendarÃa --> un --> full --> import --> que --> diferencia --> hay --> la diferencia --> es la siguiente --> suponte que --> en tu --> primera --> versión --> tienes --> identificación --> nombre --> y --> apellido --> en la --> segunda --> versión --> tienes --> la --> tabla --> cambiada --> con --> las --> columnas --> identificación --> nombre --> y --> apellido --> es --> primera --> versión --> pero --> la --> columna --> por --> ejemplo --> teléfono --> cuando --> hablamos --> de --> incremental --> es --> que --> lo --> que --> se --> va --> guardar --> en el --> nueva --> versión --> solamente --> el --> incremento --> prácticamente --> el nombre --> la --> nueva --> columna --> o --> el nombre --> la --> columna --> que --> cambió --> entonces --> para mà --> me --> parece --> que --> es --> mucho --> mejor --> que --> tenga --> todo --> lo --> todo --> digamos --> toda --> la --> información --> y que --> después --> compara --> la diferencia --> y --> aclaro --> que es lo --> que --> va a guardar --> simplemente --> un nombre --> de --> columna --> eso no te --> va a --> llevar --> a tener una --> gran cantidad --> de --> almacenamiento --> entonces --> yo te --> recomendarÃa --> que --> hicieras --> yes --> en la --> primera --> pregunta --> ahà dice --> full --> source --> escoge --> yes por --> favor --> import --> ee --> quien --> quien --> me --> habló --> ah ya la vi --> el import --> ya voy --> un momento --> la --> parte --> superior --> derecha --> tiene un --> botón allá --> que dice --> import --> si lo caso --> a ver --> superior --> derecha --> un poquito más --> abajo --> ese --> dele click ahà por --> favor si están --> amables --> si ok --> dele click ahà --> por favor --> en la --> primera --> opción --> dele por --> favor yes --> para que --> guarde todo --> el modelo --> preguntas --> si hay --> algún --> inconveniente --> en el momento --> el import --> y si desea --> guardar --> los locks --> o sea --> los problemas --> aceptaron --> dale click ahà --> en yes --> claro que sà --> en la --> segunda opción --> dele yes --> para que --> cualquier --> detalle --> de problema --> que tuve --> pues lo --> importen --> daniel --> dale yes --> tú por --> favor si --> está --> amable --> listo --> los --> demás --> me activa --> yes yes --> no hay --> problema --> me --> incluir detalles --> de la --> entrada --> claro que sà --> salvar el --> modelo --> importado --> en la --> base de --> datos --> o esa --> base de --> datos --> de --> la --> herramienta --> por --> defecto --> usa el --> motor --> postgres --> la --> herramienta --> usa --> postgres --> y si --> vas a --> notificar --> esta parte --> la parte --> superior --> de la parte --> derecha --> ya --> superior --> y una engranaje --> que está dando vuelta --> dale click en --> engranaje --> por favor --> si está --> amable --> y ahà --> de --> si --> ha click en --> engranaje --> te va --> a mostrar --> que parte esta --> haciendo --> bueno --> vamos a tomarnos --> cinco minutos --> porque demora --> a veces demora un --> Bien, ya parece que terminó el proceso de hardness, o prácticamente, a nivel práctico, --> bueno, ahora sÃ, qué pena, ah, listo. Terminó de manera exitosa el proceso de hardness, entonces, --> por favor, como terminó, sÃ, para ver si está mal, muéstrame su, ¿Quién me habló? --> Ah, ok, listo, listo, perfecto, por favor comparte su pantalla si está mal. Muéstrame --> por favor si está mal el Import Auction, váyase del, sÃ, sÃ, ya la veo, entonces, si está mal, --> váyase del lado derecho, está Overview, Import Setup, Import Auction, váyase a Import Auctions, --> dale click en Import Auction, sÃ, ahà está Overview, cerquita de Overview, está Import Setup --> y el que viene, el que viene, Import Auctions, el que viene, ese que está ahÃ, por favor, --> no, pero sÃ, lo hizo, lo detectó bien, ah, pero Metadata, ah, ya entiendo, no apareció --> la clasificación, ¿Por qué? Si quiere, dele nuevamente Import, un momento, a ver, dele click --> en Import, aquà aclaremos, no crearÃa una nueva versión porque por defecto, yes, yes, --> porque por defecto el modelo no ha cambiado, entonces cualquier cambio que haga quedarÃa --> en la misma versión, si noté, es como si pareciese que, yo pensé inicialmente que esa --> parte de data clasificación la tenÃa desconfigurada, es decir, que lo tenÃa, no habÃa chuliado --> la opción, vamos a esperar un momento a ver si le sale, listo, ahà no vuelve a --> colocarnos, seguramente, veamos si, yo creo que le quedó exactamente igual a todos, --> si hay una pequeña diferencia, me aviso yo y volvemos nuevamente y hacemos el proceso, --> ¿Quién me habló? Denys, damos un momento a ver qué pasó, si, noche para verlo, --> dele, ah, claro, claro, claro, si, si, si, hagamos lo siguiente, dele click por favor --> en el cuadro que dice import model version, ahà no tiene log, le da click y va a mostrar --> el mensaje, ahà en todo el, no, el otro import donde dice, donde tiene el sÃmbolo --> de exclamación del error, dele click ahÃ, ahà exactamente, dele click ahÃ, bueno, --> al parecer creo que hubo un error en el momento, vamos a tratar de darle import nuevamente --> a ver, dele close, intente nuevamente darle import a ver qué pasa, en, no, sÃ, sÃ, --> exactamente, en ese import que tiene ahà exactamente, si quiere oculte ahà eso, --> le da hide y le da nuevamente import como usted quiera, y esa todo prácticamente --> y le dele import, agarramos un momento a ver, no, entonces hago lo siguiente, --> váyase al import setup que lo tiene del lado izquierdo, ah, al lado de overview --> dele import setup, dele click ahà por favor, ahà está el problema, el problema es que --> la url del host está mal, váyase nuevamente al archivo, el texteo tiene el archivo, --> el notepad, tome la url que tiene ahÃ, exactamente, no se copió, sÃ, --> exactamente, tenia eso en el portavapel, tenia eso, minimiza, pégale un notepad --> cerca del import que hice test, dele test para probar la conexión, abajito el, --> del import ha quedado un cancel y abajo del cancel está un test, dele test ahÃ, --> ok, ah, sÃ, sÃ, close, dele en close, y ahora sÃ, --> tiene que darle import para ver, dele guardar antes, tiene que salvar antes, --> sÃ, sÃ, hay import, sÃ, sÃ, exactamente ahÃ, --> sÃ, parece que sÃ, vamos a esperar para ver si termina de forma exitosa, --> sÃ, ahora sÃ, cargó, list, perfecto, entonces, si va del lado izquierdo al --> repositorio y expande el modelo que creamos que se llama Acme, ahora sÃ, --> pero diga el modelo, en este caso el modelo es Acme Sporting Web, está del lado --> izquierdo en el repositorio y te apareció ahà un más para que expandas --> ahÃ, ahà no está, sÃ, exactamente, ahà en el más que está al principio y --> ahà te está mostrando un elemento, cada vez que yo expanda un objeto en --> talent data catalog, el número de hijos que tengo corresponde al número de --> versiones, en este caso nada más tengo una versión de ese objeto que --> está ahÃ, en este caso una conexión hacia baseados, --> haz lo siguiente, vete entonces a la, cuando diga, cuando diga la versión --> tienes que irte hacia lo que te dice, vamos a la versión, a la primera --> versión, dale click ahÃ, en esa primera versión dale click, --> vete a la sesión de model, en el lado derecho te aparece un submenu y el --> segundo elemento del item es model y expande por favor cada elemento de --> esos, si quieres expande, ahà te está diciendo la base de datos y está --> diciendo las tablas que pertenecen a esa base de datos, confirma que --> todos estamos conectados a la misma base de datos, por lo tanto el modelo --> tiene que estar exactamente igual. --> SÃ, oculta, oculta eso más bien, sÃ, dale ahÃ, por favor. --> Ahora, todos hagamos lo siguiente, vete ahora al nombre, en realidad que es --> el nombre del esquema, que se llama Acme Sporting Web, dale click ahÃ, --> todos, démosle click a Acme Sporting Web, clic derecho y le das open. --> Open, y te aparece entonces este menú, desglucemos un poco este menú entonces. --> El primero me da un overview, recuerde que el overview, ese sà es común para --> todos, va a estar en todos, me va a dar un resumen, el resumen que me está --> mostrando, el esquema que abrÃ, son la cantidad de tablas que tiene, en --> este caso tiene cinco tablas. Listo, en el mismo menú, si te das cuenta, --> hay un elemento que dice R Diagrama Entidad Relación, ya lo viste al --> lado de overview, dale click por ahÃ. --> La herramienta te va a permitir crear diagramas relacionales, identidad --> relación, te preguntarás para qué. Lo que pasa es que la idea de esto que --> está aquà es pensando en que tú tengas, por ejemplo, algunos elementos en un --> Data Lake y que tengas alguna base de datos y quieres enlazar algunas --> tablas con archivos que están en el Data Lake, para hacer, digamos, un --> documento, entonces esa es la principal elemento que se tiene para por qué --> crear o por qué se tiene este entidad, diagrama entidad relación. Vamos a --> crear uno pequeño ahÃ, ahà donde está, dice un botón que dice Create, --> llámalo entonces, ACME Diagrama. --> Ok, dale click, ahà te aparece una tablita con cuatro, inicialmente con --> cuatro columnas. En la columna Name, dale click en el nombre que dice ACME --> Diagrama, que fue el que creamos, ACME Diagrama. --> Y en la parte superior derecha tienes un botón que dice Start --> Editing, tienes que darle click ahà en Start Editing, superior derecha. --> Ese que está ahÃ, dale Start Editing. --> Y en este caso te va a mostrar, para este caso en particular, todas las --> tablas de la conexión que tienes. Para llevar una conexión, si tú quieres --> llévate, coge las cuatro tablas que tienes, selecciona las cuatro --> tablas y las llevas al canvas, que serÃa el centro. Selecciona las --> cuatro o llévalas una por una. --> Dennis tiene que darle click allá arriba en Start Editing, parte superior --> derecha, la derecha, y hay un botoncito que dice Start Editing. --> Debajito de la mano que tiene allá, o debajito del menor hamburguesa, --> el menor hamburguesa los tres puntos. Debajito de los tres puntos, --> el lado derecho, está un botoncito que dice Start Editing, lado derecho. --> Está ahÃ, ahà te va a ir, está ese que está ahÃ, perfecto. --> Dale click ahÃ. --> Si desea, por favor, lleva las cuatro tablas al centro. --> Y él va a mostrar, bueno, si las tablas están referenciadas, pues --> mostrarÃa la referencia de las cuatro tablas. --> Puedo unir ahÃ, puedo agregar más columnas, bueno, ahà puedo hacer --> muchas cosas con ese elemento que está ahÃ. --> Listo, perfecto. En este caso, pues no nos vamos a complicar la vida de --> crear modelos simplemente para que sepa eso que está ahÃ. --> Y ahora, dele Save, por favor, para guardar. --> Salte de ahÃ, devuélvete a donde estabas anteriormente, --> dale atrás en el browser para que te devuelvan al menú anterior, --> atrás en el browser. --> Ya vimos el menú que dice Diagrama Entealación. --> Dale click en Tables, por favor. --> Tables, ahà aparece cinco, indicando el número de tablas. --> El siguiente menú. --> Puedo acceder a cualquiera de esas tablas directamente desde ahà --> y ver la configuración que tienen. --> Ve al siguiente menú que dice Proceso Relacionados. --> El acto, ese que está ahÃ. --> Eso que me va a mostrar ahà es si esa base de datos --> tiene procedimientos almacenados. --> Porque recordará, cuando hicimos el Import Setac, --> me preguntaba si deseaba importar los procedimientos almacenados. --> En este caso, no tiene. --> Váyase al Dataflow, que te quise un poquito más importante, --> Dataflow, al menú que sigue, Dataflow. --> Ese Dataflow lo que me va a permitir mostrar es --> si existe una relación de alguna tabla de la base de datos --> con algún job, es decir, con un metadato de operativo. --> En este caso, no lo hay. --> Aparecen nada más los nombres de las tablas que tengo, --> pero no existe ningún job, --> pipeline o workflow que me permita definir un flujo de datos --> con esas tablas que están ahÃ. --> Vete al siguiente que viene, Semantic Flow. --> Este Semantic Flow lo que tiene es que me va a permitir --> mostrar si el modelo, el metadato técnico --> está relacionado con un metadato de negocio. --> En pocas palabras, si tengo relación de alguna tabla --> con algún glossario que haya definido. --> En este caso todavÃa está vacÃo, --> y vamos a hacer eso más adelante. --> Sigue por favor donde dice Comment. --> Dale click en Comment. --> Ahà por favor podemos adicionar cualquier comentario. --> Dice entonces, adicione el siguiente comentario por favor. --> Actualmente, actualmente --> los metadatos técnicos --> no tienen asociados metadatos operativos --> y metadatos de negocio. --> Dale Enviar. --> Submit para que te quede ahÃ. --> Submit. --> La idea cuál serÃa esto? --> Es que tú puedas comunicarte internamente --> partiendo del hecho que tú puedas compartir estos modelos. --> Entonces, cualquier persona puede leer tu comentario, --> quién lo hice, y ahà puedes hacer entonces, --> digamos que un conjunto de incidencias de qué estás haciendo, --> qué te falta por hacer, --> es una forma de comunicarte con la persona que estás compartiendo --> el objeto como tal. --> Vete por favor donde dice Attachment. --> Este Attachment lo que va a permitir es que --> seguramente quizás si estás bien organizado --> a nivel de los, digamos, de tus bases de datos, --> quizá tengas algún documento que sea algún manual --> entonces puedes subir un manual que dé información más detallada --> quizás de la base de datos que estás hablando. --> En este caso no vamos a hacer el ejemplo, --> pero para eso funciona el Attachment. --> Y listo. --> Hay Responsabilites y History, ya lo vimos. --> Responsabilites serÃa aquà le di permiso. --> History, pues todo lo que he hecho con ese objeto como tal. --> Vete nuevamente al menú Overview si quieres grabarle. --> Y dale click ahora en la tabla que se llama Anonymized Order. --> Dale click por favor. --> Y vamos a desclosar entonces este señor que está aquÃ. --> En primer lugar, aparece un User Tag, --> bueno aparece Overview Documentation que te lo voy a explicar más adelante, --> pero vamos a ubicarnos dice Column. --> Ahà me está mostrando 10 de 16 columnas. --> Si te das cuenta, ahà en Column, si le das click ahà en el mayor, --> llevarÃa a la siguiente pestaña donde estarÃa demás columnas. --> Dale click ahà por favor. --> Y te deberÃa mostrar entonces las siguientes columnas. --> Devuélvete por favor nuevamente. --> El User Tag te lo explico más tarde, --> pero entonces, ¿qué serÃa prácticamente la metadata que tengo, --> de metadata técnica que tengo de esa base de datos? --> SerÃa imágenes particularmente de esa tabla. --> Te dirÃa el nombre de la columna, el tipo de la columna, la longitud y la escala. --> Guarda toda la metadata que pueda de esa base de datos. --> Y si es Nullable, es decir, los primeros campos que es Name, Data Type, Length, Escala y Nullable, --> son la metadata técnica de esa tabla. --> Es la que guarda internamente el talent data catalog. --> Ahora, si te posicionas en Column Statistic, --> ahà aparece como una especie de azul, --> pasa el mouse por encima de ese azul que tienes ahÃ. --> En ese Column Statistic, en cualquiera de las columnas, --> el mouse lo es. --> Entonces, ahà te va a dar un recuento, --> te da de forma general, --> y esto viene para la parte de calidad de datos. --> Entonces, te habÃa dicho que la herramienta permite hacer Profiling, --> detectar alguna anomalÃas. --> Entonces, quizás tú entiendas los datos --> y puedas, con la información que está dando, encontrar un error. --> Ahà solamente me muestra valores vacÃos, --> distintos valores y valores duplicados. --> No hay ningún valor duplicado. --> Sigue a la siguiente columna que es Histograma, --> Histograma de Columnas. --> Nota que solamente aparecen elementos en algunas. --> Histograma solamente va a aparecer cuando la columna es tipo numérico. --> Entonces, ahà lo que hace es que --> hace un agrupamiento de datos para Profiling. --> Por ejemplo, ahà me está diciendo que ha creado grupos. --> Cada grupo tiene un solo elemento. --> ¿Por qué tiene un solo elemento? Porque no hay duplicados. --> En pocas palabras, lo que está haciendo es que está creando grupos --> en geocode que tengan exactamente iguales. --> Ahà hay que formar un grupo por cada uno, --> ya habiendo cinco registros apenas. --> Entonces, ahà lo que estamos diciendo es que todos los --> elementos que están ahà no hay ningún duplicado. --> Si hubiese duplicado, te mostrarÃa el histograma --> de cuántos duplicados y a qué grupo pertenece. --> Viene la sección esa que dice Conditional Labels. --> Ese Conditional Labels, --> que es otra forma de documentar, --> son de forma genérica. --> Entonces, si eres tan amable un momento, --> sálgase de ahà y va a estar la sección de Manage. --> Manage, vete un momento a Manage. --> Al menú Manage. --> Y vas a encontrar --> un submenú que se llama Conditional Labels. --> En el menú superior, Daniel, el principal. --> Dice Object Collection. --> Manage. --> Ya el de arriba, el de abajo arriba. --> Vete al Manage, exactamente. --> Y vete al... --> Hay una opción debajo del Label que ya lo vimos --> que dice Conditional Labels. --> Dale clic por favor ahÃ. --> Sigue bajando. --> Ese que está ahÃ. --> Bien. Y este Conditional Labels lo que va a definir --> es el grado de sensibilidad --> que pueda tener, digamos, --> perdón, es el grado de confidencialidad --> que querÃas tener a nivel del --> del dato como tal, de la columna. --> Para que recuerdo algo. --> Bien. --> En concepto de privacidad de datos --> hay dos elementos fundamentales. --> El concepto de lo que es sensibilidad --> y el concepto de lo que es --> confidencialidad. --> Entonces, sensibilidad significa que el grado --> es importante y tengo que darle un elemento --> de seguridad mucho mayor. --> Esa sensibilidad me puede llevar a que el --> dato esté encriptado. --> Por ejemplo, es sensible --> la clave de un empleado --> o la clave de un cliente. --> Entonces, ese dato tengo que --> marcarlo como sensible. --> Ahora, el grado de seguridad se define --> dependiendo del nivel de sensibilidad que tenga --> el dato. --> Y existe otro elemento que es el nivel --> de confidencialidad. --> ¿Qué es? --> Listo. Por ejemplo, historial médico. --> Por defecto en caso, --> creo que a nivel mundial, --> un médico no puede compartir --> el historial médico de un paciente --> con un tercero. --> A menos que sea pues colegue que trabaja --> en la misma clÃnica. ¿Por qué? Porque --> esos datos son confidenciales. Entonces, --> este conditional level, lo que --> le va a indicar es el grado --> de confidencialidad que pueda tener --> entonces el dato. --> Por defecto, desde cuenta que aquà hay varios. --> Creo que estos no han sido cambiados. --> Entonces, tengo confidencial, --> altamente comentado, altamente --> confidencial, y tengo uno interesante --> que se llama PII, que es --> información --> de identificación personal. --> Que puede ser --> nombre, apellido, --> ubicación. --> Devuélvase un momento, por favor, ahora sÃ. --> Dale atrás mejor --> en el browser para que se haga sencillo. --> Nos ubicamos --> en la misma. --> Note que ahà aparece el --> sÃmbolo en naranja y el naranja --> corresponderÃa allá en los niveles que tenÃamos allá --> como PII, --> información de --> identificación personal. ¿Por qué? --> Él lo identificó como city. --> City es una ubicación. Lo marcó bien. --> Ahora, dese cuenta en el --> data classification. --> Note que lo clasificó --> de diferentes. Hizo --> una clasificación bastante alta. --> Para ver mejor eso entonces, y --> para ver lo que está ahÃ, --> le vamos a dar click en el nombre de la columna. --> Devuélvete hacia atrás y dale click en el nombre --> de la columna, por favor. --> SerÃa city. --> La columna donde dice name, --> dale click en city. --> Y aquà --> detallo. --> Un momento que cargue. --> Bueno, nuevamente este --> menú es para calidad de datos. --> Lo que está buscando --> esta herramienta es que a partir de la información --> que te está mostrando, --> tú puedas hacer una análisis y determinar que el --> dato pueda estar errado. --> La herramienta no te corrige. --> No hace limpieza de datos. --> Lo máximo que podÃa hacer tú es un issue, una incidencia --> para que haya una persona encargada --> y haga la correlación del dato. --> Bueno, en primer lugar, dice que --> el dato es string. ¿Por qué es string? --> Porque recuerde que esto está en Java. --> Y un tipo de datos en Java es string. --> Entonces, él asocia el bar chart que es texto en un --> Entonces, él asocia la columna --> string acá para Java. --> Note que me hace una análisis de patrones. --> Esa análisis de patrones me está diciendo --> mira, el 60% --> de los datos --> empiezan con una letra --> en mayúscula y siguen --> con dos y cinco letras --> en minúscula. --> El 20% tiene --> una letra en mayúscula y cuatro --> en minúscula. --> Y el 20% restante tiene --> una letra y empieza con otra mayúscula --> y restan y le siguen tres letras --> en minúscula. ¿Para qué puede --> ser esto? Bueno, quizás --> hay algunos formatos que ya tú --> sabes. Por ejemplo, hay formatos de correo --> de clientes. ¿Cuál serÃa el formato que ya tú lo --> conoces más o menos? ¿Cuál serÃa --> el formato de los códigos postales? --> Entonces, este análisis a nivel --> de lo que es de patrones podrÃa identificar --> qué datos están guardados. --> ¿De dónde saca esto? Si se le cortará coincidimos --> en el import option, hicimos --> data profile mil. --> Ese mil quiere decir entonces que él va --> a tomar mil elementos --> y a esos mil elementos le va a sacar esto --> que está aquÃ. Eso no es a todos los --> registros, es solamente --> el que hayas definido. --> Solamente serÃa todo si le marcaba cero. --> Del otro lado, --> lo dice a frecuencia, --> me va a indicar cuántas veces aparece cada --> elemento. En este caso solamente --> hay cinco registros. Me parece Roma --> una vez. O sea, veinte por ciento --> del cien por ciento serÃa entonces --> como hay cinco registros, el veinte --> corresponderÃa a uno. --> BerlÃn tengo nada más veinte por ciento, uno --> solo, Madrid veinte por ciento, --> Londres veinte por ciento y ParÃs veinte por ciento. --> Y lo demás son datos estadÃsticos que son --> fundamentales en todo proceso de calidad, --> que serÃa cuántos elementos hay, --> cuántos distintos hay, cuánto duplicado, --> cuánto vacÃo, --> etcétera. --> Por ejemplo, si tú vas a hacer --> que te digo yo, una campaña --> de mercadeo por correo y --> nota que el correo, hay un correo, --> hay correos que están vacÃos, ya hay --> un problema de calidad, ¿por qué? Porque no les va a llegar --> a todos esa campaña de mercadeo. --> Pero tú puedes identificar muchos --> problemas acá. --> Listo. Note entonces --> que me aparecen muchos elementos y acá --> me aparece un label. --> Un label, no te cuenta, el lado derecho. --> Y este label va a estar --> para todos los objetos que te encuentres --> en --> en la herramienta. --> Va a haber label, --> como estoy conectado a una base de datos, --> puede hacer un label a nivel de tablas --> o puede ser label a nivel de columnas. --> Este label que está allá es a nivel de columnas. --> Pero con una caracterÃstica interesante. --> Dale click por favor. Por favor en label. --> En add label dale click por favor. --> Dale click. --> En add label. --> Y dale click en combo box. --> Si se da cuenta, --> los labels que aparecen acá --> no son los mismos labels --> que aparecÃan como de Gdaños. --> Porque estos labels ya son propios --> de la configuración. --> Significa que solamente van a ser compartidos --> dentro de la configuración. Por ejemplo, --> para agregar un label, dale entonces --> coloca ahà la palabra --> ubicación. --> Si eres tan amable, ubicación. --> Y para guardarlo, dale click ahà --> en el chulito que está abajo. --> Listo. --> Listo. --> Déjemelo aquÃ, esto ahÃ. --> Ahora vemos los labels entonces. --> Vamos ahora con dicho label --> que fue el que aparecÃa. Ese me va a dar --> el nivel de --> confidencialidad de la columna --> en este caso. Y note, --> bueno, collection te lo voy a decir más adelante. --> Collection era como decir una --> subcarpeta dentro de la carpeta de configuración. --> Me quiero centrar mucho en la --> parte de data classification. --> Nota lo siguiente. --> Dice last name. --> 100%. --> Significa --> en que el 100% --> de los --> registros que tengo --> ahà en este caso del data sampling, --> el 100% --> corresponde a un diccionario llamado --> last name. En pocas palabras, --> esos nombres --> de ciudades --> seguramente están --> como nombres de apellido en ese diccionario, --> el 100%. Y por eso te lo clasifico --> de esa manera. Sigue --> first name. --> Se da cuenta que first name --> está al cento por ciento, al ladito --> del listo. ¿Qué quiere decir --> eso first name? Quiere decir --> entonces que el 60% --> de esos registros que están ahà --> están allá en el --> diccionario que se llama first name. --> Y asà sucesivamente con cada uno de ellos. --> Aquà podÃamos a quitar --> y agregar. Por favor, --> quita por favor ese last name. --> Si colocas el mouse sobre last name --> te va a aparecer como una X. --> Dale ahÃ, --> dale en la X, quÃtale --> last name. --> QuÃtale first name. --> Y deja las demás. --> Mira como la clasifico. --> La clasifico como PI, --> PI first name, PI identification --> y PI last name. Que pena. Ahà me quedo --> con el PI first name, quÃtale el PI --> first name y quÃtale PI last name, por favor. --> El PI first name. --> Oh, la herramienta --> en esta parte de clasificación --> se puede equivocar y se puede equivocar mucho. --> Porque el parte del hecho de tomar --> los datos del data sampling --> y antecedido verificar si están en algún --> diccionario o en su --> efecto en alguna expresión regular. --> Bien, aquà nos muestra las caracterÃsticas --> de la columna. --> No dice pues tipo --> de columna, tipo de --> datos que es columna, posición --> de la columna, tipo de datos, longitud --> y me interesa --> la sección --> que dice --> has semantic definition --> y has --> data lineage. --> Ese truque está aquà --> quiere decir entonces que tiene --> la columna tiene algún tipo --> de documentación ya establecida. --> Y el data lineage a talent force --> indica que todavÃa no hay un --> job que esté unido --> a esa columna como tal. --> Bueno, eso es --> para terminar ya, el comment ya sabemos --> attachment que está en la parte de, ah, perdón. --> Sube --> por favor. --> Dice overview --> dale click en --> reportes relacionados. --> Dale click en reportes relacionados. --> Significa que si hay --> algún report, tablú, --> quilk --> o power --> b que tenga relación con esa columna --> o que te usó esa columna, no hay ninguno. --> Dale click en procesos --> relacionados, por favor. --> Si esa columna está en algún --> procedimiento macinado, no. --> Vete en data flow. --> Si la columna tiene --> alguna relación con algún job --> al estar nada más, no. --> Está apareciendo más de solo. --> Y vete a semantic flow, por favor, ya. --> Para finalizar porque lo demás es igual. --> Aquà dice --> vete a un momento donde dice diagram --> del lado izquierdo --> te va a aparecer una opción que dice --> list y diagram. --> Dale click en diagram. --> Y ahà lo que te está diciendo --> es de dónde pertenece la columna. --> Es decir, la columna está metida dentro --> de un esquema llamada, --> perdón, la columna Citi está metida --> dentro de una tala llamada Ano y Mais. --> Ano y Mais está metida dentro de un esquema --> llamada ACME Sporting. --> Y ACME Sporting está dentro de un modelo llamado --> ACME Sporting Web. Eso es lo que está marcando --> de datos semánticos --> de esa columna como tal. --> Dale atrás allá en el --> browser, por favor. --> Dale nuevamente atrás --> y lo dejas ahÃ. --> Bien, entonces --> dale, devuélvete --> o dale click Ano y Mais. --> Ahà está metada y va a avanzar. Dale click, por favor. --> Listo, estamos ahÃ. --> Dale click ahora en label, por favor. --> Ustedes dale click en label. --> El label de la esquina superior --> derecha. --> Dale click ahÃ. --> Y expande, por favor, el combo voz. --> Date cuenta que te aparece el label --> que agregaste esa hora. --> ¿Por qué? Porque esos labels son --> a nivel de la configuración --> que tengas. --> Los labels de, por ejemplo, --> Dennis son diferentes a los labels que tiene --> Daniel y los labels que tiene Verónica. --> Porque ahora, como cada uno tenemos --> una configuración, esos labels que están ahà --> son de la configuración que estés --> definida. --> Listo. Si quieres, baja un poco --> más. Y vamos entonces. --> Note que ese data sample --> cuando hicimos el import --> recordará que el data sample estaba en 10. --> Aquà aparece en 5 nada más. --> ¿Por qué? Porque nada más en esa tabla hay 5 --> registros. Si apareciera --> más de 10, pues solamente tardarÃa 10. --> Listo. Aquà --> también cuando hicimos el import le dije --> tráeme los Ãndices. --> Aquà me está mostrando entonces que hay --> varios Ãndices. Un Ãndice --> a nivel de orden, o sea, cuando --> tú creas por definición, creas una tabla --> y a tabla le creas un primary key. --> El primary key por defecto --> lo que crea es un Ãndice. --> Crea un Ãndice. --> Y entonces tengo también un Ãndice --> a nivel de primary key y un Ãndice --> a nivel de foreign key. --> También recordará que --> las bases de datos han avanzado mucho. --> Entonces para hacer el join --> y tú tienes un foreign key, entonces se hace --> un Ãndice para que ese join sea mucho más --> eficiente. Solamente la tabla esa en --> particular tiene dos Ãndices. --> El de primary key y el de foreign key. --> Listo. Aquà me sigue --> el profiling statistic. Me está diciendo --> de cuántas hizo estadÃsticas. --> Nada más de 5, aunque yo haya cogido 1000. --> Solamente --> hizo 5 de 5 porque nada --> más hay esa cantidad de registros. --> Y el data request SQL --> es que yo podÃa sacar --> algunos datos con una consulta --> SQL para hacer la parte de --> profiling. Entonces un poquito más avanzada o --> no sé si al final --> nunca la he usado porque --> al final lo que busco es que coloco el data --> profiling y que cada vez que yo haga un nuevo --> import me coja un dataset --> diferente. --> Listo. En esa no hacemos --> más nada. Creo que expliqué todo --> en ese señor que está ahÃ. --> Vete al --> repositorio por favor ahora. --> Perfecto. Nos quedamos en el repositorio. --> Vamos a hacer --> faltando ya 20 minutos para dos horas. --> Vamos a --> adelantar un poquito el break. Escazo un poco la --> arcanta. Volvemos en --> 10 minutitos, ¿OK? --> Para continuar --> con esta parte. --> Ya vengo, volvemos en 10 --> minutos. Listo. --> El --> Bienvenido al --> Corea --> de Corea