En Azure podemos encontrar una gran variedad de Storages o repositorios para almacenar información estructurada o no estructurada como el Azure Data Lake Storage Gen1.
Azure Data Lake Storage Gen1 es un repositorio a gran escala de nivel empresarial para cargas de trabajo de análisis de macrodatos. Azure Data Lake permite capturar datos de cualquier tamaño, tipo y velocidad de ingesta en un único lugar para realizar análisis exploratorios y operativos.
Documentación Microsoft
Una característica que destaca este repositorio es el precio – valor que otorga dentro de una arquitectura de datos, está diseñado para almacenar grandes cantidades de información a un precio muy bajo.
En este artículo indicaré el paso a paso para crear una conexión anónima a Azure Data Lake Storage Gen1, utilizando una aplicación de registro.
Creando el grupo de recursos
En primer lugar, crearemos un grupo de recursos, que permitirá mantener una organización y control de accesos a la solución a la que pertenecerá nuestro repositorio.
A continuación, en la sección «resource groups«, seleccionamos agregar:
Luego, indicamos el nombre del grupo de recursos, la región y seleccionamos crear:
Con esto, tendremos creado el grupo de recursos, aparecerá una notificación como se ve a continuación cuando termine el proceso:
Creando un recurso Azure Data Lake Storage Gen1
Regresaremos a la sección de grupos de recursos, y haremos click en el grupo de recursos creado:
Una vez dentro del grupo de recursos, seleccionaremos agregar:
Esto nos llevará la sección de Marketplace, donde escribiremos el recurso que necesitamos, en nuestro caso «Data Lake Storage Gen1«:
Seleccionamos crear:
Se abrirá una ventana para configurar el nombre del recurso, la suscripción que utilizaremos, y la ubicación, por último seleccionamos crear:
Aparecerá una notificación indicando que el despliegue está en curso, y una nueva cuando esté listo:
Con esto, estaría creado nuestro Azure Data Lake Storage Gen1:
Creando conexión anónima a Azure Data Lake Storage Gen1
Comenzaremos creando el registro de aplicación, nos dirigimos a la búsqueda del portal, escribimos «app registration«, y hacemos click en la opción de servicios que aparece:
Una vez allí, seleccionamos «new registration«:
Ahora bien, indicamos el nombre de la aplicación, quienes podrán utilizar el registro de aplicación, y una página de redirección, en nuestro caso utilizaremos «https://google.com«, y por último registramos:
Con esto, estaría creada:
Continuaremos creando una llave de acceso al registro de aplicación, en la sección «Certificates & secrets«, indicamos el nombre de la llave y cuando expira:
Una vez creada, es importante almacenar en un lugar seguro el valor de la llave, ya que luego será imposible recuperarla, en caso de perderla, se tendría que generar una nueva llave, y reemplazar el valor donde se ha utilizado:
Seguidamente, regresamos a nuestro recurso Azure Data Lake Stotage Gen1, y nos dirigimos a la sección «Data Explorer«, para realizar la conexión anónima a Azure Data Lake Storage Gen1:
Una vez allí, seleccionamos «Access«:
Seleccionamos agregar:
En la pantalla de asignación de accesos, primero seleccionamos el registro de aplicación que creamos, luego asignamos los permisos que tendrá sobre el recurso, si tendrá acceso solo en la carpeta actual o en ella y sus subcarpetas, el tipo de permiso, y finalmente seleccionamos «Ok«:
Concluyendo
Con estos pasos tendríamos ya creada la conexión anónima a Azure Data Lake Storage Gen1, para ser utilizada desde un aplicativo que requiera acceso a nuestro recurso, un proceso ETL o ELT de carga y procesamiento de datos, entre otros escenarios.
Espero que les resulte de utilidad, y nos estaremos leyendo en próximas entradas.
Te invito a leer nuestros artículos, y visitar nuestro canal de YouTube NotJustBI, pueden ser de gran interés para tí!
Por favor, si tienes algún comentario, duda o sugerencia, no dudes en contactarnos a través de nuestro correo: info@notjustbi.com