viernes, 7 de diciembre de 2012

Metadatos

1  ¿Qué son los Metadatos?
Los metadatos son información relativa a un documento, tales como el autor, el programa utilizado o la catalogación que el usuario ha hecho del mismo, y que existen para enriquecer la información que proporciona el documento.
Por ejemplo, es habitual que las cámaras fotográficas o los programas de tratamiento de imágenes almacenen en los metadatos información del modelo de la cámara, la hora de realización de la fotografía o el programa utilizado para su tratamiento.
Son muchas las aplicaciones que almacenan metadatos junto con los documentos, ya sean archivos de audio, video, textos, presentaciones, bases de datos u hojas de cálculo. Entre ellas, por supuesto, se cuentan las aplicaciones que forman parte del paquete Microsoft Office.

2  ¿Qué información guardan los documentos de Office?
Hablaremos de Office ya que un elevado porcentaje de los documentos que se generan y distribuyen por la red son realizados con dicho paquete, seguidos en popularidad por los ficheros en formato PDF.
Los tipos de datos que podemos encontrarnos en los metadatos son los siguientes:
-          Propiedades del software
Cuando instalamos Office por primera vez el programa solicita introducir un nombre de usuario. En cambio en una red empresarial es habitual que un mismo producto sea utilizado por varias cuentas de usuario distintas de un mismo ordenador. A cada uno de estos usuarios de empresa, la primera vez que use Office, le aparecerá un cuadro de diálogo para rellenar esta información. Y los valores que introduzca figurarán en todos los documentos que dicho usuario genere a partir de ese momento desde ese ordenador.
La Figura 2 muestra la pantalla de introducción de datos de Microsoft Office 2003
-          Propiedades del documento.
Los datos que componen las propiedades del documento pueden ser modificados de forma manual y sencilla por el usuario, tal como muestra la Figura 3.
-          Ficheros incrustados
Cuando se agrega a un documento una imagen externa, una tabla, gráficos que proceden de otros documentos, etc.… los metadatos asociados a ello se incrustan en el nuevo documento. De esa manera los ficheros de Word o Excel se van convirtiendo con el paso del tiempo en una fuente de metadatos de distintos orígenes.
           
-          Revisiones y modificaciones
Una de las características más apreciadas de los usuarios de Microsoft Office que trabajan de forma colaborativa en un documento son las opciones de revisión.
Con estas herramientas, múltiples usuarios pueden realizar cambios al documento, de manera que siempre quedarán almacenadas las versiones anteriores del documento, siendo posible recuperar el estado anterior asociado a dichas versiones.
Todas estas revisiones y estados anteriores se incluyen por defecto en el documento de trabajo. La Figura 4 muestra un ejemplo de datos de revisión a almacenar en el fichero. En concreto, en el ejemplo se puede apreciar cómo en versiones anteriores del fichero la empresa a la que hace referencia el ejemplo se encontraba en números rojos.
-          Notas, encabezados y pies de página.
Toda la información que contengan dichos apartados también está incluida en los metadatos. En muchos casos esta información se oculta a la vista y se utiliza sólo como información  interna o como anotaciones para el autor.
-          Información oculta.
En ocasiones al insertar una imagen, al superponer una capa de texto, cambia el color de las fuentes,  o simplemente por olvido hay información que deja de ser visible y no está a la vista del que accede al documento de forma simple. Sin embargo, esta información sí queda guardada u puede ser recuperada por otro usuario.
La Figura 5 muestra un ejemplo de texto que ha quedado oculto al utilizar una fuente de texto del mismo color que el fondo, pero que al ser seleccionado aparece a la vista. Algo así no quedaría nada bien si este fuera un documento de la empresa y llegara a manos de un cliente curioso.
-          Información GPS
La información de localización no es propia de un documento de Office pero sin embargo es cada vez más habitual en el caso de imágenes, sobre todo aquellas realizadas con móviles.
Dado el elevado número de fotografías que se hacen con el móvil y se cargan en la nube, es fácil imaginar la gran cantidad de información que está disponible a través de estos metadatos.
-          Metadatos ocultos
Office también guarda información para optimizar si propio uso, desde versiones del software con el que se ha realizado y modificado el documento, impresoras asociadas, fechas de creación y modificación, nombre del autor y autores que lo han podido  modificar, la última vez que se imprimió el archivo, el tiempo total que se ha estado trabajando con ese documento, información sobre el tamaño del documento y hasta un identificador único del archivo que se creaba en los documentos generados en algunas versiones de Microsoft Office las cuales utilizaban información del equipo para generar el identificador, lo que podría ser usado para seguir un documento hasta el equipo desde el que fue creado. 
Toda esta información puede permitir rutas a servidores internos de la organización, nombres de usuario, los autores del documento y si éste fue posteriormente modificado o no, quién lo modificó, desde dónde, etc.… 
En algunos casos también pueden obtenerse datos de conexiones a bases de datos. En la Figura 6, por ejemplo, aparece una consulta SELECT, los nombres de los drivers ODBC usados, el servidor de bases datos, el nombre de la base de datos e incluso la cuenta de acceso con su correspondiente contraseña.
Todos estos datos se pueden obtener analizando el documento con un editor hexadeciman, pero es posible obtener muchos más datos utilizando herramientas específicas para esta tarea. Una de dichas herramientas, desarrollada en España.
Es considerada como lo mejor que existe hoy en día en análisis de metadatos: la FOCA.

1.2.3  El peligro real de una mala gestión de los metadatos en la web. Usando la FOCA

Como ha sido comentado anteriormente, una mala gestión de los metadatos en los documentos publicados en la nube puede exponer información sensible, aunque el proceso para recabar y organizar esta información puede ser largo y tedioso. Por ello, un grupo de informáticos españoles crearon la herramienta FOCA, que recaba toda la información con un único click. La Figura 7 muestra la pantalla principal de la herramienta FOCA.
Para desarrollar el análisis de la web del Ministerio de Cultura, mostrado en la Figura 7 se ha realizado una búsqueda en Google, Bing y Exalead, encontrándose 1385 documentos.
De ellos se han descargado 257 documentos, en los que la herramienta, ha detectado 186 nombres de usuario, 113 carpetas, 29 impresoras, 1 dirección de correo y 3 sistemas operativos.
Siguiendo con el ejemplo, si ha sido posible obtener toda esa información con tan sólo 257 documentos, es posible imaginar la cantidad de información que se podría obtener al analizar los 1385 documentos que hay disponibles en la red. Con esos datos es posible realizar un mapa de su red con servidores, con información de direcciones IPs y sistemas operativos, de manera que una persona con malas intenciones podría comenzar a personalizar su ataque buscando los exploits y agujeros conocidos para esos sistemas en esas versiones. La Figura 8 muestra precisamente el esquema de red obtenido con la FOCA.

1.2.4  ¿Cómo protegernos?

Protegerse de un análisis de metadatos pasa por tener una correcta gestión de los mismos, es decir, en una red empresarial hacer una limpieza de los metadatos de los documentos que estén expuestos a la nube.
Para hacer esta limpieza existen diversos programas, de entre ellos destaca Doc Scrubber () ya que puede analizar y eliminar metadatos de gran cantidad de documentos al mismo tiempo y de forma automática.
De este modo si la empresa tiene un servidor que alberga documentos con tan solo pasar este programa por la carpeta principal de dichos documentos el ya irá pasándose por las subcarpetas, buscando los documentos que existen y dentro de los mismos los metadatos. De este modo limpiar los metadatos de un volumen importante de documentos se hace cómodo.

No hay comentarios:

Publicar un comentario

Esperando tu comentario...