La Biblioteca Nacional pone a disposición del público su archivo de la web española

La colección incluye blogs, foros, cuentas de Twitter, imágenes y vídeos que se recolectan con el fin de preservar el patrimonio documental de Internet.



La Biblioteca Nacional de España y varios centros de conservación de las Comunidades Autónomas han puesto a disposición de sus usuarios un portal desde el que será posible acceder a la colección formada por los sitios web archivados (incluidos blogs, foros, cuentas de Twitter, imágenes, vídeos, etc.) que se recolectan con el fin de preservar el patrimonio documental español en Internet.

Inspirándose en las Directrices para la preservación del patrimonio digital de la UNESCO (2003) y en la Recomendación de la Comisión Europea de 24 de agosto de 2006 sobre la digitalización y la accesibilidad en línea del material cultural y la conservación digital, la BNE comenzó a capturar páginas y sitios web españoles en 2009. La primera recopilación tuvo como objetivo cubrir de forma monográfica las Elecciones Generales del 20 de noviembre de 2011 y la segunda se ocupó de reunir recursos españoles del ámbito de las Humanidades.

«Se trata de un proyecto ambicioso», admitió Mar Pérez Morillo, jefe del área de gestión del depósito de las publicaciones en línea de la Biblioteca Nacional. «Por un lado, realizamos búsquedas masivas de todos los contenidos de un dominio, como, por ejemplo, el .es. Por otro, hacemos búsquedas selectivas, referidas a acontecimientos importantes en la historia de nuestro país como la abdicación de Juan Carlos I. También llevamos a cabo recopilaciones temáticas acerca de contenidos científicos, artísticos y literarios para las que necesitamos el asesoramiento de expertos en la materia en cuestión», explicó.

El proceso de archivo se realiza con robots rastreadores que recorren las URL seleccionadas previamente y guardan todo lo que encuentran enlazado, con la frecuencia, profundidad y tamaño que se determine. Posteriormente, se intenta reproducir con detalle el aspecto del sitio y las funcionalidades del mismo disponibles durante la captura, de tal forma que la réplica del sitio web sea tan navegable como su versión «viva». Una vez completado el rastreo, las webs archivadas son visualizadas en la OpenWayback, una aplicación que ofrece al usuario la posibilidad de seleccionar qué versión concreta de una web determinada desea consultar.

Limitaciones legales

En 2015 se aprobó el Real Decreto que regula el depósito legal de las publicaciones en línea. Este real decreto desarrolla la Ley 23/2011, de 29 de julio, de Depósito legal, en la que se consideran por primera vez objeto de depósito legal los sitios web y las publicaciones en línea. Este real decreto respalda la actividad en materia de preservación de publicaciones en línea que los centros de conservación han llevado a cabo en los últimos años, en particular en cuanto a los proyectos de archivado web.

Sin embargo, existen limitaciones respecto a la difusión de estos contenidos. «Para acceder al archivo,hay que dirigirse a la Biblioteca Nacional de España o a las bibliotecas habilitadas por las Comunidades Autónomas y utilizar los ordenadores diseñados para ello. No podemos dar acceso en abierto online debido a la Ley de Propiedad Intelectual. Por ejemplo, podemos capturar la hemeroteca de un periódico publicado hoy, pero mañana la información ya sería privada», explicó Mar Pérez Morillo.

Fuente: ABC


Véase además:

Archivo de la Web Española

Acceso al Archivo de la Web Española

Biblioteca Nacional de España

Comentarios