¿Va a desaparecer la información virtual?

En su nueva columna de opinión, Rosa Monfasani reflexiona sobre este tema que afecta, en forma muy acelerada, el acceso a la información. 

Imagen generada con AI

Imagen de Independent

Ante la lectura de una noticia aparecida en el Boletín de la SAI sobre que la información en la web puede desaparecer, comencé a incursionar nuevamente en algunas lecturas y regresó esa constante preocupación, por lo que decidí escribir esta columna.

Con las imágenes elegidas como ilustración se trata de dar, en la primera la sensación de la información que se escapa y en la segunda mostrar cómo se entremezcla. En la conjunción de ambas, como puede perderse.

Consulté a Meta AI y tal como los expertos lo vaticinan arrojó las siguientes razones:
1. Eliminación intencional: Los autores o propietarios de la información pueden eliminarla.
2. Expiración de dominios: Si un dominio no se renueva, la información asociada puede desaparecer.
3. Cambios en la estructura del sitio web: Reorganizaciones o rediseños pueden hacer que las URLs cambien o desaparezcan.
4. Fallos técnicos: Problemas de servidor, bases de datos o software pueden causar pérdida de datos.
5. Censura o bloqueo: Gobiernos o entidades pueden bloquear o eliminar contenido.
6. Desaparición de plataformas: Cuando una plataforma o servicio cierra, la información asociada puede desaparecer.
7. Envejecimiento de formatos: Cambios en tecnologías o formatos pueden hacer que la información sea inaccesible.
8. Falta de mantenimiento: Sitios web abandonados pueden sufrir pérdida de información.
9. Ataques cibernéticos: Hackeo o ataques maliciosos pueden destruir información.
10. Naturaleza efímera de la web: La web es dinámica, y la información puede desaparecer con el tiempo.

Un estudio realizado por Griffin y otros expertos dice que: “… de las páginas web que existían en 2013, ahora se perdió el 38%. Incluso las páginas más nuevas están desapareciendo: el 8% de las páginas que existían en 2023 ya no están disponibles”. Y que las páginas suelen desaparecer cuando se borran o cambian.

La investigación estima que el 23% de las páginas de noticias incluyen al menos un enlace roto, y que el 21% de los sitios web gubernamentales y el 54% de las páginas de Wikipedia incluyen en sus referencias un enlace que ya no existe.

Recuerdo que algo similar fue objeto de preocupación cuando en la columna Conservación y preservación de lo escrito manifesté que las páginas que dejan de existir, constituyen hoy un serio problema en la conservación de los documentos de carácter electrónico en cualquiera de sus manifestaciones virtuales.

Es importante ser consciente de la naturaleza temporal de la información en la web y tomar medidas para preservarla.

Nuevamente citando a meta AI, para preservarla recomienda:
1. Guardar copias locales.
2. Utilizar servicios de archivo como Internet Archive.  
3. Enlazar a fuentes primarias.
4. Crear backups regulares.
5. Utilizar formatos abiertos y estándares.

No obstante, estos consejos generan otras preocupaciones: que las copias guardadas se pierdan si el software y el hardware no se actualiza, que los servicios del Internet Archive dejen de ser sin fines de lucro o los gobiernos no se preocupen por mantenerlo, que al enlazar con fuentes primarias se pierde o se mezcla información, que cuando se creen backups se podrá recurrir a ellos, aunque cambien softwares y equipos, y que pasará si al utilizar formatos abiertos y estándares se modifican esos formatos o se crean nuevos estándares. A lo mejor, estas no sean las cuestiones más acertadas, pero ¿cómo avizorar el futuro y preparar la estrategia adecuada?

La tarea no es sencilla, formará parte de las reflexiones que se generen respecto a los cambios que se vayan produciendo. Y surge una cuestión ¿cuál será la actitud para encararlos y cómo podremos afrontarlos?

Todo esto nos hace pensar si la información que no se perdió es la que se encuentra en los soportes físicos que perduraron por miles de años. En fin, también para pensar. 

En una noticia de BBC News Mundo, Stokel-Walker dijo: “Gracias a los fragmentos de papiro, mosaicos y tablillas de cera que han sobrevivido, es posible saber qué desayunaban los pompeyanos hace 2.000 años”.

Esto me recuerda que en la columna mencionada hice la siguiente reflexión respecto a la información, que corrijo levemente como nuevo corolario:

¿Cuál será el futuro de la información en 
los próximos años?
¿Podremos acceder a los hechos en un contexto dado?
¿Cómo se suministrará la información?

Nos reencontramos y volvemos a reflexionar sobre estos temas que afectan, en forma muy acelerada, el acceso a la información y nos cuestionan una vez más cómo encontrarla.

Espero sus comentarios para intercambiar y acercar ideas.


4 de noviembre de 2024

* Rosa Monfasani 
es Bibliotecaria y Profesora en Ciencia de la Información por la Facultad de Filosofía y Letras de la Universidad de Buenos Aires.
Mi Facebook: @RMonfasani


Referencias:
Griffin, A. (2024). When Online Content Disappears = Cuando desaparece el contenido en línea. Independent en español. 20 de mayo. https://www.independentespanol.com/tecnologia/internet-contenido-desaparece-informacion-estudio-b2548980.html 

SAI (2024). Boletín. Nro. 214, noviembre. Fuente BBC Future. https://sai.com.ar/bibliotecologia/boletin/v/bie214.html 

Stokel-Walker, C. (2024). Por qué está desapareciendo una parte importante de la historia de Internet (y qué se está haciendo para evitarlo). BBC News Mundo. 22 de octubre. https://www.bbc.com/mundo/articles/cpw5djwlpjpo 


Comentarios

  1. Te agrego otra razón:
    - la información que no se encuentra tampoco existe: estamos corriendo el riesgo de que la información creada quede sepultada debajo de contenidos sintéticos.
    La creación de nuevos contenidos ha comenzado a ser exponencial debido a la IA (ya muchas de las entradas de los blogs y noticias son creadas usando los nuevos modelos de lenguaje) . Los sistemas de ranking, buscadores, indexadores no pueden separar la información sintética de la creada por humanos.
    Se corre el riesgo que la información validada quede oculta debajo de nuevos contenidos (quizás más atractivos, mejor redactados, con mejor posicionamiento en internet (SEO)).
    Debimos hacer un backup todo Internet antes de la IA.
    (comentario realizado por un humano, sepan disculpar los errores u omisiones)

    -

    ResponderEliminar
    Respuestas
    1. Gracias Horacio por tu aporte. No solo se perderán sino que se tergiversarán y no sabremos a ciencia cierto que es lo valedero. Gran tema para analizar y creo que es un gran desafío para todos los bibliotecarios. Quizá sea una nueva razón de existir o nuevas competencias que tenemos que incorporar. Dudo un poco de los Backup debido a la velocidad conque cambian los soportes, las plataformas y la tecnología toda. Pero no tengo la respuesta y ese será como expresé un desafío a tener en cuenta. Abrazo y nos estamos viendo.

      Eliminar
  2. Hola Rosita. Como siempre, un gusto leerte.

    Subrayaría el hecho que Internet Archive ahora está pasando por una situación muy complicada debido a la demanda de 4 editoriales por permitir el préstamo digital durante la pandemia (!). Esto está afectando incluso mucho más el patrimonio deigital de la humanidad. Es crítico que estemos yendo hacia este futuro.

    Saludos.

    ResponderEliminar
    Respuestas
    1. Hola David. Esa es una gran preocupación, creo que algo de eso manifesté en la columna cuando dije que los servicios del Internet Archive dejen de ser sin fines de lucro o los gobiernos no se preocupen por mantenerlo. A lo que agregaría apropiación de las empresas que no desean perder contenidos y necesitan incorporarlos para venta. Una pena, en la respuesta anterior manifesté que será un gran desafío para los bibliotecarios. Abrazo grande, nos seguimos leyendo.

      Eliminar

Publicar un comentario