El Internet Archive (Archivo de Internet) es una biblioteca digital gestionada por una organización sin ánimo de lucro dedicada a la preservación de archivos, capturas de sitios públicos de la Web, recursos multimedia y también software. Creada en 1996, su sede central estuvo desde esa fecha y hasta el año 2009 en el histórico edificio del Presidio de San Francisco (California) y, desde ese año, se halla en la calle Funston en San Francisco (California). Esta organización existe con el apoyo de Alexa Internet y de otros colaboradores que han donado materiales y colecciones como la Biblioteca del Congreso y otras muchas bibliotecas públicas y privadas. Alberga una gran cantidad de archivos de muchos tipos como audio, vídeo y texto, la gran mayoría de ellos en dominio público, o con licencias de tipo Creative Commons u otras licencias que permiten su distribución gratuita.
Entre sus secciones se encuentra la colección llamada Moving Images que contiene aproximadamente 19 000 archivos de vídeo (estimación de agosto de 2005). La colección máxima es la Colección de Prelinger, llamada Prelinger Archives, con un total de 1977 archivos (en agosto de 2005) que incluye una gran cantidad catalogada del "Cine Efímero Publicitario", educacional, industrial (películas para promoción de empresas) y amateurs. Las películas son de entre los años 1927 a 1987.
En otra parte del sitio, para volver atrás en el tiempo, existe la Wayback Machine que tiene 40 000 millones de páginas de Internet grabadas desde 1996. Se puede ver la primera versión de IMDb y de la famosa página de ventas por Internet Amazon, así como también una sección especial que cataloga noticias en su versión original de dichas fechas.
Hay que tener en cuenta que Wayback Machine no almacena todas las páginas web que existen en la red, sino las enlazadas desde otros sitios ya recogidos y aquellas que se han solicitado almacenar, por tal motivo puede que si se busca una página concreta no se encuentre; se tendría que registrar manualmente para que a partir de ese momento se recoja en el registro histórico.
Internet Archive contiene las siguientes secciones donde se albergan distintas colecciones: web, vídeo, texts (textos), audio, e images (imágenes).
Es la wayback machine.
Ejemplo de archivos de la WaybackMachine:
La sección Texts del Internet Archive alberga libros digitalizados y colecciones de varias bibliotecas y de instituciones y fundaciones culturales procedentes de todo el mundo.
El Internet Archive opera unos 33 centros de escaneado en cinco países, digitalizando alrededor de 1000 libros al día, y contaba con más de 4 millones de libros (en 2013). Se descargaban 15 millones de libros al mes.
Entre aproximadamente 2006 y 2008, la Microsoft Corporation tuvo una relación especial con la sección texts del Internet Archive a través de su proyecto Live Search Books, mediante el cual escaneó más de 300 000 libros que fueron aportados a la colección, proporcionó apoyo financiero y aportó equipos de escaneado. El 23 de mayo de 2008 Microsoft anunció que interrumpía su proyecto y puso los libros escaneados a disposición sin limitación contractual y donó los equipos de escaneado.
Hacia octubre de 2007, algunos usuarios del Internet Archive empezaron a subir al Archive libros en dominio público procedentes del Google Book Search. En noviembre de 2013, había más de 900 000 libros escaneados por Google en la colección del Archive. Los libros eran idénticos a los que había en Google excepto que no tenían las marcas de agua de Google y no tenían restricciones de uso. Brewster Kahle reveló en 2013 que este esfuerzo de archivado fue coordinado por Aaron Swartz y un grupo de amigos, que bajaban libros en dominio público de Google de manera lenta y desde suficiente número de ordenadores diferentes para no sobrepasar los límites de Google. Hicieron esto para asegurar el acceso general a materiales que ya estaban en dominio público. El Archive se aseguró de que los archivos se atribuían correctamente y se enlazaban a Google. Google nunca se quejó, aunque sí algunas bibliotecas.
En noviembre de 2015 había 134 740 libros en español en el Internet Archive, de un total de 8 millones de textos, de los cuales 6 millones eran en inglés.
La sección Audio del Archive incluye música, audiolibros, grabaciones de programas de radio antiguos y noticieros, entre otros archivos sonoros. Hay más de 200 000 grabaciones digitales gratuitas. Hay subcolecciones también de pódcast.
Otra subcolección es el Live Music Archive, que alberga 100 000 grabaciones de conciertos tanto de artistas independientes como de artistas consagrados o de conjuntos con normas de difusión permisivas de grabaciones de conciertos como The Grateful Dead o The Smashing Pumpkins.
En esta sección Audio se alberga también la colección de audiolibros LibriVox. En enero de 2016 esta colección contenía 9500 libros en dominio público. Aunque la gran mayoría son audiolibros en inglés, hay también libros en otras lenguas, y una pequeña parte están en español.
Esta sección contiene colecciones de diversas procedencias. Contiene, por ejemplo, colecciones de imágenes del Metropolitan Museum of Art, mapas del Servicio Geológico de los Estados Unidos, una colección de clips de la NASA o una colección de 500 000 carátulas de discos.
Escribe un comentario o lo que quieras sobre Archive.org (directo, no tienes que registrarte)
Comentarios
(de más nuevos a más antiguos)