Historia del Proyecto Gutenberg

Sumario

El primer libro digital remonta al 4 de julio de 1971. Se trata del eText #1 del Proyecto Gutenberg, un proyecto visionario lanzado por Michael Hart con el fin de crear versiones electrónicas gratuitas de obras literarias y de difundirlas por el mundo entero. En el siglo 16, Gutenberg había hecho posible para todos tener libros impresos por un precio relativamente módico. En el siglo 21, el Proyecto Gutenberg iba a permitir a cada uno disponer de una biblioteca digital gratuita. Este proyecto cobra nuevo aliento y alcanzó una difusión internacional con la aparición de la web en 1990, y luego con la creación de Distributed Proofreaders en 2000, cuya meta es compartir la revisión de los libros entre centenares de voluntarios. En 2010, el Proyecto Gutenberg cuenta con más de 33.000 ebooks de alta calidad y decenas de milles de descargas al día. Tiene sitios web en los Estados Unidos, en Australia, en Europa y en Canadá, con 40 sitios espejo repartidos por todo el planeta.

Gestación

¿Cuáles son las raíces del proyecto? Cuando Michael Hart estudia en la Universidad de Illinois (Estados Unidos), el laboratorio informático de su universidad le asigna millones de dólares de tiempo de ordenador.

El 4 de julio de 1971, día de la fiesta nacional, Michael digita The United States Declaration of Independence (Declaración de independencia de los Estados Unidos), en mayúsculas, pues las letras minúsculas aún no existan. El texto electrónico representa 5 K (kilobytes).

El envío de un archivo de 5 K a las cien personas que forman el pre-internet de la época haya acabado con el sistema, provocando su implosión, porque el ancho de banda aún es ínfimo.

Michael difunde un mensaje que explica dónde se almacena el texto – aún sin enlace hipertexto, pues habría que esperar unos 20 años más para la web – y seis personas descargan este archivo.

Sobre la marcha, Michael decide dedicar ese enorme crédito de tiempo a la búsqueda de obras literarias disponibles en bibliotecas, y a la digitalización de éstas.  El conjunto de páginas encuadernadas, forma tradicional del libro, iba a convertirse en un texto electrónico que se puede desplegar de par en par.

Poco después, Michael define así la misión del Proyecto Gutenberg: poner a disposición de todos, por vía electrónica, el mayor número posible de obras literarias gratuitamente.

Tras haber digitado The United States Declaration of Independence (Declaración de independencia de los Estados Unidos, firmada el 4 de julio de 1776) en 1971, Michael prosigue con sus esfuerzos en 1972 digitando The United States Bill of Rights (Declaración de derechos de los Estados Unidos). Esa declaración incluye las diez primeras enmiendas añadidas en 1789 a la Constitución de los Estados Unidos (ratificada en 1787), y define los derechos individuales de los ciudadanos y los poderes respectivos del gobierno federal y de los Estados. En 1973, un voluntario digita The United States Constitution (Constitución de los Estados Unidos) en su totalidad.

El internet, aún embrionario en 1971, despega verdaderamente en 1974, tras la creación del protocolo TCP/IP (Transmission Control Protocol / Internet Protocol).

Año tras año, la capacidad del disquete aumenta con regularidad – el disco duro no existe aún – de modo que los archivos pueden ocupar cada vez más espacio. Algunos voluntarios se animan a digitalizar La Biblia, compuesta de varios libros, cada cual puede tratarse por separado y ocupar un archivo diferente.

Michael también empieza a digitar la obra completa de Shakespeare, con la ayuda de voluntarios, una obra de teatro tras otra, cada una en un archivo. De hecho aquella edición nunca se puede poner en línea, debido a que, entre tanto, entra en vigor una ley de copyright más rigurosa, ya no destinada a proteger el texto de Shakespeare, pasado desde hace tiempo al dominio público, sino los comentarios y notas de aquella edición. Otras ediciones anotadas que sí han pasado al dominio público se ponen en línea algunos años más tarde.

De 10 a 1.000 ebooks

En agosto de 1989, el Proyecto Gutenberg pone en línea su décimo texto, The King James Bible, una biblia publicada por primera vez en 1611 y cuya versión más conocida es la de 1769. El conjunto de los archivos del Antiguo Testamento y del Nuevo Testamento representa 5 M (megabytes).

En 1990, ya hay 250.000 internautas, y el modelo estándar vigente es el disquete de 360 K (kilobytes).

En enero de 1991, Michael digita Alice’s Adventures in Wonderland (Alicia en el país de las maravillas, 1865) de Lewis Carroll. En julio del mismo año, digita Peter Pan (1904) de James M. Barrie. Cada uno de estos dos clásicos de la literatura infantil cabe en un disquete estándar.

Luego llega la web, operativa a partir de 1991. El primer navegador, Mosaic, aparece en noviembre de 1993. Al generalizarse el acceso a la red, resulta más fácil hacer circular los textos electrónicos y reclutar voluntarios.

El Proyecto Gutenberg perfecciona su método de trabajo, y logra digitalizar un texto al mes en 1991, dos textos al mes en 1992, cuatro textos al mes en 1993 y ocho textos al mes en 1994.

En enero de 1994, el Proyecto Gutenberg celebra su eBook #100 con la puesta en línea de The Complete Works of William Shakespeare (La obra completa de William Shakespeare). Shakespeare escribió la mayor parte de su obra entre 1590 y 1613.

A continuación la producción sigue aumentando, con una media de 8 ebooks al mes en 1994, 16 ebooks al mes en 1995 y 32 ebooks al mes en 1996.

Entre 1991 y 1996, la producción se ha duplicado cada año. Mientras sigue con la digitalización de los libros, Michael coordina también a partir de entonces el trabajo de decenas de voluntarios.

En 1997, la producción sigue siendo de 32 ebooks al mes. En junio de 1997, el Proyecto Gutenberg pone en línea The Merry Adventures of Robin Hood (Las alegres aventuras de Robin Hood, 1883) de Howard Pyle. En agosto de 1997, se pone en línea el eBook #1000, La Divina Commedia (La Divina Comedia, 1321) de Dante Alighieri, en su idioma original, el italiano.

El Proyecto Gutenberg se articula en torno a tres grandes sectores: (a) “Light Literature”(literatura de entretenimiento), que incluye por ejemplo Alice’s Adventures in Wonderland (Las aventuras de Alicia en el país de las maravillas), Peter Pan o Aesop’s Fables (Las Fábulas de Esopo); (b) “Heavy Literature” (literatura “seria”), que incluye por ejemplo La Biblia, las obras de Shakespeare o Moby Dick; (c) “Reference Literature” (literatura de referencia), que reúne enciclopedias y diccionarios, por ejemplo el Roget’s Thesaurus. Más adelante, esta presentación en tres sectores es sustituida por una clasificación detallada con más secciones.

El Proyecto Gutenberg pretende ser universal, tanto a nivel de las obras que selecciona como del público al que se dirige, ya que la meta es poner la literatura a disposición de todos, sin limitarse al público habitual de estudiantes y docentes.

El sector dedicado a la literatura de entretenimiento se propone atraer frente a la pantalla a un público muy diverso, por ejemplo a niños y a sus abuelos en busca del texto electrónico de Peter Pan después de haber visto la película Hook, de la versión electrónica de Alicia en el país de las maravillas tras haber visto una adaptación televisiva, o del origen de una cita literaria tras visionar un episodio de Star Trek. En casi todos los episodios de Star Trek se citan libros disponibles en versión digital en el Proyecto Gutenberg.

El objetivo, entonces, es que el público, esté o no esté acostumbrado al contacto con el libro impreso, pueda encontrar con facilidad los textos escuchados en conversaciones, películas, músicas, o leídos en otros libros, periódicos y revistas.

Los textos electrónicos (llamados también “etexts” o “ebooks”) están almacenados bajo la forma más sencilla posible, en formato ASCII (American Standard Code for Information Interchange – Código Estadounidense Estándar para el Intercambio de Información), para que esos textos pudieran ser leídos sin problema con cualquier plataforma y software. Los términos escritos en cursiva o en negrita y los términos subrayados en la versión impresa están en letras capitales. Los archivos ASCII no ocupan mucho espacio y se pueden descargar fácilmente. La búsqueda textual es igual de sencilla. Basta con utilizar la función “buscar” presente en cualquier software.

Michael Hart explica en agosto de 1998 en una entrevista por correo electrónico: “Nosotros consideramos el texto electrónico como un nuevo medio de comunicación, sin verdadera relación con el papel. La única semejanza es que ambos difundimos las mismas obras, pero en cuanto la gente se haya acostumbrado, no veo cómo el papel aún podría competir con el texto electrónico, sobre todo en las escuelas. (…) Mi proyecto es cargar 10.000 textos electrónicos en el internet [esta meta se alcanza en octubre de 2003]. Si pudiera conseguir subvenciones más importantes, me gustaría llegar hasta un millón y ampliar también el número de nuestros usuarios potenciales pasando de un 1,x% a un 10% de la población mundial, lo que representaría la distribución de 1.000 veces un billón de textos electrónicos en lugar de un solo billón.”

De 1.000 a 10.000 ebooks

Entre 1998 y 2000, la producción sigue constante, con una media de 36 nuevos ebooks al mes. En mayo de 1999, las colecciones cuentan con 2.000 libros digitales. El eBook #2000 es Don Quijote (publicado en 1605), en castellano.

Disponible en diciembre del año 2000, el eBook #3000 es el tercer volumen de À l’ombre des jeunes filles en fleurs (A la sombra de las muchachas en flor, 1919) de Marcel Proust, en su idioma original, el francés. La media pasa a 104 nuevos ebooks al mes en 2001.

El Project Gutenberg Australia es lanzado en agosto de 2001.

Disponible en octubre de 2001, el eBook #4000 es The French Immortals Series (Obras de los Inmortales franceses), en versión inglesa. Publicado en 1905 por la Maison Mazarin (París), este libro reúne varias ficciones de escritores laureados por la Academia de la Lengua Francesa (Académie Française), como Emile Souvestre, Pierre Loti, Hector Malot, Charles de Bernard, Alphonse Daudet y otros.

Disponible en abril de 2002, el eBook #5000 es The Notebooks of Leonardo da Vinci (Los cuadernos de Leonardo da Vinci), que datan de inicios de siglo 16, en una traducción del italiano al inglés. En 2010, este texto aún se encuentra en el Top 100 de los libros descargados con más frecuencia.

En 1991, Michael Hart decidió digitalizar Alice’s Adventures in Wonderland o Peter Pan porque su versión digital cupo en un disquete de 360 K (kilobytes), o sea el estándar de la época. Quince años más tarde, en 2002, ya disponemos de disquetes de 1,44 M (megabytes) con la posibilidad de comprimir archivos en archivos ZIP. Un archivo estándar puede contener tres millones de caracteres, o sea más de los necesarios para un libro de tamaño mediano, ya que una novela de 300 páginas digitalizada en formato ASCII representa 1 M (megabyte). Un libro voluminoso cabe en dos archivos ASCII, descargables en versión normal o en versión comprimida en un archivo ZIP.

Se necesitan unas cincuenta horas para seleccionar un libro de tamaño mediano, comprobar que ha pasado al dominio público, escanearlo, corregirlo, formatearlo y compaginarlo.

Algunos números de libros se reservan para más tarde, por ejemplo el número 1984 (eBook #1984) para la novela epónima de George Orwell, publicada en 1949, que aún está lejos de pasar al dominio público.

Al llegar la primavera de 2002, ya cubren un cuarto de las obras del dominio público de libre acceso en la web, inventariadas de forma casi exhaustiva por la Internet Public Library (IPL – Biblioteca Pública del Internet), un buen resultado que es el fruto del trabajo paciente de miles de voluntarios activos en numerosos países. En 2002, las colecciones se amplían de 203 nuevos ebooks al mes.

En noviembre de 2002, el Proyecto Gutenberg pone en línea los 75 archivos del Human Genome Project (Proyecto del Genoma Humano, es saber la secuenciación del genoma humano), poco tiempo después de su publicación inicial en febrero de 2001, debido a que desde el principio ya pertenecía al dominio público. Cada archivo se compone de decenas, o incluso de cientos de megabytes.

1.000 ebooks en agosto de 1997, 2.000 ebooks en mayo de 1999, 3.000 ebooks en diciembre de 2000, 4.000 ebooks en octubre de 2001, 5.000 ebooks en abril de 2002, 10.000 ebooks en octubre de 2003. El eBook #10.000 es The Magna Carta, que fue el primer texto constitucional inglés, firmado en 1215.

Entre abril de 2002 y octubre de 2003, las colecciones se duplican, pasando de 5.000 a 10.000 libros digitales en 18 meses. En 2003, la producción es de unos 348 nuevos ebooks al mes.

Este crecimiento rápido se debe a la actividad de Distributed Proofreaders (DP), un sitio web concebido en 2000 por Charles Franks para repartir la corrección de las obras entre varias personas. Los voluntarios eligen uno de los libros digitales disponibles en el sitio para releer y corregir determinada página. Cada cual trabaja a su ritmo. A título indicativo, se aconseja repasar una página al día. Representa poco tiempo en un día, pero mucho para el proyecto.

En agosto de 2003, se pone a disposición un CD Best of Gutenberg con una selección de 600 ebooks. En diciembre de 2003, fecha en la que el Proyecto Gutenberg alcanza la cifra de 10.000 libros digitales, se graba en un DVD la casi totalidad de los ebooks (9.400 ebooks). Se envían gratuitamente el CD y el DVD a cualquier persona que lo pida. Luego cada uno queda libre de realizar todas las copias que pueda y de distribuirlas a su alrededor en escuelas y bibliotecas.

En septiembre de 2003, el Proyecto Gutenberg lanza el Project Gutenberg Audio eBooks, una collección de libros audio (leídos por el ser humano), así como el Sheet Music Subproject (Subproyecto para partituras), una collección de partituras digitalizadas y de grabaciones musicales. Un otro subproyecto también ofrece una collección de imágenes.

De 10.000 a 20.000 ebooks

En diciembre de 2003, las colecciones rondan los 11.000 libros digitales. Varios formatos están representados (HTML, XML, RTF, etc.) pero el formato principal – y obligatorio – sigue siendo el ASCII. Hay 46.000 archivos en conjunto, lo que equivale a una capacidad total de 110 G (gigabytes). El 13 de febrero de 2004, fecha en la que Michael Hart da una conferencia en la sede de la UNESCO en París, las colecciones abarcan exactamente 11.340 ebooks en 25 idiomas. En mayo de 2004, los 12.500 ebooks disponibles representan 100.000 archivos en veinte formatos diferentes, lo que equivale a una capacidad total de 135 G (gigabytes), y ésta debería duplicarse cada año con la agregación de más de 300 ebooks al mes (338 ebooks al mes en 2004).

El Project Gutenberg Consortia Center (PGCC), lanzado en 1997 para reunir otras colecciones de libros digitales en un punto de acceso único, es afiliado oficialmente al Proyecto Gutenberg en 2003.

Se inicia también un proyecto europeo a iniciativa del Proyecto Rastko, basado en Belgrado (Serbia). El Proyecto Gutenberg Europa y Distributed Proofreaders Europa nacen en enero de 2004, con cien libros disponibles para abril de 2005, en varios idiomas con el fin de reflejar la diversidad lingüística que prevalece en Europa.

En enero de 2005, el Proyecto Gutenberg pone en línea el eBook #15000, The Life of Reason (La vida de la razón, 1906) de George Santayana.

Si bien en febrero de 2004 sólo había libros en 25 idiomas, en julio de 2005 están representados 42 idiomas, entre los cuales el sanscrito y las lenguas maya.

El Project Gutenberg Australia (lanzado en agosto de 2001) celebra sus 500 libros en julio de 2005.

En enero de 2006 se crea el Project Gutenberg PrePrints para acoger nuevos documentos que por su interés merecerían estar en línea, pero que no pueden ser incorporados a las colecciones existentes sin su procesamiento previo por voluntarios: colecciones incompletas, calidad insuficiente, necesidad de conversión a otro formato, etc. Los PrePrints cuentan con 379 ebooks en diciembre de 2006, y 2.020 ebooks en febrero de 2009.

En diciembre de 2006, el Proyecto Gutenberg alcanza los 20.000 libros digitales. El eBook #20000 es un libro audio, Twenty Thousand Leagues Under the Sea (Veinte mil leguas de viaje submarino, 1869), la versión inglesa de la novela de Julio Verne en francés. En 2006, la producción es de unos 345 nuevos ebooks al mes.

Aunque se hayan necesitado 32 años y tres meses, de julio de 1971 a octubre de 2003, para producir los 10.000 primeros ebooks, bastará con sólo tres años y dos meses, de octubre de 2003 a diciembre de 2006, para producir los 10.000 ebooks siguientes.

Por la misma fecha, el Project Gutenberg Australia ronda los 1.500 ebooks (se alcanza esta cifra en abril de 2007) y el Proyecto Gutenberg Europa cuenta con 400 ebooks.

En diciembre de 2006 figuran 50 idiomas. Diez idiomas cuentan con colecciones de más de 50 libros: el inglés (17.377 libros el 16 de diciembre de 2006), el francés (966 libros), el alemán (412 libros), el finlandés (344 libros), el holandés (244 libros), el español (140 libros), el italiano (102 libros), el chino (69 libros), el portugués (68 libros) y el tagalog (51 libros).

De 20.000 a 30.000 ebooks

Se estrena el blog Project Gutenberg News en noviembre de 2006 a instigación de Mike Cook, para complementar las cartas de información (semanal y mensual) que ya llevaban muchos años de existencia.

El blog presenta por ejemplo las estadísticas de producción semanales, mensuales y anuales desde 2001.

La producción semanal se eleva a 24 libros en 2001, 47 libros en 2002, 79 libros en 2003, 78 libros en 2004, 58 libros en 2005 y 80 libros en 2006.

La producción mensual es de 104 libros en 2001, 203 libros en 2002, 348 libros en 2003, 338 libros en 2004, 252 libros en 2005 y 345 libros en 2006.

La producción anual es de 1.244 libros en 2001, 2.432 libros en 2002, 4.176 libros en 2003, 4.058 libros en 2004, 3.019 libros en 2005 y 4.141 libros en 2006.

El Proyecto Gutenberg Canadá (PGC) ve la luz el 1° de julio de 2007, día de la fiesta nacional, a instigación de Michael Shepard y David Jones. Poco después nace Distributed Proofreaders Canadá (DPC) cuya producción empieza en diciembre de 2007. Los cien primeros ebooks están disponibles en marzo de 2008, en inglés, en francés y en italiano.

Distributed Proofreaders (DP), lanzado en octubre de 2000, cuenta con miles de voluntarios en enero de 2008, con un total de 11.934 libros procesados en siete años y tres meses. Distributed Proofreaders Europa (DP Europe), lanzado en enero de 2004, cuenta con 1.500 voluntarios. Distributed Proofreaders Canadá (DPC), lanzado en diciembre de 2007, cuenta con 250 voluntarios.

El Proyecto Gutenberg alcanza los 25.000 libros digitales en abril de 2008. El eBook #25000 es English Book Collectors (Colleccionistas ingleses de libros, 1902) de William Younger Fletcher.

El Proyecto Gutenberg Europa alcanza los 500 libros en octubre de 2008.

El Proyecto Gutenberg contabiliza 30.000 libros en octubre de 2009. El eBook #30000 es The Bird Book (El libro de los aves, 1915), de Chester Albert Reed.

30.000 ebooks y más

Distributed Proofreaders celebra su décimo aniversario en octubre de 2010, con más de 18.000 libros digitalizados y corregidos en diez años por miles de voluntarios.

El Proyecto Gutenberg cuenta con más de 33.000 ebooks en diciembre de 2010, en varios formatos para lectura en un ordenador, un PDA, un teléfono móvil, un smartphone o una tableta.

(Muchas gracias a Anna Álvarez por su ayuda para la traducción de este texto.)

Copyright © 2010 Marie Lebert

If you liked this post, say thanks by sharing it.