Опубликовано в журнале Новый Мир, номер 9, 2003
Электронные библиотеки*
Едва ли не первым порывом первых пользователей глобальных сетей было выложить в сеть наиболее значимые с их точки зрения тексты и обеспечить к ним доступ максимального числа подключенных к Сети пользователей.
Старейшей электронной публичной библиотекой является существующий и по сей день “Проект Гутенберг” (http://www.gutenberg.net/history.html).
Этот проект начал реализовывать Майкл Харт — оператор компьютера Xerox Sigma V Университета штата Иллинойс. Первым документом, который был разослан по глобальной сети американских университетов, была “Декларация независимости”. И было это в 1971 году. Почти за два десятилетия до того, как появился Интернет.
По мере развития глобальных сетей число электронных библиотек непрерывно росло. Но только с появлением Интернета начался настоящий бум. Стремительно дешевели ресурсы передачи данных и хранения электронной информации. Все проще становился доступ и для создателей библиотек, и для их пользователей. Тогда же сложился и тот тип сотрудничества, при котором создатель библиотеки становится только ее хранителем, пополняется же она за счет текстов, которые присылают энтузиасты. А он выставляет тексты у себя на сайте.
Вот как описывает Максим Мошков рождение и развитие самой знаменитой электронной библиотеки Рунета: (http://www.lib.ru/COPYRIGHT/computera.txt):
“Электронные тексты я начал собирать с 1990 года на рабочем компьютере. Мощный текстовый редактор └Рк”, которым я тогда пользовался, позволял легко структурировать и размещать большие текстовые проекты и комплекты документации и программ, а также — файлов со словами песен, туристических отчетов и книжек.
Когда в 1994 году я выбрался в Интернет, я обнаружил там большую массу сайтов с текстами. Можно сказать, сбылась мечта — вот они, искомые книжки. Но в каком кошмарном состоянии все эти сборники и хранилища пребывали! Масса несовместимых друг с другом форматов. В одном каталоге: TeX, PostScript, html, gif, латиница, 5 разных кодировок, 6 различных архиваторов. В каталогах отсутствовали оглавления. Чтобы что-то найти, приходилось часами рыскать по разным сайтам и каталогам, перебирая вслепую файлы. Выход был только один: преобразовать все в единый формат, подписать в индексах заглавия всех книг и разложить их по тематическим каталогам. Все файлы я собрал вместе на своем рабочем компьютере. Главный инструмент для такой работы — редактор └Рк” — у меня был. Главным пользователем моей коллекции был я сам. Для себя я и усовершенствовал ее структуру, сделал простенький удобный и быстрый интерфейс, напрограммировал поиск и много других полезных функций и выставил в Интернет на своей домашней странице. Вскоре туда повадился ходить народ. Надо же людям хоть где-то почитать тексты на русском языке — пусть это будет у меня.
Примерно 2 года я рыскал по Интернету: выискивал и перетаскивал из Сети книжки, валявшиеся в открытом доступе. Потихоньку библиотека увеличивалась, заодно росла и аудитория.
Мне начали присылать книжки. Потому что у меня их удобнее читать. И вскоре настало время, когда я перестал бродить по Интернету: книжки присылали постоянные читатели, что продолжается и посейчас. Теперь я получаю около 100 писем в день, среди которых 10 — 30 с книгами. И так каждый день. Количество присылаемых книг стало таким, что я уже не успеваю их обрабатывать. Стали присылать также авторы, переводчики и издательства.
Библиотека оказалась нужна им всем. Если дело так пойдет и дальше, мне начнут присылать обязательный экземпляр, будто настоящему библиотекарю…
Никакого отбора по качеству книг не ведется. Качество представленной в электронной форме литературы тем не менее оказывается весьма и весьма высоким, хотя, конечно, всякое встречается. Ведь перевод книги в электронную форму — тяжелый труд. И люди сканируют только любимые книжки”.
Примерно так же рождались и другие электронные библиотеки. Примерно так же они живут и сейчас, существуя на личные средства библиотекарей, которые тратят свое время на то, чтобы поддерживать сайты в актуальном состоянии.
Сегодня можно сказать, что электронные библиотеки не просто нужны как одна из возможностей работы с текстами — сегодня они необходимы для работы и нормального существования очень многих пользователей Интернета. Почти десятилетняя история существования и развития библиотеки Мошкова говорит об этом вполне определенно, а “Проект Гутенберг” существует более тридцати лет. Наличие электронного текста в Сети общего доступа не только упрощает доступ к книге — очень часто оно делает этот доступ единственно возможным.
Реальный доступ к большим библиотечным собраниям до сих пор имели только жители крупных городов: в России это в первую очередь Москва — с Ленинкой или Государственной публичной научно-технической библиотекой и некоторыми другими огромными собраниями книг. Но даже находясь в непосредственной географической близости от “бумажной” библиотеки, воспользоваться ее услугами не так-то просто. Пользоваться большой “бумажной” библиотекой нужно учиться.
Таким образом, доступ к книгам реально получали только те, кто профессионально работает с ними, или те, кто тратит большие деньги на формирование домашних библиотек.
Всякий человек, у которого есть домашняя библиотека, знает, что прочитает он, дай Бог, треть всех имеющихся в ней книг. А большинство были куплены ради одной-двух цитат. А некоторые так и остались неоткрытыми. И стыдно становится перед своими книгами. Купил, а не читаешь, и смотрят они на тебя с немым укором.
А электронная библиотека! Это же именины сердца! Доступ — мгновенный и из любой точки планеты, где есть Интернет. Обновление и пополнение — очень быстрое.
В частности, еще совсем недавно доступ к газетам месячной и более давности был крайне труден. Сегодня у тех газетных изданий, у которых есть свои сайты (а они есть почти у всех, и почти у всех они бесплатны, исключение составляет разве что “Коммерсантъ”), просмотреть полугодовую подписку очень просто.
Если мы говорим о свободном доступе, то есть о бесплатных библиотеках, то оплата интернет-доступа — это единственное, что требуется, чтобы добраться до кладезя всей человеческой мудрости, до всех областей знаний, накопленных людьми за все время существования письменности.
Но преимущества здесь только начинаются. Если вы не просто читаете книгу, а пытаетесь с ней работать, то одна из трудных задач — это подбор и поиск нужных цитат. В некоторых случаях это занятие становится делом довольно мучительным. А если текст представлен в электронном виде, для поиска не нужно ничего: его за тебя выполнит любой текстовый редактор или поисковая система.
В общем, одни сплошные преимущества. Но так ли это на самом деле?
Максим Мошков говорит о своей библиотеке:
“Эту библиотеку подбирал не издатель, которому все равно, что издавать, — лишь бы покупали, не писатель, которому не важно, кто придет, — лишь бы донести └свое” слово до всех пришедших. Это библиотека для читателя, собранная читателем, с помощью читателей. Отсюда и вытекают ее достоинства и недостатки. Здесь не оказалось классики, не оказалось писателей-середняков, здесь очень много (перебор) фантастики и эзотерики всех мастей. Здесь встречаются бестселлеры — но не все, а только высокохудожественные. Здесь много книг, ставших широко известными, нашумевших и запомнившихся. Фактически она отражает вкусы своих читателей, отобранных по принципу └есть доступ в Интернет, имеется свободное время и осталась потребность в чтении””.
Это — трезвое суждение и спокойный взгляд на вещи. Мошков не претендует, во-первых, на полноту, во-вторых, на аутентичность текстов. Ошибки — могут быть. И если вы хотите тексты без ошибок, то пожалуйте в обычную библиотеку. На что претендует Мошков — это на постоянство существования своего ресурса, на постоянство его развития и на его лицензионную чистоту: по закону Российской Федерации об авторском праве, если автор не продавал права на интернет-публикацию издательству, он остается полным собственником этого права и его разрешения достаточно, чтобы текст мог быть легально выставлен в библиотеке Мошкова. Результаты переговоров и полученные от авторов разрешения представлены на сайте библиотеки. Вот пример такого письма:
“Сергей Лукьяненко — Максиму Мошкову. 12 января 1999.
Настоящим письмом я, Сергей Лукьяненко, разрешаю к помещению в электронной библиотеке Мошкова тех моих текстов, которые представлены на моей официальной странице, при условии некоммерческого использования и проставления копирайта. http://www.lib.ru/COPYRIGHT/”.
О политике Сергея Лукьяненко в размещении свободных интернет-публикаций его текстов мы еще поговорим.
Постоянство присутствия в Сети, свободный доступ и лицензионная чистота в рамках российского законодательства — это и есть тот максимум, которого может достигнуть электронная библиотека, организованная и существующая усилиями энтузиастов. Как только мы попытаемся добиться аутентичности и полноты — пускай даже в отдельно взятой области знаний, мы сталкиваемся с неразрешимыми трудностями. И эти трудности очень хорошо видны, если мы обратимся к специализированным библиотекам. Например, к такому уникальному собранию философских текстов, как Библиотека философской литературы Института философии Российской академии наук (http://www.philosophy.ru/library/library.html).
В алфавитном каталоге библиотеки указано около полутора тысяч произведений. Но сегодняшнее состояние библиотеки не позволяет назвать ее полным и достаточно аутентичным собранием философских текстов. Недостатки бросаются в глаза: далеко не везде указаны печатные издания, с которых производилось сканирование, опущены имена переводчиков, индексы имен и предметные указатели, которые являются неотъемлемой частью любого научного издания. Не везде проставлены страницы. Не ясен выбор произведений даже у классических авторов. Например, “Метафизика” Аристотеля есть, а его не менее знаменитое произведение “О душе” — отсутствует. “Категории” — есть, но нет ни 1-й, ни 2-й “Аналитики” — важнейших Аристотелевых логических трактатов. Нет и многих других произведений философа, выходивших в серии “Философское наследие” издательства “Мысль”, с книг которого, вероятно, и производилось сканирование, — но об этом можно только догадываться.
Отсутствие индексов и указателей — это, увы, правило. Ошибки в текстах — очень нередки. Комментариев к Аристотелю — нет. Как нет и интереснейших комментариев Лосева и Асмуса к платоновским диалогам. Если мы попробуем загрузить “Историю русской философии” Зеньковского — там другая беда. И издание указано, и страницы проставлены, и примечания постраничные есть, но только страница предстает на экране как две-три длиннейших строки, каждая из которых на самом-то деле — абзац, и увидеть ее можно только путем долгого горизонтального скролинга. То есть отсутствует форматирование строк. Забыли. Ну что ж, бывает. И таких неточностей, к сожалению, очень много.
Пользоваться библиотекой в научных целях нельзя. Можно что-то посмотреть, сориентироваться в текстах, которые есть, но потом все равно, будьте любезны, — в нормальное книгохранилище за нормальными (то есть печатными) изданиями, где можно найти гораздо более надежные сведения.
Такое состояние дел в электронных библиотеках не случайность.
Конечно, нельзя не испытывать чувства благодарности к авторам сайта, проделавшим огромную работу и продолжающим его регулярно пополнять. Но нельзя не понимать того, что проделанная работа — это всего лишь первый набросок будущей нормальной электронной библиотеки философской литературы.
Программисты знают: когда кажется, что работа закончена, она на самом-то деле только начинается. Вроде бы все уже есть — текст книги отсканирован, проверен spellchecker’ом, переведен в HTML, выложен в Сеть. Ан нет. Подготовка текста явно недостаточна — фактически нужно еще раз держать корректуру, — а что такое вычитка и сверка Аристотеля, знают только те, кто Аристотеля на самом деле читал. И форматирование — неряшливо, и научный аппарат утрачен.
Электронное издание и печатное издание — это принципиально разные вещи. И любое издание — это не только текст. В электронном издании совершенно изменяется понятие страницы — как основной единицы любого печатного издания. Html-страничка гораздо больше напоминает пергаментный или папирусный свиток, который прокручивается при чтении.
Что же делать? Как это ни прискорбно, нужно тратить деньги. Барьер качества, за которым в электронных библиотеках могут появиться действительно полноценные научные издания, усилиями одних только энтузиастов не преодолеть. Полнота и точность недостижимы: как отметил Мошков, классику мало кто будет сканировать. Точность текста — также недостижима, потому что ее может гарантировать только настоящий специалист, внимательно вычитавший электронный текст.
Журнал “Электронные библиотеки” (http://www.iis.ru/el-bib/2000/200006/vanoudenaren/vanoudenaren.ru.html) пишет о проекте “Память Америки”, который был выполнен Библиотекой Конгресса США: “Ядром будущей Национальной электронной библиотеки (НЭБ) является проект └Память Америки”, начавшийся в 1996 году при поддержке Конгресса США и также частных инвесторов, выполнявшийся в течение 5 лет. Общий бюджет проекта составляет 60 миллионов долларов. В рамках проекта планируется оцифровать 5 миллионов документов по американской истории к концу 2000 года. Проект осуществляется в рамках программы создания Национальной электронной библиотеки на базе Библиотеки Конгресса силами отдельного подразделения, насчитывающего около 90 человек. Ее годовой бюджет составляет 12 миллионов долларов”.
Ни Максим Мошков, ни энтузиасты из Института философии просто физически не могут выполнить тот объем работы, на который Библиотека Конгресса тратит 60 миллионов долларов, потому что все, что делают они или их добровольные помощники, делается в свободное от основной работы время на чисто альтруистических началах, а свободного времени всегда не много.
Важнейшей проблемой, решение которой может самым радикальным образом повлиять на наполнение электронных библиотек, является лицензионная чистота. Конечно, российский автор может дать разрешение на свободную публикацию своей книги. Но как себя поведет его издатель?
Объявление на сайте библиотеки Мошкова на странице Сергея Лукьяненко: “Идут работы по продвижению перевода └Лабиринта отражений” на западный рынок. Наличие полных текстов романов в открытом доступе серьезно усложняет ведение переговоров с издателями, поэтому автор попросил свои романы из Сети убрать”.
Это объявление стало прямым следствием письма Лукьяненко: “…я считаю необходимым пойти на изменения официальной политики страницы. Начиная с 1 июня 2003 года все романы будут представлены на ней лишь в виде фрагментов — четверти или трети общего текста. Рассказы и повести будут по-прежнему доступны полностью. Я также прошу всех держателей электронных библиотек, которые строят свои отношения с авторами на основе сотрудничества, принять данную информацию к сведению и снять со своих страниц полные тексты моих романов, а также все существующие переводы на английский язык моих произведений”.
Надо отметить, что Мошков выполнил требование Лукьяненко — 1 июня 2003 года все романы были убраны с сайта.
На своей официальной странице на сайте “Русской фантастики” (http://www.rusf.ru/lukian/faq/common.htm) Лукьяненко высказался о свободном доступе к своим книгам и о свободном доступе вообще вполне определенно:
“Q: Я привык, что ваши книги доступны на вашей странице бесплатно!
A: Что ж, ситуация меняется, причины я указал выше. Вы же не пробуете зайти в магазин и взять бесплатно компакт-диск или книгу?
Q: Я возмущен! Сегодня же сделаю свой сайт и все твои книжки выложу!
A: Ваше право — нарушать законы, наше — этому противодействовать.
Q: С какой это стати западные издатели что-то указывают российскому автору? Это просто наглость!
A: Нет, это не наглость. Это принятые в цивилизованных странах нормы отношения авторов и издателей. Любой писатель имеет право размещать свои книги свободно и бесплатно, но тогда и издатель имеет полное право его не публиковать. Большинство российских издателей тоже требует от своих авторов не размещать текст книг в Интернете. Я держался едва ли не дольше всех своих коллег — хотя это требовало определенных усилий.
Q: А что, собственно говоря, вам писали западные издатели и на что жаловались?
A: В качестве примера — фрагмент из ответа, полученного моим литературным агентом. Название данного конкретного издательства позвольте опустить”.
Здесь я приведу только окончание отрывка:
“…until Russian sci-fi authors stop with the free dispersing of books on the internet, I guarantee you they will never be approached by a North American publisher! Simply no one wants to risk the huge costs involved in publishing. Look at American authors — you won’t find their works for free online. And this is why they get published…”
Перевод: “До тех пор, пока русские писатели-фантасты не прекратят свободное распространение своих книг в Интернете, я гарантирую, что они никогда не найдут североамериканского издателя! Просто потому, что никто не захочет рисковать огромными суммами, вложенными в публикацию. Посмотрите на американских авторов — вы не найдете их произведений в свободном доступе. Потому-то их и печатают”.
Можно сколько угодно убеждать Лукьяненко в том, что свободный доступ не вредит и не может вредить распространению его книг в печатном виде. Аргументы в пользу этого неоднократно приводил Максим Мошков. Например, что это дополнительная очень мощная и совершенно бесплатная для автора реклама.
Убеждать Лукьяненко можно — убедить нельзя. Он разумный человек и никогда не станет рисковать возможностью подписать действительно выгодный контракт с американским издателем. И потому, что реклама-то рекламой, но: во-первых, он и так достаточно раскрученный автор, а во-вторых — это реклама в России, а гонорары, которые платят авторам российские издательства, отличаются от американских в десятки и даже сотни раз.
Позиция Лукьяненко симптоматична. Следует ожидать, что при возникновении любого, даже малого, риска для контракта с американским издательством любой российский автор пойдет по тому же пути.
Босоногое детство электронных библиотек кончилось. К ним стали относиться серьезно. Печатные издания — как к конкурентам. Читатели — как к источникам нормальных достоверных текстов. На сегодняшний день существует очень мало электронных публичных библиотек, которые выдерживают жесткие требования аутентичности. Но они есть. Одним из примеров является библиотека энциклопедий “Рубрикон”. Этот ресурс включает в себя 50 энциклопедических изданий, из которых 27 бесплатных. За доступ к другим необходимо платить.
Вероятно, это неизбежно. Вероятно, библиотеки должны постепенно стать платными, и это уже другой этап развития онлайновых библиотечных ресурсов. Без серьезного притока денежных средств — оплатой ли за доступ, прибылью ли от рекламы — мы никогда не перешагнем порога профессионализма в наших электронных библиотеках.
* На эту тему уже писал у нас в журнале Сергей Костырко в своем «WWW-обозрении» («Новый мир», 2001, № 1). (Примеч. ред.)