Научно-методологические подходы к формированию электронных библиотек


В настоящее время массовая оцифровка фондов библиотек, архивов и музеев стала привычной практикой. Результатом явилось осознание профессиональным сообществом того факта, что цифровой контент и сопутствующие ему услуги должны быть не только запланированы и своевременно созданы, но и постоянно развиваться на основе применения ряда научно-методологических подходов. Известно, что любая практическая деятельность в информационной сфере опирается на теорию и/или на результаты конкретных научных исследований, определяющих основы, принципы, формы и методы работы с большими объёмами оцифрованных документов и метаданных. Оставив за рамками данной публикации программно-технологические аспекты проектирования электронных библиотек (ЭБ), их рассмотрение как информационных систем и виртуальных сервисов, обратимся к созданию контента — основного содержательного компонента ЭБ, ради которого пользователи к нам обращаются.

zhabko

Автор Елена Дмитриевна ЖАБКО, директор по информационным ресурсам Президентской библиотеки, доктор пед. наук

Под научно-­методологическими подходами мы понимаем совокупность принципов, определяющих общую цель и стратегию деятельности по созданию крупных массивов цифрового контента. Очевидно, что многообразие существующих ЭБ предполагает применение различных научно­-методологических подходов. Так, научные ЭБ (библиотеки научно­-исследовательских учреждений, университетов, научных обществ, отраслевых центров и пр.) всегда будут отличаться от ЭБ, формируемых по принципу «всё для всех», а интегрированные ЭБ, объединяющие цифровые объекты библиотечного, архивного и музейного хранения, — от монотиповых ресурсов (например, ЭБ диссертаций и авторефератов, патентов и журнальных статей). Хотя объединение цифровых копий документов именно по типо-­видовому признаку традиционно является весьма распространённой практикой.

Самым крупным проектом создания интегрированной ЭБ прошедшего десятилетия является Президентская библиотека (ПБ). Не имея собственных традиционных фондов, библиотека привлекает для формирования ресурса внешних партнёров как федерального уровня, так и регионального. Поскольку электронный фонд ПБ является не универсальным, а отраслевым, при его формировании специалисты опираются на целый ряд базовых принципов: интеграции, стратегического планирования, обеспечения качества цифрового контента, обязательного научно-­методическое сопровождения.

nauch-metod-podhody-1

Исходно в ПБ интеграция рассматривается многоаспектно. Это прежде всего объединение цифровых копий объектов архивного и библиотечного хранения, цифровых образов музейных экспонатов, мультимедийных ресурсов, результатов веб­-архивирования. Наиболее показательным примером является широкое представление архивных фондов Российского государственного исторического архива (РГИА), Государственного архива Российской Федерации, целого ряда государственных региональных архивов, архивных материалов Русского географического общества и Русского музея. Только из РГИА в 2008–2019 гг. было переведено в электронную форму 154 фонда, включающих 346 тыс. дел. Это преимущественно материалы, отражающие деятельность высших и центральных органов государственной власти Российской империи, общественных учреждений, фонды личного происхождения. Все материалы, вошедшие в электронный фонд ПБ, были введены в научный и общественный оборот, стали доступны на портале и пользователям удалённых электронных читальных залов. Примечательно, что поиск цифровых копий как архивных документов, так и объектов музейного хранения обеспечивается через единый интегрированный электронный библиотечный каталог.

Одновременно библиотека развивает свой ресурс как мультимедийный, включающий аудио­- и видеодокументы (звукозаписи музыкальных произведений, фрагменты документальной хроники, видеозаписи мероприятий и событий, виртуальные экскурсии и лекции, научно-­популярные и документальные фильмы). Ведётся последовательная работа и по привлечению статических визуальных изображений. На конец 2019 г. в электронном фонде библиотеки имеется более 15 тыс. фотографий, 1,2 тыс. видеодокументов, 670 аудиозаписей. Такая практика обеспечивает пользователям получение требуемой тематической информации по образу единого окна.

При создании цифрового контента ПБ интегрирует также документы различного происхождения: переведённые в цифровой формат путём сканирования и сетевые ресурсы, не имеющие традиционных аналогов. Уникальным стал проект 2018–2019 гг. по архивированию веб­-ресурсов; его предполагается развивать в последующие годы. В контексте интеграции рассматривается объединение в едином массиве документов общественного достояния и материалов, находящихся под защитой авторского права, но с оформлением лицензионных соглашений на право их перевода в цифровую форму и дальнейшего предоставления доступа к ним. В более широком контексте интеграция в ПБ — это объединение профессиональных ресурсов, усилий работников различных специальностей: библиотекарей, учёных­отраслевиков, технологов, программистов, юристов.

nauch-metod-podhody-2

Формирование и развитие цифрового контента ПБ осуществляется в соответствии с чёткой стратегией. По данным исследователей, ещё в 2008 г. по меньшей мере треть всех запускаемых цифровых проектов за рубежом терпели неудачу по причине отсутствия проектного управления и последующего контроля, ещё треть — потому, что не было точного определения цели и из-­за недостаточной информированности участвующих в них специалистов об объёме и сложности работ. В связи с этим стратегическое планирование признано в мире обязательным условием создания электронных библиотек, цифровых коллекций и любых массивов цифрового контента.

В ПБ главными документами, определяющими развитие её содержательной составляющей, являются устав, концепция («Основные направления развития Президентской библиотеки до 2020 года»), а также Профиль комплектования — документ, регламентирующий основные принципы и особенности формирования фонда, определяющий тематику, виды и количество материалов, включаемых в состав ресурса. Поскольку же основным источником цифрового контента являются результаты оцифровки документов различных фондодержателей, в обязательном порядке определяются критерии отбора ресурсов для перевода в цифровой формат. В ПБ они отражены в Методике отбора документов в фонд Президентской библиотеки (далее — Методика отбора), утверждённой Учёным советом учреждения в 2017 г.

Отбор ресурсов для ЭБ сродни традиционному комплектованию библиотек, но вместо оценивания изданной литературы для покупки библиотекари дают оценку тем ресурсам, которые должны стать основой цифровой коллекции или её частью. При этом важной является осведомлённость об аналогичных коллекциях, создаваемых в других организациях, во избежание дублирования при оцифровке. Поскольку бóльшая часть коллекций состоит не только из редких книг и архивных материалов, но и из карт, фотографий, произведений искусства, аудио-­ и видеозаписей, в Методике отбора фиксируются технические требования к цифровым копиям каждого вида материалов.

Формирование любого цифрового ресурса невозможно без его последовательного и систематического изучения и анализа. Общее определение термина «анализ контента ЭБ» может быть таким: это систематический сбор данных о текущем количественном и качественном состоянии электронного фонда с целью накопления объёма информации, позволяющего зафиксировать и в дальнейшем отслеживать закономерности развития коллекций и намечать пути их совершенствования. Так, анализ электронного фонда ПБ проводится в том числе с целью вторичного отбора документов, позволяющего восполнить лакуны фонда или добавить в него те издания либо документы, которые не были включены ранее по объективным причинам. Помимо этого результаты анализа фонда весьма полезны для перспективного планирования процессов оцифровки. В целом выделяются два направления сбора данных: удовлетворённость пользователей и содержание цифрового контента. Оставив за рамками данной публикации всё, что связано с изучением пользовательского спроса, моделей информационного поведения, использования коллекций как главного критерия оценки релевантности фонда, остановимся на качестве контента.

Значимым принципом формирования цифрового контента ПБ является обеспечение его качества, которое оценивается по следующим направлениям: предмет/тематика, объём ресурса, его обновляемость и авторитетность. От качества цифрового контента зависит степень удовлетворённости информационных запросов пользователей. Как известно, ресурс ПБ отраслевой, он ограничен тематикой истории российской государственности, изменения территориального устройства, правом и русским языком как государственным языком Российской Федерации. Поэтому оценка тематической наполненности электронного фонда определяется следующими факторами:

·       максимально полная концентрация документов по основной тематике, определяемой рядом исследователей как ядро фонда ЭБ¹;

·       наличие фундаментальных трудов и изданий монографического характера известных в своих областях специалистов по курируемой тематике;

·       наличие авторитетных справочно­-энциклопедических изданий (универсальных и отраслевых);

·       жанровое разнообразие, но с соблюдением баланса документов научной, научно-­методической, методической, учебно-­вспомогательной и другой направленности;

·       глубина комплектования электронного фонда (хронология появления привлекаемых документов, географический и языковый охват);

·       раскрытие тематики не только через текстовые, но и через картографические, изобразительные, аудиовизуальные документы и пр.

Отметим, что качество цифрового контента с точки зрения тематики в ПБ обеспечивается за счёт использования уже отмечавшегося принципа селективности, т.е. выбора документов для оцифровки на основе экспертных оценок. В качестве экспертов выступают историки, правоведы, филологи и лингвисты, как работающие в ПБ, так и привлекаемые из других организаций. Экспертная деятельность при формировании цифрового контента электронных библиотек объективно требуется не только в целях текущего комплектования, но и для прогнозирования и отслеживания развития фонда. Именно экспертиза обеспечивает авторитетность цифрового контента для пользователей. В процессе отбора ресурсов учитываются следующие факторы: соответствие курируемой тематике; ценность — информационная для библиотечных и культурно-­историческая для архивных материалов; язык (основной — русский, однако материалы на иностранном языке могут быть оцифрованы при соответствии тематике, например цифровая «Россика»); ограничения авторского права и др.

Качество цифрового контента косвенно может оцениваться и по количественным критериям. Для Президентской библиотеки это не только увеличение совокупного объёма электронного фонда, что, безусловно, важно, но и количественное пополнение базовых цифровых коллекций («Территория России», «Российский народ», «Государственная власть», «Русский язык»), а также динамика развития отдельных тематических и событийных коллекций, которые исходно создавались как самостоятельные, но с перспективой включения в состав базовых. Всего подобных коллекций около 300: «Династия Романовых. Земский собор 1613 года», «Судебная реформа 1864 года», «Война 1812 года», «Память о Великой Победе», «История исследования и изучения русского языка», «Природные богатства России» и многие другие. Помимо этого планомерность и систематичность пополнения ресурса на основе Профиля комплектования должны привести к достижению «критической массы» документов, необходимой для эффективного поиска искомых документов и для проведения анализа фонда.

nauch-metod-podhody-3

Ещё одним качественным критерием стала обновляемость ресурса или его актуализация в целом. Очевидно, что непополняемые ресурсы имеют право на существование только при их мемориальной направленности (полностью оцифрованные владельческие коллекции, собрания книжных памятников и т.п). Любой же современный цифровой ресурс, ориентированный на поддержку науки и образования, должен развиваться путём постоянного наращивания количественных характеристик. Ежегодно фонд ПБ может увеличиваться в общей сложности на 75–100 тыс. единиц хранения в год или же на 6 млн сканов. При этом динамика роста весьма показательна: 2011 год — 150 тыс. единиц хранения, 2012-­й — 225 тыс., 2013­-й — 300 тыс., 2014-­й — 372 тыс., 2015­-й — 440 тыс., 2016-­й — 506 тыс., 2017­-й — 596 тыс., 2018­-й — 772 тыс., 2019­-й — 860 тыс. Важно, что электронный фонд ПБ пополняется ежедневно за счёт загрузки цифровых копий документов в информационную систему. Одновременно осуществляется публикация этих документов на портале.

Исходно национальный ресурс ПБ создавался как одновременно поддерживающий три функции:

·       информационного обеспечения образования;

·       удовлетворения информационных потребностей общеобразовательного характера различных групп населения;

·       использования ресурса как базы для проведения научных исследований по ряду гуманитарных направлений.

Последнее особенно важно. За рубежом констатация возможности использования цифровых коллекций при проведении научных исследований относится ещё к началу 2000-­х гг. Отмечалось, что материалы в цифровые коллекции могут поступать из значительного количества библиотек, архивов, а также из музеев. Тематические электронные коллекции есть не что иное, как цифровые массивы первичных документов по какой-­либо теме, дополненные другими материалами в виде критических эссе, обзоров, биографий и библиографии. При этом любое событие, место, явление или объект исследования могут служить в качестве темы². Данный подход в расширенном контексте стал использоваться и в России, в частности при формировании контента ПБ. Основная цель — предоставить пользователям, углублённо изучающим какую­-либо тему, массив документов в систематизированном виде. Навигация по этому массиву позволит не только получить искомую информацию, но и оценить возможности совокупного ресурса в целом. Представлялась целесообразной разработка типовых моделей отдельных цифровых коллекций, внедрение которых способствовало бы сквозному процессу их проектирования, реализации и дальнейшей поддержки. В настоящее время в ПБ активно используются две модели: персоноориентированная и регионоведческая. Так, за период 2009–2019 гг. подготовлено около 50 цифровых коллекций, посвящённых историческим персонам, внёсшим вклад в развитие российской государственности, науки, культуры и просвещения. При создании подобных коллекций приоритет отдавался тем личностям, жизнь и деятельность которых может быть рассмотрена через призму переломных моментов истории страны — освоения новых территорий, революций, войн, проведения реформ, создания государственных институтов власти и др. Примечательно, что с 2016 г. началась последовательная работа по переводу в цифровой формат владельческих коллекций исторических персон (учёных, государственных деятелей, представителей научной и художественной элиты). В настоящее время частично оцифрованы библиотеки основателя российской исторической географии Е.Е. Замысловского и общественного деятеля, теоретика народничества Н.К. Михайловского. Обе владельческие коллекции являются составной частью библиотеки Бестужевских курсов Санкт-­Петербургского государственного университета. В 2019 г. были оцифрованы издания из личной  библиотеки императрицы Марии Фёдоровны (1,8 тыс. единиц хранения) Гатчинского музея-­заповедника. Данная библиотека является одним из держателей «коллекции книг из личных императорских и великокняжеских библиотек» и включает многочисленные книжные памятники. В 2020 г. планируется  оцифровка изданий библиотеки императора Павла I.

Также созданы цифровые коллекции по всем 85 субъектам РФ. Объём этих коллекций различен, но в будущем они получат своё полноценное воплощение в виде масштабных цифровых массивов, объединяющих документы по различным аспектам истории и современного состояния российских регионов. Примером структурированных цифровых регионоведческих коллекций могут стать «Республика Карелия: страницы истории», «Рязанская область: страницы истории», «Красноярский край: страницы истории», «Республика Крым: страницы истории» и др. В ряде случаев принимаются решения о подготовке коллекций, посвящённых отдельным городам в составе субъектов РФ или имеющим статус самостоятельного субъекта. Это, например, «Санкт­-Петербург», «Москва: страницы истории», «Кострома в открытках», «Смоленск в иллюстрациях и звукозаписях», «Кронштадт — город морской славы», «Севастополь — город морской славы», «Уфа на карте России». К созданию такого рода коллекций привлекаются региональные учреждения, среди которых особое место занимают не только библиотеки, но и архивы и краеведческие музеи. Ещё одной разновидностью коллекций ПБ стали собрания, посвящённые отдельным государствам и получившие название «страноведческие». Их подготовка и публикация на портале обычно приурочена к открытию удалённых электронных читальных залов ПБ на базе национальных библиотек, российских центров науки и культуры, к празднованию памятных дат и общим важным мероприятиям в рамках международного сотрудничества. Основной принцип группировки материалов в коллекции историко­хронологический, базирующийся на принятой в науке периодизации исторического процесса. Особое значение при составлении коллекций придаётся архивным документам. Они находят место практически во всех типах цифровых коллекций ПБ: тематических, событийных, а также в тех, что посвящены отдельным организациям и учреждениям. Среди последних нельзя не отметить коллекции «Священный синод в российской государственности», «Археографическая комиссия», «Русское историческое общество — к 150­-летию», «Всероссийское учредительное собрание», «Государственный Эрмитаж» (к 255-летию со дня основания).

Трудность состоит в том, что при создании цифрового контента профильные специалисты ощущают нехватку фундаментальных теоретических и научно-­методических разработок в данной области. Это повлекло необходимость изучения зарубежных исследований, стандартов создания и представления цифровых копий документов, описания цифрового контента и многого другого. За период 2010–2019 гг. сформирована и последовательно актуализируется база регламентирующих и научно-­методических материалов, предназначенных не только для внутреннего пользования, но и для реальных/потенциальных пользователей. Налаженная система повышения квалификации сотрудников ПБ на основе изучения передового опыта мировых лидеров в области информационно-­библиотечных технологий позволяет передавать знания и опыт партнёрским организациям и учреждениям. В библиотеке ведутся научные исследования в области лингвистической и технологической поддержки электронных каталогов и формирования цифровых коллекций, выпускаются научные сборники, методические материалы, осуществляются переводы между народных стандартов и рекомендаций.

nauch-metod-podhody-4

В 2019 г. увидело свет научно­-практическое пособие «Формирование цифровых коллекций»³, в котором даётся анализ понятия «коллекция» в самом широком значении, а также раскрываются отдельные термины: «архивная коллекция», «музейная коллекция» и «цифровая коллекция». Представлены и охарактеризованы информационная, кумулятивная, просветительская, навигационная, коммуникационная и административная функции коллекций. Основным же посылом является то, что любая электронная библиотека представляет собой сложный комплекс различных технологических процессов обеспечения полного жизненного цикла создания, распространения, использования и представления данных и знаний. Центральное место в этом комплексе занимают именно цифровые коллекции. Они объединяют информацию, документы, знания и представляют собой то цифровое содержание, ради которого пользователи и обращаются к электронным библиотекам. Подготовка цифровых коллекций и в узком понимании — систематизация электронных информационных ресурсов, и в широком контексте — создание средства навигации в больших массивах документов требует высокой квалификации персонала и специальных знаний. В пособии впервые в отечественной профессиональной печати подробно проанализировано на практических примерах Руководство по созданию цифровых коллекций (A Framework of Guidance for Building Good Digital Collections)⁴. Данный документ National Information Standard Organization в течение достаточно длительного периода определяет направления и принципы подготовки цифровых коллекций в учреждениях культуры многих стран. Таким образом, научно-­методологические подходы к формированию электронных библиотек весьма обширны и многоаспектны. Они применяются как для формирования контента ЭБ, так и для технологического обеспечения её деятельности.

¹ Калюжная Т.А., Лаврик О.Л. Подходы к разработке системы показателей для характеристики электронных библиотек // Библиосфера. — 2011. — № 3. — C. 65–71.

². Palmer C. L. Scholarly Work and the Shaping of Digital Access // Journal of the American Society for Information Science and Technology. — 2005. — № 56 (11). — P. 1140–1153.

³. Формирование цифровых коллекций: научно-практическое пособие / авт. коллектив: Т.Л. Масхулия, О.Н. Жлобинская, Ю.Г. Селиванова и др.; под общ. ред. д-ра пед. наук Е.Д. Жабко; Президентская библиотека; Гранд-Фаир, 2018. — 240 с.

⁴. A Framework of Guidance for Building Good Digital Collections: A NISO Recommended Practice/ prepared by the NISO Framework Working Group with support from Institute of Museum and Library Services [Электронный ресурс] // Website of United States of America: National Information Standards Organization, 2007. — 3rd., December 2007. — Режим доступа: https://www.niso.org/sites/default/files/2017-08/framework3.pdf

Ведущий рубрики «Электронные библиотеки» Илья БЫКОВНИКОВ, Генеральный директор ФГБУ «Президентская библиотека имени Б.Н. Ельцина»


Рубрика: Электронные библиотеки

Год: 2020

Месяц: Январь/Февраль

Теги: Илья Быковников Елена Жабко