Инфраструктура и сервисы цифровой экосистемы библиотек

Задачи популяризации достижений российской науки, создания комфортных условий для исследований и доступа к научной информации, построения единого информационного пространства отражены в Стратегии научно-технологического развития Российской Федерации и других важных государственных документах.

informatsiya

В современных условиях информационная поддержка и сопровождение научных исследований (research support) является ключевой задачей деятельности библиотек, информационных подразделений вузов и научных организаций. Проблемы, опыт и перспективы обсудили эксперты в рамках круглого стола «Инфраструктура и сервисы цифровой экосистемы библиотек».

О цифровом пространстве знаний говорят уже почти четверть века. Термин используется в различных основополагающих документах, но чёткого определения нет. Несколько организаций: Межведомственный суперкомпьютерный центр РАН, федеральный информационный центр «Информатика и управление» и Институт научной информации по общественным наукам (ИНИОН) РАН ввели понятие «единое цифровое пространство научных знаний» (ЕЦПНЗ), а Российский фонд фундаментальных исследований (РФФИ) выделил грант на разработку концепции и некоторых теоретических моментов.

Как сообщил главный научный сотрудник Межведомственного суперкомпьютерного центра РАН Николай КАЛЁНОВ, ЕЦПНЗ — принципиально новая информационная среда, а не просто документная база. Официальное определение звучит так: совокупность достоверной информации в цифровом виде вместе со средствами её актуализации, обеспечения сохранности и предоставления пользователям. ЕЦПНЗ состоит из совокупности подпространств, относящихся к той или иной научной области. Единство среды определяется тем, что она создана по общим принципам, а связь подпространств осуществляется на основе единой предметной онтологии.

— Науку делают люди, поэтому главная информация в ЕЦПНЗ — об учёных и исследователях. Один и тот же человек может заниматься философией, математикой и химией. Универсальным классом являются публикации, которые могут относиться к различным областям науки. Важно установить связи между этими позициями, — подчеркнул эксперт.

Основная цель создания ЕЦПНЗ — поддержка информационного сопровождения научных исследований и образовательного процесса.

— Сегодня информация нарастает лавинообразно. В последние 10 лет количество опубликованных статей удвоилось, но система обеспечения науки, которая базировалась в библиотеках и информационных центрах, практически разрушена. Исследователи тратят на поиск необходимого контента огромное количество времени, а с учётом того, что сегодня развит поиск по полным текстам, возникает большой объём информационного шума. Поэтому одна из важнейших задач — отбор релевантной информации с исключением дублирования, — прокомментировал Н. Калёнов.

Проект будет агрегировать библиотечную, музейную и архивную информацию, а также контент, представленный в фактографических базах данных и энциклопедиях. В меньшей степени будут затронуты базы научного цитирования. Если информация представлена в открытом виде, то она будет доступна на ресурсе. Если у неё есть владелец, то по договорённости с ним будут даны ссылки или загружены метаданные.

Отдельно эксперт коснулся темы форматов.

— В библиотечном деле используется MARС-формат, в музейном общепринятый формат — КАМИС. Существует много форматов представления архивной информации. ЕЦПНЗ не требуются данные, характерные для внутренних нужд организаций, такие как даты инвентаризации, инвентарные номера и т.п. Нам нужна информация, которая обеспечит связь между объектами: ссылка на персоналии, организации, годы, тематики публикаций и т.д. Мы исходим из того, что данное пространство создаётся прежде всего для пользователей. Готовы использовать любые входные форматы, а затем реализовывать интеграцию ресурсов между собой.

В последнее время появился ряд государственных инициатив, программ и проектов, в которых обозначена необходимость создать различные цифровые информационные системы в целях поддержки научных исследований. В частности, в рамках госпрограммы «Научно-техническое развитие Российской Федерации» в 2021 г. предусмотрена реализация мероприятия «Интеграция ресурсов библиотек, архивов, иных организаций, в том числе осуществляющих функции государственных депозитариев, в Национальную электронную библиотеку». А Минобрнауки России поручено проработать вопрос включения в нацпроект «Наука» предложений по созданию единой платформы цифровых библиотечных ресурсов и онлайн-курсов.

Заместитель директора по развитию Государственной научно-технической библиотеки Сибирского отделения РАН Денис КОСЯКОВ рассказал о подходах к созданию национальной инфраструктуры поддержки научных коммуникаций.

По словам эксперта, важная задача — обеспечить доступность полных текстов публикаций. Основной акцент делается на монографии и журнальные статьи, при этом следует понимать, что их объём огромен. Так, в eLibrary ежегодно регистрируется 500–600 тыс. журнальных статей, общий поток — более 1 млн публикаций. Помимо самих полных текстов необходимо обеспечить возможность их обнаружения и обработки, что связано с предоставлением доступа к метаданным.

— Метаданные — самостоятельный контент. Они используются при подготовке публикационных отчётов, формировании тематических информационных ресурсов, репозиториев, являются основой научной коммуникации. Работать с метаданными можно без ограничений, связанных с авторским правом. При этом серьёзное значение имеет их качество. Если у автора указаны лишь фамилия и инициалы, велика вероятность спутать его с кем-то другим. Но если в дополнение к этому указан уникальный идентификатор исследователя, всё становится значительно проще. Аналогичные принципы применяются к названиям организаций, журналов, издательств и т.п. Отсутствие метаданных или их низкое качество имеют вполне реальные негативные последствия: высокие трудозатраты или необоснованные управленческие решения. Невозможность идентификации сущностей приводит к отсутствию их учёта и связывания, а значит, построение любого отчёта остаётся ручной работой, — отметил эксперт.

Цифровая инфраструктура метаданных должна стать основной платформой для электронных библиотечных ресурсов или — шире — цифровой экосистемы поддержки научных коммуникаций.

Д. Косяков выделил проблемы, связанные с построением таких инфраструктурных проектов. Это прежде всего необоснованная централизация, монопольный характер программно-технических и организационных решений, что ограничивает доступ к данным и отсекает научное сообщество от участия в их развитии. Очевидно отсутствие анализа накопленного опыта уже имеющихся наработок и, как следствие, нередко каждый новый разработчик вынужден проходить весь эволюционный путь. В этой же плоскости — крайне низкий уровень интеграции с имеющимися российскими и зарубежными системами, в которых накоплен огромный объём информации. Имеет место недостаточное внимание к публикациям российских учёных в зарубежных журналах и сборниках монографий. Ещё одна проблема — низкий приоритет задачи по представлению результатов российской науки для мирового сообщества. Кроме того, нередки попытки построить комплексную систему, описывающую все аспекты информационной поддержки научных исследований вместо набора сервисов.

По мнению выступающего, библиотечному сообществу пора переходить от концепции авторитетных файлов к модели уникальных идентификаторов: ORCID, DOI, ROR, GRID, ISNI. Примером подобной структуры является Crossref: на основе метаданных она позволяет выстраивать различные сервисы. В частности, Cited-by — это информация о цитированиях по DOI. Event Data — сведения об упоминаниях в СМИ и соцсетях. Сервис Unpaywall предоставляет информацию о доступности полных текстов в разных хранилищах и о режимах доступа к ним.

Эксперт сформулировал принципы, которым должна соответствовать инфраструктура поддержки научных коммуникаций. Прежде всего, нет необходимости в построении единого замкнутого пространства со всей научной информацией. Наука открыта, значит, должны быть открытые системы. Постоянные идентификаторы позволяют создавать системы открытых связанных данных. Целесообразно выстраивать отдельные модули, дополняющие друг друга, что требует открытого доступа и предусматривает возможность конкуренции, а значит, повышения качества услуг.

— Базовая информация должна быть монопольной, как система подвода электроэнергии к вашей квартире. А всё остальное может быть конкурентным. Крайне важно на самом раннем этапе заложить интеграцию в мировое научное пространство. Как минимум системы должны содержать перекрёстные идентификаторы.

По словам Д. Косякова, сегодня непросто работать с информацией о проектах, в отношении финансирования исследований, отдельных публикаций и т.д. При этом в России существует как минимум несколько источников информации о проектах: ведомственная система Минобрнауки России, информационные системы РФФИ и Российского научного фонда, ФЦП «Исследования и разработки», а также Единая государственная информационная система учёта научно-исследовательских, опытно-конструкторских и технологических работ гражданского назначения. В мире есть успешные примеры агрегаторов проектов, которые берут информацию от разных финансирующих организаций, сводят её и предоставляют в доступ в локальных информационных системах.

Российский агрегатор данных о научных проектах должен обеспечивать оперативную репликацию данных, обогащать их сведениями об исполнителях с привязкой к разным идентификаторам. Крайне желательна интеграция с ORCID для дополнения профиля исследователя. Необходим экспорт информации для обмена данными и использования их в наукометрических и науковедческих исследованиях.

Важный сервис — национальный реестр научных организаций. Любой, кто сталкивался с библиометрией, испытывал трудности с однозначной идентификацией организаций.

Следующий необходимый инструмент — национальный реестр научных публикаций. Crossref на сегодняшний день не является идеальной средой, прежде всего из-за неполного охвата. Множество публикаций в этой системе не регистрируется. Вторая проблема — неполнота метаданных, предоставляемых издателями. Кроме того, Crossref пока не поддерживает мультиязычность. Таким образом, наиболее приемлемый вариант — Crossref+, подразумевающий создание на базе сервисов по регистрации DOI распределённой или централизованной базы данных с расширенными метаданными, стандартом полноты, контролем качества.

Ещё одна система касается резюме научных работников.

— Во всём мире это считается крайне важным. Мы многократно заполняем информацию о себе в разных местах, в частности в научных фондах, когда подаём заявки на грант, в системах Минобрнауки России, в Единой информационной системе проведения конкурсов на замещение должностей, в eLibrary, в Science ID. Собственно, последняя и должна играть роль национального агрегатора, но пока не получила должного охвата. Все эти системы характеризуются отсутствием интеграции и доступа к данным. Хороший пример реализации подобного сервиса есть в Португалии: учёный может размещать в нём необходимую информацию и отчитываться за гранты, не следя за актуальностью информации в разных системах. Такая система должна обеспечивать возможность ведения мультиязычного профиля, интеграцию с ORCID, российскими внешними системами, поддерживать экспорт и импорт данных.

Подобная инфраструктура упростит для исследователей доступ к научно-технической информации, обеспечит цифровизацию процессов сбора заявок на научные проекты и подготовку отчётов, оптимизирует представление результатов российской науки за рубежом, позволит создавать различные сервисы, автоматизирует обмен данными и проведение мониторинга развития национального сектора исследований и разработок.

Активными участниками проекта должны стать не только библиотеки, но и научные фонды, издательства, разработчики информационных систем, Российская книжная палата, РАН, представители ведущих университетов, профессиональные объединения, существующие научные сервисы. Оптимальным решением было бы создание при Минобрнауки России межведомственного совета, который станет осуществлять стратегическое управление проектом, предоставлять ресурсы и оценивать итоги работы, — отметил в завершение эксперт.

Российские электронные библиотеки далеки от совершенства, считает ведущий научный сотрудник ИНИОН РАН Татьяна МАЙСТРОВИЧ.

— Подавляющее большинство содержит в основном цифровые копии аналоговых документов, поэтому не вводят в оборот новое знание, не предоставляют к нему доступ и не углубляют научное информационное пространство. Серьёзная проблема связана с тем, что библиотеки не агрегируют так называемые платформозависимые документы, профессиональные ресурсы, содержащие результаты экспериментов и полевых исследований, не аккумулируют отчёты, итоги конференций и т.п. В то же время тенденция открытой науки подразумевает, что подобных полнотекстовых документов будет появляться всё больше. Кроме того, возникают новые виды ресурсов, которыми аналоговые библиотеки просто не могут комплектоваться: видео, обмен мнениями на форумах и в блогах, специализированные базы данных, материалы онлайн-конференций. Этот контент практически выпадает из научного пространства.

Какими могут быть фондообразующие функции научных электронных библиотек? Это прежде всего углубление научного пространства путём введения в широкий оборот ранее не опубликованного знания (записей публичных лекций, документальных фильмов, презентаций и т.п.). Так, в стандарте по профилю комплектования ИНИОН РАН есть понятие «ведомственный депозит». Это означает, что произведение, созданное как служебное, в идеале должно передаваться в электронную библиотеку. Возможно, следует создать некий правовой инструмент наподобие обязательного экземпляра.

Вторая функция — расширение данного пространства за счёт републикации и повышения доступности аналоговых документов. Однако эта деятельность для научных электронных библиотек не должна становиться основной. Гораздо важнее структурирование контента, эффективная каталогизация, которые позволят создать бесшовное научно-информационное пространство. Это третья функция.

По мнению эксперта, сегодня у библиотеки есть конкурентная среда в виде репозиториев и веб-архивов. Те решения, которые она должна предлагать, инициируют другие организации. Следует пересмотреть подходы к формированию электронных фондов и организации доступа к ним, если она хочет остаться активным игроком на информационном поле.

Интенсивное внедрение информационных услуг на основе библиометрических методов и данных, создание служб поддержки публикационной активности свидетельствуют об актуальности сервисного подхода к информационному обеспечению научной деятельности. С целью выявления эффективных практик Уральское отделение (УрО) РАН провело маркетинговое исследование по группе российских университетов, участвующих в международных рейтингах QS и ARWU. Результаты представила учёный секретарь Центральной научной библиотеки УрО РАН Анна ПАВЛОВА.

В проекте принял участие 21 вуз. Как показал анализ, все участники обеспечивают такие услуги, как предоставление наукометрической информации о рейтингах журналов в той или иной области исследования, доступ к библиометрическим базам данных. Более половины респондентов осуществляют организацию обучающих и информационных мероприятий, мастер-классов и проводят консультирование в определении персональных идентификаторов и показателей, по работе в библиометрических базах, в области описания и цитирования исследовательских данных, помогают в настройке профилей автора и организации.

Большинство университетов разрабатывают собственные методические информационные продукты: инструкции по настройке авторского профиля и работе в библиометрических ресурсах, презентации, руководства, видеоматериалы. 29% готовят научно-информационные материалы: карты науки, рейтинги университетов, публикаций и авторов, списки рейтинговых журналов, разрабатывают сервисы по автоматическому оформлению цитирований и т.п. 10% предлагают справочно-библиографические продукты: информацию о библиометрических показателях, новости в области наукометрии и т.д.

В числе информационных ресурсов, на основе которых выпускаются методические материалы, наиболее часто встречаются Web of Science, Scopus, РИНЦ, реже — Google Scholar, Researcher ID, Mendeley, Science Index, SciVal и др. В наименьшей степени представлены отраслевые наукометрические ресурсы, что может быть обусловлено профилем конкретного университета.

По итогам исследования были выявлены приоритетные направления использования библиометрических методов и ресурсов. Это прежде всего организация доступа к наукометрическим базам данных, обеспечение поиска по теме исследования в этих ресурсах, создание и настройка авторских профилей, методическое сопровождение научных исследований в области описания и цитирования исследовательских данных, определения наукометрических показателей, а также справочно-библиографическое обслуживание.

Как отметила выступающая, в российских университетах функции информационной поддержки исследований не всегда или не полностью возложены на библиотеку. Как правило, они распределены между различными подразделениями вуза. Могут быть созданы отдельные службы, в частности по поддержке публикационной активности.

Практика информационного сопровождения научных исследований имеет тенденцию к преобладанию услуг организационной и методической направленностей. В то же время перечень информационных услуг и продуктов достаточно широк и разнообразен. Это отличает российские вузы от зарубежных, где высока доля библиографических и научно-информационных сервисов.

Последние несколько лет деятельность научных библиотек неразрывно связана с использованием методов наукометрии и библиометрии, а их сотрудники ассоциируются с авторитетными экспертами по определению показателей и мониторинга публикационной активности научных организаций и исследователей. Библиотеки всего мира стараются адаптироваться к изменениям экономической и общественной жизни.

Есть ли место для наукометрии в библиотеке будущего? Эксперты УрО РАН провели специальное исследование. Целевой аудиторией стали учёные секретари организаций, заместители директоров по научной работе, председатели советов молодых учёных 50 организаций. Об итогах рассказала научный сотрудник УрО РАН Юлия ПРОКОФЬЕВА.

Согласно итогам опроса, более 70% респондентов имеют доступ и к Web of Science, и к Scopus. 87,5% используют наукометрические базы для сбора информации по показателям, таким как импакт-фактор, индекс Хирша, число публикаций. 76% работают более содержательно: это поиск и подбор литературы по теме. 56% действуют на экспертном уровне, анализируя деятельность организаций и учёных. При этом специализированное на наукометрии подразделение есть только у одного участника опроса. В трёх организациях этими вопросами занимается научная библиотека. 76% указали, что в отсутствие специализированного отдела тем не менее есть сотрудник, ведущий наукометрические исследования. В 68% случаев это учёный секретарь организации. Следует отметить, что чаще всего под наукометрическими исследованиями понимается сбор показателей для отчётности и работа с базами данных.

Половина опрошенных подтвердили необходимость присутствия в организации специалиста по наукометрии в штате: 20% — в качестве консультанта, 30% — в роли эксперта для серьёзного анализа деятельности. 37% заявили о том, что такой специалист не требуется, а сотрудники института обладают необходимым уровнем знаний по наукометрии.

Как отметила Ю. Прокофьева, задача специалистов библиотеки — раскрыть потенциал наукометрических ресурсов через свои услуги. Очевидно, что место в будущем в этом направлении у библиотеки есть при условии её активной позиции. У научных институтов существует потребность в наукометрических исследованиях, а у библиотеки — соответствующие ресурсы. Библиотекари знают, как наиболее эффективно использовать основные базы данных, организовывать доступ к ним, использовать аналитические инструменты.

Любые процессы невозможны без исполнителей, а значит, первостепенное значение приобретают вопросы образования и развития персонала. В этом году в России было проведено исследование компетенций сотрудников библиотек, функционирующих в исследовательской среде, с целью определить наиболее востребованные навыки. В качестве целевой группы были выделены специалисты, осуществляющие информационное сопровождение фундаментальных научных исследований РАН. В исследовании приняли участие 50 респондентов. Участникам было предложено оценить три группы компетенций: фоновые, знания и навыки в области научных коммуникаций и soft skills. Результаты представила младший научный сотрудник Центральной научной библиотеки УрО РАН Мария ПЕКШЕВА.

К универсальным фоновым знаниям и навыкам 84% респондентов отнесли знание принципов организации информации и доступа к ней, 78% — понятия о конфиденциальности, сохранении информации, информационной этике, 75% — знание миссии, структуры, целей и задач вышестоящей организации, 57% — владение правовой базой, в которой существуют библиотеки. К специализированным — знание специфики конкретных предметных областей, дисциплин, отраслей (75%), процессов планирования, организации и проведения профессиональных мероприятий (61%), навыки подготовки отчётов и написания грантовых заявок (61%), разработки учебных программ, преподавания и наставничества (59%), знание жизненного цикла исследований, моделей, методов и этики научно-исследовательской деятельности (57%). Кроме того, к фоновым 47% отнесли знания о тенденциях в области научных коммуникаций, открытого доступа и открытой науки, информационной безопасности.

— Представляется, что именно эта группа знаний, умений и навыков формирует понимание высокой значимости профессионального развития. Если специалист осознаёт, что происходит вокруг него, куда движется экономика и научно-технологическое развитие, он будет понимать необходимость повышения собственной квалификации, освоения новых инструментов и функций, — подчеркнула выступающая.

Что касается сферы научных коммуникаций, то 53% считают универсальным знание российского и мирового законодательств в области авторского права, интеллектуальной собственности и защиты данных. 45% — знания и навыки работы с базами научного цитирования, библиометрическими показателями. К специализированным свыше 60% респондентов отнесли знание библиометрии, навыки описания исследовательских сведений и создания метаданных, интеграции и формирования связей, 55% — навыки в области управления исследовательскими данными (очистку и проверку файлов, лицензирование, цитирование и т.д.), умение публиковать и хранить исследовательские данные в репозиториях с назначением идентификаторов и др. 49% в эту категорию включили навыки сбора данных, мониторинга и анализа публикационной активности и научной продуктивности.

В качестве необходимых мягких навыков 82% респондентов назвали коммуникацию, 69% — командную работу и сотрудничество, адаптивность, гибкость и открытость для экспериментов, 65% — знание деловой этики, навыки организаторской деятельности и принятия решений и т.д.


Рубрика: Библиотечное дело

Год: 2021

Месяц: Июль/Август

Теги: Татьяна Майстрович