Хотели избавиться от рутины, а изменили многое


О программном комплексе сбора, систематизации и визуализации данных о публикационной активности преподавателей университета

Авторы Натела Нодарьевна КВЕЛИДЗЕ-КУЗНЕЦОВА, директор Фундаментальной библиотеки Российского государственного педагогического университета им. А.И. Герцена; Алексей Дмитриевич МАТЮШЕНКО, заведующий отделом Фундаментальной библиотеки РГПУ им. А.И. Герцена; Светлана Александровна МОРОЗОВА, заместитель директора Фундаментальной библиотеки РГПУ им. А.И. Герцена

Деятельность библиотеки, в том числе университетской, и её сотрудников традиционно полна рутинных операций, поскольку её основная цель — систематизация больших объёмов информации. Рутина даёт ощущение значимости и наполненности рабочих часов и дней, однако на самом деле привычные и простые повторяемые действия занимают много времени, но не требуют новых идей, освоения неизвестного, создают иллюзию загруженности и занятости.

Частичное избавление от рутинности, которое могут обеспечить информационные технологии, не означает сокращения численности сотрудников, но позволяет генерировать идеи, реализовывать новые проекты, перестроить работу и взаимосвязи подразделений. Проще стало? Нет, сложнее. Пришлось изменить себя? Да, пришлось, и ещё не раз придётся. Не получается? А другого пути нет, нужно переломить себя и тягу к привычному и повторяющемуся. Только быстрый отклик, готовность выполнять задачи, которые ставит университет здесь и сейчас, предвосхищение необходимого и предложение нового заранее, до того, как об этом спросили, умение меняться и мгновенно перестраивать структуру работы обеспечат сегодня необходимость и востребованность университетской библиотеки.

«ЛЮБОЕ ПРИКЛЮЧЕНИЕ ДОЛЖНО С ЧЕГО-ЛИБО НАЧАТЬСЯ…»*

*Здесь и далее подзаголовки — цитаты из «Алисы в стране чудес» Льюиса Кэрролла.

С этими идеями мы искали и нашли в 2016 г. разработчика, создавшего нам модуль «Книгообеспеченность» (https://books-lib.herzen.spb.ru/), позволивший реализовать взаимосвязи с программными средствами, в которых формируются, редактируются и размещаются учебные планы университета, образовательные программы и другие ресурсы учебной деятельности, что существенно сократило участие библиотекарей во вводе данных. Эта разработка с возможностью подготовки подмодулей на основе API-технологий позволила нам создать собственные онлайновые продукты, решающие проблемы верификации данных и расчёта сведений для значительных объёмов документов, сопровождающих аккредитацию образовательных программ вуза. Думая об избавлении от рутинности, мы создали ряд программных разработок внутреннего использования. (Добавим, что это позволило нам в считанные часы перевести все процессы, кроме связанных с печатными изданиями, на удалённую работу в марте 2020 г.). Всё перечисленное в итоге побудило задуматься о создании собственного продукта, сопровождающего неотъемлемую часть деятельности нашей библиотеки сегодня, — поддержку и сопровождение публикационной активности преподавателей, т.е. сбор и представление в различных требуемых форматах данных о наукометрических показателях, собираемых вском индексе научного цитирования (РИНЦ), глобальных мировых базах данных Scopus и Web of Science.

Следует отметить, что наша работа заключается не только в консультировании и своевременном оповещении пользователей, создании информационных ресурсов и организации к ним доступа, представлении данных в РИНЦ, организации обучающих семинаров и тренингов с привлечением экспертов, в проведении их собственными силами и во включении этого направления в образовательные программы университета, но и в постоянном сборе и формировании данных о показателях авторов, требующихся как внутри вуза, так и вне его стен. С 2018 г. в университете внедрена система эффективных контрактов, составляющей которых для преподавателей является публикационная деятельность и «вес» публикаций. Котируются статьи, индексируемые в Scopus и/или Web of Science, входящие в ядро РИНЦ, опубликованные в журналах первого-второго квартилей. Постоянная подача сведений для мониторинга выполнения эффективных контрактов в этом направлении также была возложена на библиотеку. Накопленный опыт оперативной разработки прикладных программных средств и всё то же намерение избавиться от части рутинной работы, влекущей ошибки как следствие человеческого фактора, заставили нас в начале 2019 г. задуматься о создании модуля «Наукометрия». Будучи изначально инструментом, решающим конкретную задачу, он превратился в целый комплекс модулей сбора, систематизации и визуализации данных.

Безусловно, решением проблемы могли бы стать готовые продукты, предлагаемые на мировом рынке, имеющие общее название Current Research Information Systems (CRIS), как и было сделано в ряде российских университетов. Впрочем, разнообразие CRIS, которое мы видим сегодня, показывает, что внешние и внутренние обстоятельства заставляют вузы и научные организации разрабатывать всё новые и новые продукты. CRIS-системы могут быть глобальными (общемировыми), континентальными, национальными и локальными. Наиболее явным выбором могли бы стать предлагаемые на мировом рынке продуктов для научных исследований коробочные решения — это Pure компании Elsevier (на основе БД Scopus) и Converis компании Clarivate Analytics (на основе БД Web of Science). Но в нашем случае так не произошло. Анализ применения континентальных и национальных CRIS показал, что или они прекратили существование, или проекты развиваются, но оставляют место и для собственных решений отдельных организаций. Российский опыт, кроме внедрения и адаптации PURE и Converis, предоставляет широкий спектр собственных разработок. При этом в ряде случаев организации присоединяются к проектам коллег (примеры: ИАС «Истина», Sciact, разработки СО РАН, АГУ и др.).

Повторим: мы начали с локальной разработки, решающей проблему оперативного получения данных о наукометрических показателях научно-педагогических работников (НПР) РГПУ любым человеком в какой угодно момент времени в онлайновом общедоступном модуле. Наше изначальное решение не претендовало и даже сейчас не претендует на масштаб CRIS-системы, а было создано с целью оперативного реагирования на локальные задачи вуза. Но мы хотим показать университетским библиотекам, находящимся в схожей ситуации, что можно решить проблему собственными силами, при этом не нагрузив сотрудников библиотеки новыми рутинными операциями, а, наоборот, избавив от них. Целесообразность данного подхода подтверждает и тот факт, что копия нашей разработки уже развёрнута и функционирует в одном из российских университетов.

«ПЛАН, ЧТО И ГОВОРИТЬ, БЫЛ ПРЕВОСХОДНЫЙ: ПРОСТОЙ И ЯСНЫЙ, ЛУЧШЕ НЕ ПРИДУМАТЬ. НЕДОСТАТОК У НЕГО БЫЛ ТОЛЬКО ОДИН: БЫЛО СОВЕРШЕННО НЕИЗВЕСТНО, КАК ПРИВЕСТИ ЕГО В ИСПОЛНЕНИЕ»

Созданный программный комплекс на первом этапе представлял собой два решения:

·         служебный внутренний модуль сбора (корректировки) данных;

·         внешний табличный интерфейс вывода информации.

Служебный внутренний модуль сбора (корректировки) данных (рис. 1) предназначен только для сотрудников фундаментальной библиотеки и позволяет им проверить, а при необходимости отредактировать краткие данные об авторах, идентификаторы авторов (линки) и информацию о показателях, которые выводятся в онлайн-форму.

hoteli-izbavitsya-1

В числе функциональных возможностей сервиса — добавление/удаление/скрытие авторов, цветовые отметки о проверке сотрудником библиотеки и переход к табличному онлайн-отчёту.

Технология работы внутреннего модуля:

·         Система управления базами данных (СУБД) с двумя таблицами: 1 (users) — информация о ФИО и ID авторов; 2 (stats) — типы статистики, данные, периоды.

·         Скрипт запросов по API в Scopus — запрос по ScopusID, Web of Science — запрос по названию университета. Разбор полученного массива данных по авторам; РИНЦ — запрос по AuthorID.

·         Передача упорядоченных данных в СУБД.

·         Для Web of Science также осуществляется поддержка «ручного» раздела, где собираются данные по авторам РГПУ независимо от того, указана ли в публикации аффилиация вуза, поскольку по запросу передаются только данные с указанием названия университета.

Обзорная страница модуля показывает краткие данные о каждом авторе и возможность перехода к подробной информации, где может быть реализована «ручная» корректировка сведений (рис. 2).

hoteli-izbavitsya-2

Внешний табличный модуль вывода данных, представленный по адресу: https://lib.herzen.spb.ru/sciencemetrics.php, кроме полного перечня авторов, их идентификаторов в различных научных системах и наукометрических показателей содержит следующие сервисы:

·         данные о подразделениях (линки);

·         возможность выбора периода для сравнения;

·         ранжирование всех столбцов;

·         выделение строки;

·         всплывающие подсказки для каждой ячейки;

·         экспорт данных в Excel.

Технология формирования внешнего табличного модуля:

·         авторы и их данные;

·         учёт периодов (текущего, предыдущего и предшествующего предыдущему, если в предыдущем были нулевые показатели);

·         в момент формирования таблицы производится математический расчёт роста данных (по умолчанию сравниваются текущий и предыдущий периоды).

Когда мы накопили данные за полгода, во внешний табличный модуль вывода данных был добавлен раздел для сравнения информации по любым произвольным отрезкам времени. Теперь это уже позволяет сравнивать полугодия и годы или одни и те же периоды разных лет. В первоначальном варианте для сравнения выводились только текущий (в момент запроса) и предыдущий месяцы.

Сейчас уже можно сказать, что, пожалуй, самым сложным был этап создания единого скрипта API-запросов к таким разным ресурсам. Необходимо было договориться с представителями РИНЦ, Scopus, Web of Science, учесть язык запросов каждого ресурса, формат данных, периодичность запросов и всё полученное разместить в едином интерфейсе. Важно, что у нас была возможность бесплатного доступа к API вышеперечисленных платформ: в РИНЦ нам давала такое право подписка на модуль «Science Index Организация», включающий полный перечень авторов, работающих в университете, в Web of Science — организация доступа к InCites (в дополнение к централизованной подписке на сам наукометрический ресурс), в Scopus — доступ к ресурсу в рамках также централизованной подписки.

«ЕСЛИ В МИРЕ ВСЁ БЕССМЫСЛЕННО, ЧТО МЕШАЕТ ВЫДУМАТЬ КАКОЙ-НИБУДЬ СМЫСЛ?»

Интерес в университете к визуализации данных в табличном формате, полученный отклик и пожелания позволили нам продолжить работу. У нас уже было главное: СУБД с большим объёмом информации. Дальнейшее развитие форм представления сведений стало вопросом наших идей. Помогли примеры, увиденные у коллег, и запросы самого университета.

И первое, что мы придумали, не требовало создания новых платформ, а должно было стать достойным развитием уже реализованного. Это визуализация индивидуальных данных каждого преподавателя. Основой послужил «Электронный атлас» университета, содержащий внешние профили каждого преподавателя и локальные личные кабинеты преподавателей и студентов. Предпосылкой стало то, что уже несколько лет в профиль введён раздел «Публикации преподавателей»; их перечень формируется в режиме реального времени в момент обращения путём синхронизации сведений с библиографической базой данных Фундаментальной библиотеки «Публикации РГПУ им. А.И. Герцена» (ранее — «Труды сотрудников»), созданной в 1944 г. Идея была реализована за несколько дней, поскольку взаимодействие с подразделением университета, реализующим и поддерживающим профили, уже налажено. Разработали API для передачи данных из СУБД внутреннего (служебного) модуля в профили преподавателей на сайте университета. В результате в профиле каждого преподавателя появился раздел «Наукометрия», данные в котором формируются путём запроса по API в режиме реального времени (рис. 3). Данные об идентификаторах — это одновременно и ссылки быстрого перехода к профилям на соответствующих платформах.

hoteli-izbavitsya-3

Наращивая полноту отражения данных, мы добавили запрос по идентификаторам AuthorID, которые авторы вводят в личную анкету в РИНЦ и в записи за пять последних лет. Сформировали и интегрировали запрос по данным. Google не передаёт их по API-каналам, поэтому был найден другой вариант запроса.

Большой объём сведений значительно увеличил табличный онлайновый формат представления данных, поэтому для удобства работы пользователей мы сделали два кратких варианта таблицы (в дополнение к основной): по РИНЦ и ядру РИНЦ, а также по Scopus и Web of Science.

По инициативе библиотеки в университете был издан приказ, предписывающий научно-педагогическим работникам вуза регистрироваться и редактировать профили в системах РИНЦ, ORCID, Web of Science ResearcherID (Publons) и Google Scholar ID. Систематизация полученных сведений в совокупности с автоматически формируемым при наличии индексируемых публикаций Scopus AuthorID и привлечение авторов, ранее активно не участвовавших в процессе, обеспечили возможность мониторинга полноты и достоверности сведений. Для поддержки процесса регистрации Фундаментальной библиотекой была создана инструкционная страница с необходимыми подсказками по каждому идентификатору: https://lib.herzen.spb.ru/p/authorid.

«НУ РАЗВЕ МОЖНО СЕРЬЁЗНО ОТНОСИТЬСЯ К КНИЖКЕ БЕЗ КАРТИНОК?!»

Какие пути развития данного направления мы видим сейчас?

Мы обладаем большой базой сведений, различной информацией об авторах, поэтому целесообразно двигаться в сторону визуализации этого массива данных в тех форматах, которые будут и востребованны, и максимально доступны.

Наполнив информацией раздел «Наукометрия» в профилях авторов, в 2020 г. мы вернулись и к разделу «Публикации преподавателя»: стало понятно, что мы можем не просто создать библиографический список, но наполнить его информацией, переходами по ссылкам. В дальнейшем нам это позволит соединить публикации и наукометрические показатели. Конечно, это длительная работа, поскольку она производится сотрудниками Фундаментальной библиотеки, а не самими преподавателями, как это реализовано в CRIS-системах в ряде российских университетов и научных организаций. Теперь список, который готов к копированию для любой отчётной документации или цитирования автора, сопровождается сведениями об URL полного текста, DOI (линк) и индексации в наукометрических базах данных со ссылкой перехода к публикации на указанной платформе (рис. 4).

hoteli-izbavitsya-4

В настоящий момент мы реализуем и отлаживаем визуальное представление накопленных сведений в формате общих графиков и рейтинговых диаграмм (https://lib.herzen.spb.ru/sciencemetrics_charts.php, рис. 5). Этот формат представления данных позволяет выбрать для анализа любой период (с января 2019 г.) и построить графики изменений показателей по различным параметрам.

hoteli-izbavitsya-5

Второй вид диаграмм показывает за тот же период пятёрки лучших институтов/факультетов университета как по отдельным показателям (публикациям, цитированиям), так и по динамике их роста.

Возможно получить такое же визуальное представление данных в рамках отдельной структуры вуза. В данном случае рейтинговые топ-5 диаграммы — это сведения о преподавателях. Каждая из диаграмм при наведении курсора показывает сведения в абсолютных величинах. Кликом мыши можно убрать тот или иной показатель (подразделение, персону), чтобы рассмотреть остальные сведения подробнее, и так же легко его вернуть.

Безусловно, как и во всех предыдущих форматах представления показателей, требуются тщательная проверка и тестирование представленных сведений. Ведь мы говорим о работающих в настоящий момент сотрудниках университета, а данные максимально открыты и общедоступны.

«...СТАНЕТ ПОНЯТНО, ЗАЧЕМ ВСЁ БЫЛО НУЖНО, ПОТОМУ ЧТО ВСЁ БУДЕТ ПРАВИЛЬНО»

Если вы создаёте в университетской библиотеке собственные ИТ-разработки, то важно понять, что специалисты библиотечного дела, работающие с программистами, должны многое в себе изменить. Нельзя сказать программисту: «Мы хотим» — и ждать того результата, который вы предполагали. Это долгая, кропотливая совместная работа, в ней библиотекарю необходимо понять логику и законы создания программных продуктов, их возможности, быть готовым проверять результаты на каждом этапе и, самое сложное, принять, что программист не библиотекарь, он рассуждает и делает всё не так, как вы. Успех заключается только во взаимодействии: ваше видение целей и задач и ваши профессиональные знания должны совместиться с возможностями, знаниями и умениями ИT-специалиста.

Произведённые и обнародованные разработки по отражению данных о публикационной активности, вывод их в открытое онлайновое общедоступное пространство, безусловно, привлекли внимание наших преподавателей — авторов научных публикаций. Мы получили в ответ то, чего ожидали: оперативную информацию о новых опубликованных исследованиях, отклик о необходимости корректировки неверных по какой-либо причине данных, да и просто интерес к проекту, который выражается в самостоятельном изучении наукометрических данных, росте публикационной активности, увеличении числа обращений в библиотеку за консультациями.

И завершим тем, с чего начали. Да, конечно, ручных операций в нашей работе всегда будет много, да, рутинные действия останутся. Но не в том объёме, как могло бы быть, и только там, где нам пока не удаётся справиться с этой задачей (но, конечно, мы размышляем над её решением). Теперь мы можем не отвлекаться на простейшие запросы типа «Какой у меня тот или иной показатель?», «Подскажите мой ID», а продолжить развитие модуля, улучшать наши базы данных путём наполнения их недостающими сведениями, ссылками, быстрыми переходами.

Это не делает нашу работу проще: наоборот, все принятые меры избавляют нас от примитивности действий, заставляют и позволяют учиться, узнавать новое, быть аналитиками, консультантами, квалифицированно сопровождать университетскую науку и образование.


Рубрика: Вузовские библиотеки

Год: 2020

Месяц: Июль/Август

Теги: Натела Квелидзе-Кузнецова