«Вики» и окрестности


«Википедия» — одно из величайших изобретений XXI в. «Википедия» на русском языке — одно из крупнейших достижений Рунета. Приняв за основу эти две истины, давайте всё же зададимся вопросом: имеет ли право претендовать на популярность какой-либо другой справочно-энциклопедический ресурс в мире, где уже есть «Википедия»?

vaasyanin

Автор Михаил ВАСЯНИН, независимый эксперт

Мой ответ — утвердительный. За два последних столетия на русском языке создано множество энциклопедий и словарей: универсальных и тематических, больших и малых, устаревших и сохраняющих актуальность, серьёзно-академических и даже шуточных.

Некоторые скажут, что для среднего пользователя Интернета, находящегося в поисках объективной и актуальной информации, «Википедии» вполне достаточно. В каком-то смысле с ними можно согласиться. За последние годы в «народной энциклопедии», особенно в её статьях, затрагивающих популярные темы, налажено строгое патрулирование качества контента, позволяющее достичь консенсуса по спорным вопросам на основе авторитетных источников. Что же касается оперативной актуализации материалов, то соревнование с вики-сообществом, создавшим более 1,5 млн статей и постоянно их редактирующим, — затея крайне затратная и, по сути, бессмысленная.

В то же время ещё никто всерьёз не бросил вызов академическим знаниям, положенным в основу фундаментальных энциклопедий и словарей. Более того, авторы «Википедии» и «Вики-словаря» опираются в создании новых материалов именно на такие академические источники.

Также следует отметить, что в силу различных причин, среди которых назовём прежде всего вопросы авторского права и высокую стоимость реально качественной оцифровки изданий, в Рунете до сих пор не появился ресурс, на котором была бы предпринята успешная попытка собрать, классифицировать, снабдить интеллектуальными поисковыми механизмами всё богатство энциклопедий и словарей на русском языке, как составляющих культурное наследие, так и современных.

Опыт, в том числе опыт автора этих строк, придумавшего в довикипедийную эпоху энциклопедический портал «Рубрикон», говорит о том, что задача столь масштабной оцифровки и качественного показа reference-контента не под силу частному бизнесу. Опыт же более современных краудсорсинг-проектов скоростной оцифровки больших массивов свидетельствует о том, что качество невозможно обеспечить без надлежащего QA¹, за который лучше платить деньги на регулярной основе.

¹. Контроль над правильностью выполнения всех этапов разработки и корректностью работы итогового продукта. — Примеч. ред.

Вот и получается, что сохранение и надлежащая демонстрация накопленного культурного наследия — дело государственное (sic!).

Хотелось бы отдельно остановиться на том, какими качествами должен обладать такой ресурс.

1. КОМПАРАТИВНЫЙ ПОДХОД

«Википедия» даёт нам возможность пронаблюдать, нажав на странице статьи на ссылку «История» (View history), как менялась авторская правка, достигался (или не достигался) консенсус между авторами. «История» покажет нам судьбу статьи с момента её появления, результаты автоматического или ручного патрулирования и др.

А если нужно оценить разные взгляды, подходы к проблеме в течение какого-то длительного периода времени представителей различных научных школ, разные дефиниции и глубину погружения в проблему?

Школьнику (по крайней мере, так принято считать), скорее всего, не нужен весь объём текста статьи в специализированной энциклопедии, а может оказаться достаточным прочитать короткую дефиницию на смартфоне. Лимитирование, сужение объёма информации для определённой целевой аудитории — это задача, с которой успешно справляются энциклопедические словари, учебные толковые и переводные словари. Кстати говоря, в Рунете до сих пор нет и популярного справочно-энциклопедического ресурса для школьников…

Специалисту, желающему освежить свои знания в смежной проблеме, интересно будет почитать, как эта проблема трактуется в отраслевой энциклопедии или в работе зарубежного автора.

Историк науки не без интереса посмотрит на дефиницию кибернетики в Кратком философском словаре 1954 г. и сравнит её с более поздним определением из Большой советской энциклопедии.

Пытливый читатель найдёт архаизм из классической литературы у Владимира Даля или удивится трактовке современного слова у Ожегова. Многим будет любопытно взглянуть на результаты так называемой конъюнктурной правки от издания к изданию (что особенно характерно для советского периода, но сохранилось и сейчас)².

².В той же БРЭ три (!) статьи про Крым.

Иными словами, представителям разных целевых аудиторий компаративный подход даёт разные результаты. Налицо дифференцирование ценности материала, реализуемое на большом массиве reference-контента.

Следует также продумать все тонкости интерфейса: ведь пользователю в разные моменты могут понадобиться не только сравнение дефиниций и параллельный просмотр полных статей, в том числе по разделам, но и сличение переводов, выбор справочных источников (reference sources), наконец, возможность автоматизированного и корректного научного цитирования, устойчивая ссылка (permalink), а также многое другое. При этом интерфейс не должен быть чрезмерно перегружен!

Одной из красивых опций сайта, пробуждающих любопытство и самостоятельное мышление пользователей, могла бы стать система сравнения справочных материалов по хронологическому принципу.

Для пользователей переводных и толковых словарей может оказаться полезной сортировка результатов по источникам: от универсальных к специализированным — или, наоборот, исключение источников по типу (поиск только по отраслевым словарям и т.п.).

Если положить в основу ресурса UX- и UI-возможности³сравнения «зафиксированных» материалов, то его потребительская ценность возрастёт многократно.

³. UX (user experience) переводится на русский как «пользовательский опыт», т.е. опыт взаимодействие пользователя с интерфейсом или иным продуктом. Под термином UI (user interface) обычно понимают экранные интерфейсы и их внешний вид. — Примеч. ред.

Возвращаясь к ранее высказанной мысли об абсурдности соревнования такого ресурса с «Википедией», прежде всего в сфере актуализации контента, скажу больше: «Википедия» может стать частью такого ресурса, может быть встроенной в его оболочку, не только предоставляя возможность моментального сравнения с ней «канонических» текстов, но и являясь иногда единственным источником актуальной информации. Взаимно дополняя друг друга, такой ресурс и «Википедия» будут только выигрывать. Кстати, в некоторых её статьях уже можно найти ссылки на Britannica.com, Большую Российскую и другие энциклопедии, а также на сайты, используемые для так называемого нормативного контроля.

Но вот что любопытно: несмотря на то что Основы государственной культурной политики⁴ориентированы на «формирование нравственной, ответственной, самостоятельно мыслящей творческой личности», некоторые нынешние энциклопедисты ex officio продолжают держать пользователей за безответственных идиотов, не способных разобраться в потоке информации, и настаивают на том, что лишь они в силах дать «достоверные знания», которые, конечно же, нельзя подвергать сомнению.

⁴. Утверждены Указом Президента РФ от 24 декабря 2014 г. № 808.

Предлагаемый мной компаративный подход отрицает истину в последней инстанции и позволяет читателю сделать выбор из разных источников, основываясь на собственном здравомыслии.

Итак, грамотно реализованный компаративный принцип подачи информации даст пользователям возможность анализировать в удобном интерфейсе всё богатство и разнообразие энциклопедической и словарной информации, научных, философских и идеологических подходов.

2. УНИКАЛЬНЫЙ КОНТЕНТ

Объём справочно-энциклопедического контента, созданного за многие годы, действительно поражает воображение. Если оставить в стороне вопросы идеологии, редакционного качества и реальной принадлежности к соответствующему жанру, библиографические запросы дают впечатляющие цифры: по ключевым словам «энциклопедия» и «словарь» находятся около 80 тыс. наименований. В справочном зале Российской государственной библиотеки хранится свыше 300 тыс. названий.

Интересны и другие, пока предварительные, результаты этих изысканий. В данных жанрах к общественному достоянию (public domain) можно отнести свыше 10 тыс. наименований. Около 17 тыс. по некоторым признакам (таким, как дата публикации, наличие в заглавии названий госучреждений, прямое указание на финансирование одним из государственных фондов поддержки науки и т.п.) можно предварительно отнести к категории контента, созданного за средства бюджетов разных уровней, что в условиях России и СССР вполне закономерно.

Естественно также задаться вопросом: почему государство не может организовать бесплатный и качественный доступ к этому контенту, на создание которого оно уже затратило немалые средства?

В каталогах продукции одного только издательства «Большая Российская энциклопедия», основанного в 1925 г. как АО «Советская энциклопедия», мы найдём свыше 1,5 тыс. изданий. Причём до 1974 г., когда учредили издательство «Русский язык», «Советская энциклопедия» была крупнейшим издателем-монополистом не только энциклопедий, но и переводных и толковых словарей, многие из которых не утратили своего значения, а некоторые (особенно экзотические языковые пары) вообще не переиздавались и стали библиографической редкостью.

Вот ещё немного занимательной статистики: на 184 энциклопедических издания (523 тома) Большой советской / Российской энциклопедии приходится 2 815 629 статей, т.е почти вдвое больше, чем в «Википедии»!

В постсоветские годы в России было создано свыше 800 уникальных региональных энциклопедий и энциклопедических словарей, хотя и разных по качеству, но отражающих местные реалии, исторические события, биографии региональных знаменитостей и др. Их так много онлайн и офлайн, что учётом этих изданий занимается специальный отдел Российской национальной библиотеки. Многие сайты сделаны давно и морально устарели, некоторые, хоть и более свежие, отражают «кустарный» вкус веб-дизайнеров; значительная часть региональных справочников недоступна в Сети.

Если копнуть глубже, то многие из справочных изданий и словарей, с учётом трудностей, возникающих при конвертации контента со старой орфографией и некоторыми иностранными языками (иероглифы, диакритика, арабская вязь и т.п.), так и не были качественно размещены в Сети.

Нужно ли извлекать «старьё» из сундуков? Многие специалисты, исходя из того что энциклопедии и словари существуют в определённом жизненном цикле и утрачивают свою актуальность в освещении фундаментальных вопросов довольно медленно, считают, что удобный доступ к таким ресурсам и возможность их цитировать крайне важны.

Несмотря на то что некоторые энциклопедии и словари в той или иной (очень широко понимаемой) электронной форме доступны на разных сайтах как на законном основании, так и с нарушением законов и «гуляют» в пережатых djvu-файлах по торрент-просторам, единой площадки, которая объединяла бы эти издания в удобном интерфейсе, а также служила бы притягательной креативной платформой для авторских коллективов, так пока и не существует.

3. ТЕХНОЛОГИИ

Все технологии должны служить одной большой цели — обеспечению удобного доступа к разнообразным справочно-энциклопедическим источникам. Или дополнять такое служение. Но никак не мешать ему и не отвлекать на себя внимание.

Остановлюсь здесь только на некоторых из технологий, которые, с точки зрения автора, должны быть доступны пользователям такого ресурса посредством различных сервисов.

Очевидно, что сайт должен обладать всем необходимым инструментарием для полноценной работы пользователя не только со структурированным контентом, но и с библиографией (ссылки на полнотекстовые первоисточники). Инструментарий должен включать сервисы научного цитирования, разметки текста для своих целей (highlighting), управления системой закладок на статьи, ведения заметок, историю чтения, возможности для слабовидящих, озвучивание текстов, генерирование пользовательских подборок материала в форме электронных изданий (ePub, PDF) и др.

До сих пор нет «опорного» ресурса, на котором каждое справочное издание было бы, с одной стороны, качественно адаптировано для Интернета (раскрытие сокращений, обусловленных ограничениями печатных изданий, система перекрестных ссылок (crossreference), охватывающая весь контент, уместное использование медиаконтента, который призван дополнять текст, а не мешать его восприятию, и др.), а с другой — имело бы связь с PDF- или image-версией издания, факсимильно отражающей его содержание.

Про искусственный интеллект писать отдельно не стану, всем ведь и так всё очевидно.

Что-то, наверное, забыл, поэтому отмечу одно, очень важное, качество: полный список возможностей необходимо формировать с участием специалистов ресурса и сообществ пользователей, вплоть до работы с фокус-группами и т.п. Функционал должен обладать динамичностью и обновляться по мере изменения потребностей пользователей.

Ресурс должен располагать user-friendly-платформой для совместной работы (краудсорсинга) и контроля качества при подготовке изданий к публикации. Было бы правильно, если бы научные и творческие коллективы, работающие над новыми энциклопедическими изданиями и словарями (а таких в России всё ещё немало), с пользой для себя и с удовольствием переносили работу на такую платформу.

4. СВЯЗЬ СТРУКТУРИРОВАННОГО И НЕСТРУКТУРИРОВАННОГО КОНТЕНТА

Говоря о необходимости выстраивания таких связей в мире гипертекста, необходимо отметить двойную роль справочно-энциклопедического контента:

· самостоятельная — с целью получения отдельной справки по тому или иному вопросу, короткой или более подробной;

· сервисная (обслуживающая другие издания, сайты и т.п.) — с целью получения справки (обычно короткой, в рамках дефиниции), помогающей ознакомиться с текстом (книги, журнала), который используется в данный момент.

Слово «энциклопедия» в его буквальном переводе с древнегреческого означает «обучение в полном круге». Налицо некая замкнутость знаний: Александр Павлович Горкин, прежний главред и директор Большой Российской энциклопедии, определил её как «полнота информации по данному критерию отбора материала». Эта замкнутость, существовавшая для печатных изданий, сейчас размыкается гипертекстом, и для электронной энциклопедии естественным продолжением являются гиперссылки на внешние источники.

Даже если сами внешние источники подобраны профессионально и со знанием дела, проблем с ними несколько: 1) отсутствие всех необходимых источников в Сети; 2) стабильность нахождения источников по данному адресу (permalink или PURL); 3) качество публикации источников.

***

Национальная электронная библиотека (НЭБ), которая по закону должна включать большую часть выходящих в нашей стране изданий и их ретроспективу (backlist), могла бы стать той экосистемой, которая после серьёзных структурных изменений сочетала бы в себе возможности для полноценной работы со справочным контентом, обеспечивая двусторонние связи: от статей — к расширению информации через книги, от книг — к получению вспомогательной информации из энциклопедических и словарных статей. Более того, в Положении о НЭБ написано про энциклопедическую систематизацию, осуществляемую «в целях получения пользователями справочной информации по заданному ими запросу». Но до реальной энциклопедизации НЭБ дело что-то пока не доходит, зато мы постоянно читаем о создании российского конкурента «Википедии»...


Рубрика: Инновационные технологии

Год: 2019

Месяц: Сентябрь

Теги: Михаил Васянин