Из Интернета исчезли более 2 миллионов научных работ

Исследование более чем семи миллионов цифровых публикаций в интернете показало, что более четверти научных статей должным образом не архивируются и не сохраняются, пишет научный журнал Nature. Результаты, опубликованные в журнале библиотечного дела и научных коммуникаций 24 января 2024 года, указывают на то, что системы сохранения документов в режиме онлайн не успевают за ростом результатов исследований.

d41586 024 00616 5 26802102
Исследование выявило более двух миллионов статей, которые не появились в крупном цифровом архиве, несмотря на наличие активного DOI. Фото: Anna Berkut/Alamy

«Вся наша эпистемология науки и исследований опирается на цепочку сносок», — объясняет автор Мартин Ив, исследователь литературы, технологий и издательского дела в Биркбеке, Лондонский университет. «И если вы не можете проверить то, что сказал кто-то другой в какой-то другой момент, вы просто доверяете слепой вере в артефакты, которые вы больше не можете прочитать сами».

Выборка DOI, включенная в исследование, была составлена из случайной выборки до 1000 зарегистрированных в каждой организации-участнице. Двадцать восемь процентов этих работ — более двух миллионов статей — не появились в крупном цифровом архиве, несмотря на наличие активного DOI. Только 58% работ, на которые ссылаются DOI, хранились по крайней мере в одном архиве. Остальные 14% были исключены из исследования, поскольку они были опубликованы слишком недавно, не были журнальными статьями или не имели идентифицируемого источника.

Специалисты по сохранению приветствовали этот анализ. «Было трудно оценить реальные масштабы проблемы сохранения цифровых данных, с которой сталкиваются электронные журналы», — говорит Уильям Килбрайд, управляющий директор Коалиции по сохранению цифровых данных со штаб-квартирой в Йорке, Великобритания. «Многие люди слепо полагают, что если у вас есть DOI, то он там навсегда», — говорит Микаэль Лааксо, изучающий научные публикации в Школе экономики Ханкена в Хельсинки. «Но это не значит, что ссылка будет работать всегда».

В 2021 году Лааксо и его коллеги сообщили, что более 170 журналов открытого доступа исчезли из Интернета в период с 2000 по 2019 год.

Кейт Виттенберг, управляющий директор службы цифрового архивирования Portico в Нью-Йорке, предупреждает, что небольшие издательства подвергаются большему риску не сохранить статьи, чем крупные. «Сохранение контента стоит денег», — говорит она, добавляя, что архивирование требует инфраструктуры, технологий и экспертных знаний, к которым многие небольшие организации не имеют доступа.

Исследование Eve предлагает некоторые меры, которые могли бы улучшить сохранность цифровых данных, включая ужесточение требований в агентствах регистрации DOI и улучшение образования и осведомленности об этой проблеме среди издателей и исследователей.

«Все думают о немедленной выгоде, которую они могли бы получить от публикации статьи где-нибудь, но нам действительно следует думать о долгосрочной устойчивости исследовательской экосистемы», — говорит Ева. «После того, как вы будете мертвы в течение 100 лет, смогут ли люди получить доступ к вещам, над которыми вы работали?»

Поделитесь с друзьями!