Открытая наука как драйвер развития научно-исследовательской деятельности

Открытая наука описывает прозрачную практику проведения научных исследований и делает результаты этих исследований доступными для всех [1], но до сих пор она вызывает множество споров в научной среде: ученые опасаются открывать данные своих исследований, несмотря на множество преимуществ, которые при этом появляются.

Рассмотрим шесть общепринятых столпов открытой науки: открытые данные, открытый доступ, открытая методика исследования, открытый исходный код, открытая экспертная оценка и открытое образование [2].

Открытые данные


Открытые данные — это процесс публикации как необработанных, так и обработанных данных вместе с метаданными научных экспериментов, что позволяет другим ученым без ограничений анализировать их. Такие данные гораздо эффективнее, чем опубликованные результаты, поскольку приводят к новым исследованиям и новым открытиям [3]. В этом случае в отдельных научных областях именно данные необходимо рассматривать как основную публикацию научных достижений. Очевидно, что данные принадлежат не конкретному ученому, а заказчику исследований и в случае государственных грантов должны публиковаться для налогоплательщиков в открытом доступе.

В реальности все не так гладко. Например, как показал анализ работ научных сообществ по тематике COVID-19, только 9% статей содержали приложения с исходными данными [4]. Многие научные журналы требуют от ученых публиковать вместе со статьями заявление о доступности данных, DAS (Data availability statement). Оно включает или ссылку на открытые опубликованные данные, или объявление о доступности данных по запросу. Группа исследователей провела анализ того, как такие заявления публиковались в ряде медицинских журналов. Из 3556 проанализированных статей 3416 содержали DAS. Наиболее часто встречающаяся категория DAS (42%) указывает на то, что наборы данных доступны по обоснованному запросу. Среди 1792 статей, в которых авторы готовы поделиться своими данными, 1670 (93%) авторов либо не ответили, либо отказались поделиться. Из 1792 авторов 254 (14%), ответивших на запрос об обмене данными, только 122 (6,8%) предоставили запрошенные данные [5].

Из положительных международных примеров можно отметить Papers With Code [6], проект с базой из более чем 41 тысячи научных статей по машинному обучению, 3200+ наборов данных, используемых в этих статьях. Внутри проекта есть также подпроекты, посвященные компьютерным наукам, физике, математике, статистике и астрономии.

Как видим, нельзя декларативно изменить мышление ученых, добавив дополнительные требования к публикации. Требуется смена протокола проведения экспериментов, которая закладывается, начиная с младших курсов вуза [7].

Открытый доступ


Открытый доступ — это модель, в соответствии с которой результаты исследований доступны для чтения на основе открытой лицензии любому без необходимости оплачивать доступ.

Издательство, являясь организатором публикации статьи, приобретает монопольные права на ее публикацию, в результате чего получает все доходы и препятствует ее дальнейшему распространению, но, тем не менее, не привносит в публикацию дополнительной ценности. Что может привнести журнал? Например, обеспечить повторный запуск вычислений в браузере с помощью блокнотов Jupyter Lab или с использованием виртуальной машины [8].

Открытая методика


Открытая методика — это обычная методика исследования, описанная достаточно подробно, чтобы позволить другим ученым повторить работу и применить ее в новых научных разработках.

Публикация методики тесно связана с понятием воспроизводимости, то есть способностью получить аналогичный результат, используя тот же набор данных. Это достаточно серьезная проблема в мире.

Отметим несколько фактов. Группа исследователей запустила проект по точному повторению ранних, но значимых лабораторных экспериментов по изучению рака. Они воссоздали 50 экспериментов, которые закладывают основу для новых лекарств от рака: около половины научных утверждений не подтвердились [9]. Более 70% исследователей пытались и не смогли воспроизвести эксперименты другого ученого, и более половины не смогли воспроизвести свои собственные эксперименты [10].

Одна из причин кризиса воспроизводимости научных результатов в том, что исследователи теряют уважение, если их результаты не выдерживают критики, поэтому они не заинтересованы в открытой проверке своих публикаций.

Открытый исходный код


Открытый исходный код обычно относится к свободному и бесплатному доступу к программному продукту. Существуют сотни различных лицензий на программное обеспечение с открытым исходным кодом [11]. Программное обеспечение можно отнести к методике исследования, рассмотренной ранее.

Самописное программное обеспечение часто приводит к ошибкам в исследованиях, так как его разработчики, как правило, не являются профессиональными программистами [12, 13], поэтому открытое программное обеспечение позволяет совместно работать над качеством программных продуктов.

Примером подобных открытых программных библиотек являются PsychoPy [14] и NumPy [15], написанные учеными и для ученых. PsychoPy — это приложение для проведения экспериментов в бихевиористских науках (психология, неврология, лингвистика и т. д.). Проект PsychoPy начался в 2002 году как Python библиотека для проведения экспериментов по визуальной нейробиологии в лаборатории Джонатана Пирса. На сегодняшний день число скачиваний PsychoPy превышает 20 тысяч в год.

NumPy — это основная библиотека для многомерных массивов в языке Python. Она играет важную роль в процессах анализа данных в таких областях, как физика, химия, астрономия, геонауки, биология, психология, материаловедение, инженерия, финансы и экономика.

Подобных открытых научных библиотек тысячи и их число продолжает расти. В последние десятилетия формируется самостоятельная экономика вокруг открытого программного обеспечения, это подробно описано в [16, 17, 18, 19, 20].

Использование в вузах открытого программного обеспечения позволяет приучать учащихся к совместной работе над открытыми научными проектами. Важным шагом к открытой науке является публикация в свободном доступе результатов курсовых и выпускных работ, что позволяет использовать результаты исследований другим авторам, а также формировать репутацию учащихся и учебного заведения.

Открытое рецензирование


Открытое рецензирование связано с преобразованием процесса анализа и оценки результатов исследований, чтобы сделать его совместным взаимодействием между авторами и рецензентами с целью помочь ученым публиковаться [21].

Открытое образование


Открытое образование означает открытый и бесплатный доступ к образовательным ресурсам. Можно брать плату за обучение, но материалы, которые используются, предоставляются бесплатно.

Примером такого ресурса является Programming Historian [22]. Из небольшого руководства он превратился в образовательный проект, помогающий историкам работать с цифровыми архивами с помощью методов программирования. Вся теория и задания в проекте опубликованы в открытом доступе. Также стоит отметить открытые учебники по статистике и программированию профессора Аллена Б. Дауни [23].

Подводя итог, хочется подчеркнуть, что открытая наука — это прогрессивное движение развития научно-исследовательской деятельности, именно за такой наукой будущее. Переход к открытой науке предполагает освоение учеными как цифровых инструментов, так и новой культуры исследований.

telegram Обсудить публикацию в [Telegram-канале]

Литература


  1. Open science is a research accelerator [Электронный ресурс]. URL (дата обращения: 13.06.2022)
  2. When will «open science» become simply «science»? [Электронный ресурс]. URL (дата обращения: 13.06.2022)
  3. The FAIR Guiding Principles for scientific data management and stewardship [Электронный ресурс]. URL (дата обращения: 13.06.2022)
  4. Grove J. Data sharing on COVID-19 research «disappointing», says EU chief // Times Higher Education [Электронный ресурс]. URL (дата обращения: 09.06.2022)
  5. Many researchers were not compliant with their published data sharing statement: mixed-methods study [Электронный ресурс]. URL (дата обращения: 09.06.2022)
  6. Papers with Code [Электронный ресурс]. URL (дата обращения: 13.06.2022)
  7. Opinionated practices for teaching reproducibility: motivation, guided instruction and practice [Электронный ресурс]. URL (дата обращения: 13.06.2022)
  8. How journals could «add value» [Электронный ресурс]. URL (дата обращения: 13.06.2022)
  9. Study can't confirm lab results for many cancer experiments [Электронный ресурс]. URL (дата обращения: 13.06.2022)
  10. 1,500 scientists lift the lid on reproducibility [Электронный ресурс]. URL (дата обращения: 13.06.2022)
  11. Руководство по открытому программному обеспечению [Электронный ресурс]. URL (дата обращения: 11.06.2022)
  12. A Scientist's Nightmare: Software Problem Leads to Five Retractions [Электронный ресурс]. URL (дата обращения: 13.06.2022)
  13. Computational science: ...Error [Электронный ресурс]. URL (дата обращения: 13.06.2022)
  14. PsychoPy2: Experiments in behavior made easy [Электронный ресурс]. URL (дата обращения: 11.06.2022)
  15. Array programming with NumPy [Электронный ресурс]. URL (дата обращения: 13.06.2022)
  16. Publish your computer code: it is good enough [Электронный ресурс]. URL (дата обращения: 13.06.2022)
  17. The case for open computer programs [Электронный ресурс]. URL (дата обращения: 13.06.2022)
  18. Opening practice: supporting reproducibility and critical spatial data science [Электронный ресурс]. URL (дата обращения: 13.06.2022)
  19. Economic savings for scientific free and open source technology: A review [Электронный ресурс]. URL (дата обращения: 13.06.2022)
  20. The Simple Economics of Open Source [Электронный ресурс]. URL (дата обращения: 13.06.2022)
  21. Why anonymous peer review is bad for science [Электронный ресурс]. URL (дата обращения: 13.06.2022)
  22. The Programming Historian [Электронный ресурс]. URL (дата обращения: 13.06.2022)
  23. Data Structures and Information Retrieval in Python [Электронный ресурс]. URL (дата обращения: 12.06.2022)

Авторы:


Федоров Д.Ю., Сущева Н.В. Открытая наука как драйвер развития научно-исследовательской деятельности // Материалы V Национальной научно-методической конференции с международным участием "Архитектура университетского образования", СПб, 2022.