GIS-LAB

Географические информационные системы и дистанционное зондирование

Принципы открытых научных данных

Максим Дубинин, 20.06.2010

Не смотря на то, что наука часто используется как пример среды, где данные должны быть открыты, чтобы среда могла эффективно работать, открытость научных данных, к сожалению, часто оставляет желать лучшего. Основопологающие принципы, определяющие что же такое “открытые данные” в науке только начинали появляться сравнительно недавно.

Публикуем перевод принципов открытых научных данных, т.н. Panton Principles (источник). Документ очень несовершенный.

Наука построена на последовательном развитии, повторном использовании и открытой критике публикуемых научных знаний.

Для эффективного функционирования науки и получения максимальной прибыли от нее обществом важно, чтобы научные данные были открытыми.

Под открытыми научными данными мы понимаем данные свободно доступные через интернет, разрешенные для  скачивания, копирования, анализа, обработки и переобработки и не имеющие финансовых, законодательных или технических препятствий кроме тех, которые невозможно отделить от доступа к самой сети интернет. Данные публикуемых научных исследований должны явным образом представлять собой общественное достояние.

С формальной точки зрения, мы рекомендуем руководствоваться следующими принципами:

  1. Данные и коллекции данных должны публиковаться с четким указанием пожеланий авторов с учетом возможности повторного использования со старыми и новыми целями индивидуальных составляющих набора данных, его частей или набора целиком. Это указание должно быть точным, необратимым и основанным на подходящем и узнаваемом законном положении в форме освобождения от обязательств или лицензии. При публикации данных нужно четкое указание требований.
  2. Многие широкораспространенные лицензии не предназначены и не подходят для данных или коллекций данных. Различные лицензии и освобождения от обязательств созданные и подходящие для данных описаны здесь. Лицензии Creative Commons (кроме CCZero), GFDL, GPL, BSD, и т.п. НЕ подходят для данных и их использование не рекомендуется. ?спользуйте узнаваемую лицензию или освобождение от обязательств (waiver) которое подходит для данных.
  3. ?спользование лицензий ограничивающих коммерческое использование данных или ограничивающих использование для некоторых типов деятельности или некоторыми людьми и организациями настоятельно не рекомендуется. Эти лицензии делают невозможным эффективную интеграцию и использование этих наборов данных и предотвращают коммерческую деятельность, которая может быть направлена на развитие этих данных. Если вы хотите, чтобы ваши данные использовались и развивались другими, они должны быть открыты, т.е. сооответствовать Определению открытой информации/данных – в особенности, не должны присутствовать некоммерческие и другие ограничения.
  4. Далее, в науке настоятельно рекомендуется, что данные, особенно созданные на деньги налогоплательщков, должны быть размещены в общественном достоянии используя Public Domain Dedication and Licence или лицензию Creative Commons Zero. This is in keeping with the public funding of much scientific research and the general ethos of sharing and re-use within the scientific community. Явное размещение данных стоящих за публикуемой наукой в общественном достоянии через PDDL или CCZero рекомендуется и обеспечивает соответствие и с Протоколом по введению данных с открытым доступом (Protocol for Implementing Open Access Data) Science Commons и с Определением открытой информации/данных.

Авторы:

Peter Murray-Rust, University of Cambridge (UK)
Cameron Neylon, STFC (UK)
Rufus Pollock, Open Knowledge Foundation and University of Cambridge (UK)
John Wilbanks, Science Commons (USA)

При помощи членов Рабочей группы по открытым данным в науке (Working Group on Open Data in Science) Open Knowledge Foundation

Комментарии (6) к статье “Принципы открытых научных данных”

  1. magik says:

    То что данные должны быть открыты не вызывает сомнений, и это довольно давно поняли в NSF где условием всех грантов в нашей области является полное открытие данных через 2 года.

    • udav says:

      То, что данные в науке должны быть открыты, поняли более 2000 лет назад 🙂

    • sim says:

      К сожалению, условие открытости не означает, что данные открывают, особенно актуально это для второстепенных наборов данных. Это практика в той области, которую я более-менее знаю, включающей финансирование NSF, NASA, DOE и т.п. Журналы не требуют, авторы не считают нужным и т.д.

      Поэтому и появляются подобные декларации, одно дело говорить что данные в науке открыты, а самому бочком-бочком ничего не открывать (не требуют же!), а другое подписаться (http://pantonprinciples.org/endorse/), тут уже несколько другой спрос.

  2. […] This post was mentioned on Twitter by OA Tracking Project, GIS-Lab. GIS-Lab said: Блог: Принципы открытых научных данных http://gis-lab.info/blog/2010-06/panton-principles/ […]

  3. west0293 says:

    Спасибо! 🙂

Оставтьте комментарий к magik


(Геокруг)

Если Вы обнаружили на сайте ошибку, выберите фрагмент текста и нажмите Ctrl+Enter