Оригінал статті – на офіційному сайті GBIF.org. Переклад та вступ Олега Прилуцького

“Ми маємо дані. Як підготувати їх до публікування в GBIF?” Це питання я чую від українських дослідників в контксті мобілізації даних з біорізноманіття чи не найчастіше. Аби відповісти на нього, спершу треба сформувати розуміння того, які типи даних в принципі підтримуються GBIF.org. Вашій уващі – переклад статті на цю тему з офіційного сайту GBIF (наразі доступна лише англійською), з незначними змінами і доповненнями, а також інфографіка від Антона Савченка (Університет Тарту, Естонія), покликана спростити визначення того, якому типові найбільше відповідають ваші дані.

Ми заохочуємо розпорядників даних публікувати якнайдетальніші відомості, щоб уможливити їхнє подальше використання у широкому спектрі досліджень, але не всі набори даних мають однаковий рівень деталізації. Ділитися максимумом доступних даних через платформу GBIF.org важливо, адже навіть часткова інформація може дати відповіді на важливі запитання.

Метадані

На базовому рівні, GBIF.org дає змогу установам створювати набори даних, що описують неоцифровані матеріали, такі як колекції природничих музеїв абощо. Решта три типи наборів даних також містять цю базову інформацію, але цей ‘лише-описовий’ тип даних дає дослідникам змогу дізнатися про дані, що поки не є оцифрованими й доступними онлайн. Також він допомагає оцінити відносну важливість колекцій та визначити пріоритети для майбутнього оцифровування. Як і у випадку з іншими типами даних, GBIF забезпечує кожному наборові метаданих унікальний цифровий ідентифікатор (DOI) для вістеження цитування цього ресурсу.

Переглянути набори метаданих

Таксономічні списки

Набори даних також можуть містити каталоги або списки назв організмів чи таксонів. Попри те, що вони можуть супроводжуватися додатковою інформацією, наприклад, назвами видів національними мовами або посиланнями на зразки, такі ‘чеклисти’ зазвичай надають таксономічні, географічні або тематичні відомості, чи навіть комбінацію зазначених. Наприклад, набір даних – каталог рідкісних молюсків Сейшелів – містить елементи таксономічного (тип Молюски), географічного (Сейшельські острови) та тематичного (види, що є об’єктом занепокоєння експертів МСОП) аспектів. Чеклисти являють собою загальні відомості або результати первинної інвентаризації таксонів у певному контексті.

Переглянути таксономічні списки
Шаблон архіва Darwin Core для таксономічних списків
Вимоги до якості даних таксономічних списків

Знахідки

Інші набори даних, що підтримуються GBIF.org, містять вичерпну інформацію про розташування окремих організмів у часі та просторі, тобто вони надають підтвердження факту знахідки виду (чи іншого таксону) у певному місці у визначену дату. Набори даних про знахідки складають ядро даних, опублікованих через GBIF.org; вони можуть варіювати від зразків та скам’янілостей у природничих колекціях, спостережень польових дослідників та натуралістів-любителів, до даних, зібраних із фотопасток або супутників дистанційного зондування.

Записи про знахідки в цих наборах даних іноді надають лише загальну інформацію про місцезнаходження, іноді просто вказують країну, але в багатьох випадках точні відомості про місцезнаходження та географічні координати уможливлюють детальний аналіз та картування поширення видів.

Переглянути набори даних знахідок
Шаблон архіва Darwin Core для наборів знахідок
Вимоги до якості даних наборів знахідок

Дані вибірок, описів та обліків

Набори даних іноді містять ще більше інформації, не лише повідомляючи про те, що вид виявили в певному місці в певну дату, але й даючи змогу оцінити склад угруповання у ширшому таксономічному контексті, або навіть простежити чисельність видів у різних місцях в різний час. Такі кількісні набори даних, або дані вибірок, як правило, створюються з використанням стандартизованих протоколів обліку та моніторингу біорізноманіття, таких як геоботанічні описи і трансекти, обліки птахів або відбір зразків води для вивчення гідробіонтів.

Посилаючись на методи, описуючи події збору даних та відносну чисельність видів, що потрапили до вибірки, такі набори даних уможливлюють порівняння з даними, зібраними за допомогою таких самих протоколів у різний час та місцях – в деяких випадках навіть даючи змогу дослідникам зробити висновки про відсутність конкретних видів на певних ділянках.

Огляд даних вибірок
Переглянути набори даних вибірок
Шаблон архіва Darwin Core для наборів даних вибірок
Вимоги до якості наборів даних вибірок