LSID - индекс для привязки биологических БД

Вопросы общего характера по ГИС и дистанционному зондированию, не связанные с конкретным ПО.
bolotoved
Гуру
Сообщения: 920
Зарегистрирован: 30 дек 2008, 14:11
Репутация: 236
Откуда: Ханты-Мансийск
Контактная информация:

Re: LSID - индекс для привязки биологических БД

Сообщение bolotoved » 14 апр 2011, 17:50

Пока нашел способ (штатный) как преобразовать список латинских названий в таблицу с их систематическими атрибутами. Тоже неплохо, но там не возвращаются индексы.
Заходим вот сюда http://www.ubio.org/services/mapper/index2.php
В окошко копи/пастим наш список видов. Жмем submit.
В появившемся списке БД выбираем, где нашлось больше всего видов (например). Жмем. Получаем *.txt с нашими видами к которым приписалась систематическая часть от царства до вида и авторов.

Voltron
Гуру
Сообщения: 2627
Зарегистрирован: 29 мар 2007, 14:12
Репутация: 34
Откуда: Ukraine

Re: LSID - индекс для привязки биологических БД

Сообщение Voltron » 14 апр 2011, 18:21

ericsson писал(а):Voltron Не согласен. Помойка будет, а не рабочий каталог.
Бросание curl в C:\Windows, как вы прелагали в самом начале, даёт не менее красивую помойку :-)

bolotoved
Гуру
Сообщения: 920
Зарегистрирован: 30 дек 2008, 14:11
Репутация: 236
Откуда: Ханты-Мансийск
Контактная информация:

Re: LSID - индекс для привязки биологических БД

Сообщение bolotoved » 15 апр 2011, 04:22

Провел небольшое исследование с помощью scholar.google.com о количестве упоминаний биологических баз данных в околонаучной литературе. Цель -- понять какая из баз данных в настоящий момент живет наиболее активной жизнью. Табличка -- результат (не понял как сюда вставить табличку, по этому -- разделитель точка с запятой).
Первое число -- количество публикаций с упоминанием ресурса с 2010 года, вторая цифра -- количество упоминаний за весь период.

Биологические базы данных
Название;2010 год;Все время
Encyclopedia of Life;1120;14700
FishBase;774;5060
Global biodiversity information facility;381;2020
ZooBank;211;452
Species 2000;189;2630
Index Fungorum;154;738
International Plant Names Index;146;941
Integrated Taxonomic Information System;139;1320
Catalogue of Life;112;734
World Register of Marine Species;109;268
AmphibiaWeb;73;496
Index Kewensis;59;3540
AntWeb;43;271
European Nature Information System;43;303
USDA NRCS PLANTS Database;36;270
ARKiv.org;35;100
genomics.senescence.info;30;117
BioLib;27;475
nlbif;21;101
Universal Biological Indexer;6;62
organismnames.com;5;25
BioPedia;2;49
Bishop Museum Taxonomic Database;0;0

Биологические индексы
Life Science Identifiers;42;221
Global name index;10;15
Global Names Architecture;10;28
Taxonomic Serial Numbers;3;25

Какие-то сопряженные технические штуки:
BioPerl;318;2270
BioPython;143;695
BioSQL;18;130

---
Результаты:
1. Как видно из первой таблички, Universal Biological Indexer (uBio) из которого мы пытались дергать информацию, стоит фактически на последнем месте. Не удивительно ,что у них на сайте куча битых и неправильных ссылок. Видимо этот ресурс свое предназначение уже выполнил. Вторым открытием стала база данных FishBase. Удивительный сайт, который почти все время висит, но если уж вы на него попали, то... :D
2. На счет биологических индексов -- копаем в правильном направлении, нужны именно LSID. Кроме того, за последние 2 года стали появляться статьи о Global Names Architecture Global Names Index. Тоже надо вникнуть, что это.

Аватара пользователя
Mavka
Гуру
Сообщения: 2060
Зарегистрирован: 14 мар 2008, 17:36
Репутация: 9

Re: LSID - индекс для привязки биологических БД

Сообщение Mavka » 15 апр 2011, 09:10

bioDB.jpg
bioDB.jpg (46.35 КБ) 7574 просмотра
лангольеры под окном жрали время ом-ном-ном

bolotoved
Гуру
Сообщения: 920
Зарегистрирован: 30 дек 2008, 14:11
Репутация: 236
Откуда: Ханты-Мансийск
Контактная информация:

Re: LSID - индекс для привязки биологических БД

Сообщение bolotoved » 15 апр 2011, 10:46

Спасибо, так таблица лучше воспринимается, конечно.
Между перечисленными БД (особенно которые много цитируются) существует огромное количество связей. Настолько много, что мне видимо придется рисовать граф взаимосвязей ибо в голове не удержать, а в текстовом виде не наглядно :)
Дальнейших путей исследований видятся 2:
1) Изучение структуры информации имеющихся БД. В нашей стране этими базами только начинают пользоваться, по этому информации в русскоязычном секторе ничтожно мало.
2) Изучение принципов взаимосвязей между БД, и тут видимо нужно понять, что есть LSID и какова техника его использования.

bolotoved
Гуру
Сообщения: 920
Зарегистрирован: 30 дек 2008, 14:11
Репутация: 236
Откуда: Ханты-Мансийск
Контактная информация:

Re: LSID - индекс для привязки биологических БД

Сообщение bolotoved » 15 апр 2011, 22:02

Найден один из возможных путей получение ID для списка видов для привязки к базам данных uBio и NCBI
http://www.treebase.org/treebase-web/se ... earch.html
В окошке "Search Term" вгоняем наш список. Ставим крыжики "Text search" и "Taxom label".
Нам выдается список ссылок на наши виды через ID вышеозначенных БД. Например:
Из исходного списка видов

Anthus rubescens
Aquila chrysaetos


Получаем

http://www.ubio.org/browser/details.php ... ID=3850010
http://www.ubio.org/browser/details.php ... ID=2764166


Теперь нужно переходить на соответствующие страницы и черпать от туда необходимую атрибутику для нашего списка видов.
---
Правда, как я заметил в списки ссылок будут не только птицы, но и вирусы ими распространяемые :) Но лишнюю для нас информацию, можно будет в последующем отсеивать по систематическим атрибутам (царству организмов, например).

ericsson
Гуру
Сообщения: 3321
Зарегистрирован: 27 июл 2009, 19:26
Репутация: 748
Ваше звание: Вредитель полей

Re: LSID - индекс для привязки биологических БД

Сообщение ericsson » 27 апр 2011, 13:11

Занятный пример интеграции:
( http://www.flickr.com/groups/encyclopedia_of_life/ , http://www.catalogueoflife.org/ <- http://www.itis.gov/ ,
http://www.iucn.org/ ) -> http://www.eol.org/
для идентификации используются "машинные тэги", латинские названия, LSID и прочее.

bolotoved
Гуру
Сообщения: 920
Зарегистрирован: 30 дек 2008, 14:11
Репутация: 236
Откуда: Ханты-Мансийск
Контактная информация:

Re: LSID - индекс для привязки биологических БД

Сообщение bolotoved » 06 июн 2011, 16:16

bolotoved писал(а):Задача такая. Полагаю, что она может быть интересна не одному мне.
Есть некая БД в которой в качестве ключевого поля является поле "вид" с латинским названием растений, млеков, насекомых и т.д.
К этой БД нужно присоединить таблицу с систематическими атрибутами для этих видов: отряд, класс, семейство, род, альтернативные названия
А ларчик открывается кажется достаточно просто. И перспективы открываются фактически безбрежные. Смотрим вот сюда: http://www.catalogueoflife.org/services ... tions.html
Это база данных по всем видам известным на сегодняшний день (1 апреля 2011 года -- не шутят, надеюсь:) в формате текста с разделителями. 100 Мб всего-то :)
А это описание этой БД, что есть что: http://www.catalogueoflife.org/services ... tation.pdf

bolotoved
Гуру
Сообщения: 920
Зарегистрирован: 30 дек 2008, 14:11
Репутация: 236
Откуда: Ханты-Мансийск
Контактная информация:

Re: LSID - индекс для привязки биологических БД

Сообщение bolotoved » 06 июн 2011, 23:03

Да уж, база так компактизирована, не для средних умов... Даже простой запрос на выдачу бинарного латинского названия "род+вид" мне осуществить не удалось. А ведь вот оно лежит уже на блюдечке... :?

Ответить

Вернуться в «Общие вопросы»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 3 гостя