LSID - индекс для привязки биологических БД
-
- Гуру
- Сообщения: 920
- Зарегистрирован: 30 дек 2008, 14:11
- Репутация: 236
- Откуда: Ханты-Мансийск
- Контактная информация:
Re: LSID - индекс для привязки биологических БД
Пока нашел способ (штатный) как преобразовать список латинских названий в таблицу с их систематическими атрибутами. Тоже неплохо, но там не возвращаются индексы.
Заходим вот сюда http://www.ubio.org/services/mapper/index2.php
В окошко копи/пастим наш список видов. Жмем submit.
В появившемся списке БД выбираем, где нашлось больше всего видов (например). Жмем. Получаем *.txt с нашими видами к которым приписалась систематическая часть от царства до вида и авторов.
Заходим вот сюда http://www.ubio.org/services/mapper/index2.php
В окошко копи/пастим наш список видов. Жмем submit.
В появившемся списке БД выбираем, где нашлось больше всего видов (например). Жмем. Получаем *.txt с нашими видами к которым приписалась систематическая часть от царства до вида и авторов.
-
- Гуру
- Сообщения: 2627
- Зарегистрирован: 29 мар 2007, 14:12
- Репутация: 34
- Откуда: Ukraine
Re: LSID - индекс для привязки биологических БД
Бросание curl в C:\Windows, как вы прелагали в самом начале, даёт не менее красивую помойкуericsson писал(а):Voltron Не согласен. Помойка будет, а не рабочий каталог.

-
- Гуру
- Сообщения: 920
- Зарегистрирован: 30 дек 2008, 14:11
- Репутация: 236
- Откуда: Ханты-Мансийск
- Контактная информация:
Re: LSID - индекс для привязки биологических БД
Провел небольшое исследование с помощью scholar.google.com о количестве упоминаний биологических баз данных в околонаучной литературе. Цель -- понять какая из баз данных в настоящий момент живет наиболее активной жизнью. Табличка -- результат (не понял как сюда вставить табличку, по этому -- разделитель точка с запятой).
Первое число -- количество публикаций с упоминанием ресурса с 2010 года, вторая цифра -- количество упоминаний за весь период.
Биологические базы данных
Название;2010 год;Все время
Encyclopedia of Life;1120;14700
FishBase;774;5060
Global biodiversity information facility;381;2020
ZooBank;211;452
Species 2000;189;2630
Index Fungorum;154;738
International Plant Names Index;146;941
Integrated Taxonomic Information System;139;1320
Catalogue of Life;112;734
World Register of Marine Species;109;268
AmphibiaWeb;73;496
Index Kewensis;59;3540
AntWeb;43;271
European Nature Information System;43;303
USDA NRCS PLANTS Database;36;270
ARKiv.org;35;100
genomics.senescence.info;30;117
BioLib;27;475
nlbif;21;101
Universal Biological Indexer;6;62
organismnames.com;5;25
BioPedia;2;49
Bishop Museum Taxonomic Database;0;0
Биологические индексы
Life Science Identifiers;42;221
Global name index;10;15
Global Names Architecture;10;28
Taxonomic Serial Numbers;3;25
Какие-то сопряженные технические штуки:
BioPerl;318;2270
BioPython;143;695
BioSQL;18;130
---
Результаты:
1. Как видно из первой таблички, Universal Biological Indexer (uBio) из которого мы пытались дергать информацию, стоит фактически на последнем месте. Не удивительно ,что у них на сайте куча битых и неправильных ссылок. Видимо этот ресурс свое предназначение уже выполнил. Вторым открытием стала база данных FishBase. Удивительный сайт, который почти все время висит, но если уж вы на него попали, то...
2. На счет биологических индексов -- копаем в правильном направлении, нужны именно LSID. Кроме того, за последние 2 года стали появляться статьи о Global Names Architecture Global Names Index. Тоже надо вникнуть, что это.
Первое число -- количество публикаций с упоминанием ресурса с 2010 года, вторая цифра -- количество упоминаний за весь период.
Биологические базы данных
Название;2010 год;Все время
Encyclopedia of Life;1120;14700
FishBase;774;5060
Global biodiversity information facility;381;2020
ZooBank;211;452
Species 2000;189;2630
Index Fungorum;154;738
International Plant Names Index;146;941
Integrated Taxonomic Information System;139;1320
Catalogue of Life;112;734
World Register of Marine Species;109;268
AmphibiaWeb;73;496
Index Kewensis;59;3540
AntWeb;43;271
European Nature Information System;43;303
USDA NRCS PLANTS Database;36;270
ARKiv.org;35;100
genomics.senescence.info;30;117
BioLib;27;475
nlbif;21;101
Universal Biological Indexer;6;62
organismnames.com;5;25
BioPedia;2;49
Bishop Museum Taxonomic Database;0;0
Биологические индексы
Life Science Identifiers;42;221
Global name index;10;15
Global Names Architecture;10;28
Taxonomic Serial Numbers;3;25
Какие-то сопряженные технические штуки:
BioPerl;318;2270
BioPython;143;695
BioSQL;18;130
---
Результаты:
1. Как видно из первой таблички, Universal Biological Indexer (uBio) из которого мы пытались дергать информацию, стоит фактически на последнем месте. Не удивительно ,что у них на сайте куча битых и неправильных ссылок. Видимо этот ресурс свое предназначение уже выполнил. Вторым открытием стала база данных FishBase. Удивительный сайт, который почти все время висит, но если уж вы на него попали, то...

2. На счет биологических индексов -- копаем в правильном направлении, нужны именно LSID. Кроме того, за последние 2 года стали появляться статьи о Global Names Architecture Global Names Index. Тоже надо вникнуть, что это.
- Mavka
- Гуру
- Сообщения: 2060
- Зарегистрирован: 14 мар 2008, 17:36
- Репутация: 9
-
- Гуру
- Сообщения: 920
- Зарегистрирован: 30 дек 2008, 14:11
- Репутация: 236
- Откуда: Ханты-Мансийск
- Контактная информация:
Re: LSID - индекс для привязки биологических БД
Спасибо, так таблица лучше воспринимается, конечно.
Между перечисленными БД (особенно которые много цитируются) существует огромное количество связей. Настолько много, что мне видимо придется рисовать граф взаимосвязей ибо в голове не удержать, а в текстовом виде не наглядно
Дальнейших путей исследований видятся 2:
1) Изучение структуры информации имеющихся БД. В нашей стране этими базами только начинают пользоваться, по этому информации в русскоязычном секторе ничтожно мало.
2) Изучение принципов взаимосвязей между БД, и тут видимо нужно понять, что есть LSID и какова техника его использования.
Между перечисленными БД (особенно которые много цитируются) существует огромное количество связей. Настолько много, что мне видимо придется рисовать граф взаимосвязей ибо в голове не удержать, а в текстовом виде не наглядно

Дальнейших путей исследований видятся 2:
1) Изучение структуры информации имеющихся БД. В нашей стране этими базами только начинают пользоваться, по этому информации в русскоязычном секторе ничтожно мало.
2) Изучение принципов взаимосвязей между БД, и тут видимо нужно понять, что есть LSID и какова техника его использования.
-
- Гуру
- Сообщения: 920
- Зарегистрирован: 30 дек 2008, 14:11
- Репутация: 236
- Откуда: Ханты-Мансийск
- Контактная информация:
Re: LSID - индекс для привязки биологических БД
Найден один из возможных путей получение ID для списка видов для привязки к базам данных uBio и NCBI
http://www.treebase.org/treebase-web/se ... earch.html
В окошке "Search Term" вгоняем наш список. Ставим крыжики "Text search" и "Taxom label".
Нам выдается список ссылок на наши виды через ID вышеозначенных БД. Например:
Из исходного списка видов
Anthus rubescens
Aquila chrysaetos
Получаем
http://www.ubio.org/browser/details.php ... ID=3850010
http://www.ubio.org/browser/details.php ... ID=2764166
Теперь нужно переходить на соответствующие страницы и черпать от туда необходимую атрибутику для нашего списка видов.
---
Правда, как я заметил в списки ссылок будут не только птицы, но и вирусы ими распространяемые
Но лишнюю для нас информацию, можно будет в последующем отсеивать по систематическим атрибутам (царству организмов, например).
http://www.treebase.org/treebase-web/se ... earch.html
В окошке "Search Term" вгоняем наш список. Ставим крыжики "Text search" и "Taxom label".
Нам выдается список ссылок на наши виды через ID вышеозначенных БД. Например:
Из исходного списка видов
Anthus rubescens
Aquila chrysaetos
Получаем
http://www.ubio.org/browser/details.php ... ID=3850010
http://www.ubio.org/browser/details.php ... ID=2764166
Теперь нужно переходить на соответствующие страницы и черпать от туда необходимую атрибутику для нашего списка видов.
---
Правда, как я заметил в списки ссылок будут не только птицы, но и вирусы ими распространяемые

-
- Гуру
- Сообщения: 3321
- Зарегистрирован: 27 июл 2009, 19:26
- Репутация: 748
- Ваше звание: Вредитель полей
Re: LSID - индекс для привязки биологических БД
Занятный пример интеграции:
( http://www.flickr.com/groups/encyclopedia_of_life/ , http://www.catalogueoflife.org/ <- http://www.itis.gov/ ,
http://www.iucn.org/ ) -> http://www.eol.org/
для идентификации используются "машинные тэги", латинские названия, LSID и прочее.
( http://www.flickr.com/groups/encyclopedia_of_life/ , http://www.catalogueoflife.org/ <- http://www.itis.gov/ ,
http://www.iucn.org/ ) -> http://www.eol.org/
для идентификации используются "машинные тэги", латинские названия, LSID и прочее.
-
- Гуру
- Сообщения: 920
- Зарегистрирован: 30 дек 2008, 14:11
- Репутация: 236
- Откуда: Ханты-Мансийск
- Контактная информация:
Re: LSID - индекс для привязки биологических БД
А ларчик открывается кажется достаточно просто. И перспективы открываются фактически безбрежные. Смотрим вот сюда: http://www.catalogueoflife.org/services ... tions.htmlbolotoved писал(а):Задача такая. Полагаю, что она может быть интересна не одному мне.
Есть некая БД в которой в качестве ключевого поля является поле "вид" с латинским названием растений, млеков, насекомых и т.д.
К этой БД нужно присоединить таблицу с систематическими атрибутами для этих видов: отряд, класс, семейство, род, альтернативные названия
Это база данных по всем видам известным на сегодняшний день (1 апреля 2011 года -- не шутят, надеюсь:) в формате текста с разделителями. 100 Мб всего-то

А это описание этой БД, что есть что: http://www.catalogueoflife.org/services ... tation.pdf
-
- Гуру
- Сообщения: 920
- Зарегистрирован: 30 дек 2008, 14:11
- Репутация: 236
- Откуда: Ханты-Мансийск
- Контактная информация:
Re: LSID - индекс для привязки биологических БД
Да уж, база так компактизирована, не для средних умов... Даже простой запрос на выдачу бинарного латинского названия "род+вид" мне осуществить не удалось. А ведь вот оно лежит уже на блюдечке... 

Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 3 гостя