SPARQL на примерах Wikidata

Обсуждение материалов сайта: вопросы, замечания, предложения
Ответить
d1g
Интересующийся
Сообщения: 19
Зарегистрирован: 10 май 2016, 19:42
Репутация: 3

SPARQL на примерах Wikidata

Сообщение d1g » 07 ноя 2016, 21:20

SPARQL на примерах Wikidata

На мой взгляд, проект Wikidata предлагает более серьёзно задуматься о применении SPARQL в проектах.
Лично я - точно буду иногда изредка подсматривать "а что там есть в Wikidata сейчас".

Особенно это касается болевой точки всех традиционных реляционных и SQL решений про "что нам делать с несколькими значениями сразу".

Сколько я бы не хвалил OpenStreetMap, данных только в OpenStreetMap точно не хватает, а наличие в Wikidata ссылок на OSM объекты позволяет составлять более богатые запросы к объектам*.

* - к сожалению, Россию не хорошо редактировали в Wikidata и часть правильных запросов не вернёт правильные ответы (потому что данных нет просто).

Александр Мурый
Гуру
Сообщения: 5015
Зарегистрирован: 26 сен 2009, 16:26
Статьи: 3
Проекты: 5/1
Репутация: 707
Ваше звание: званий не имею
Откуда: Москва

Re: SPARQL на примерах Wikidata

Сообщение Александр Мурый » 07 ноя 2016, 22:19

Спасибо, интересная тема.
Вопросы:
  • Заметка про вашего мальчика называется "SPARQL на примерах Wikidata"; при этом определения SPARQL нет; гуглится за 3 сек., но всё же;
    общедоступный и публичный endpoint
  • Есть такое же определение, но по-русски? "Конечная точка"?
    Также можно отфильтровать результаты, используя поиск по "Moscow".
  • "поиск по "Moscow"" можно использовать в любых запросах? :)
  • Ждём ещё примеров, т.к. сказано во множественном числе - "примеры".
P.S. Немного подправил язык кое-где.
Редактор материалов, модератор форума

d1g
Интересующийся
Сообщения: 19
Зарегистрирован: 10 май 2016, 19:42
Репутация: 3

Re: SPARQL на примерах Wikidata

Сообщение d1g » 08 ноя 2016, 01:07

Ошибки поправил, остановился на 1 примере потому что залип полностью в этих запросах сам, столько данных в этой Викидата (в англоязычной), что не знаешь с какой стороны начать.
отразил в статьеПоказать
По сути, абсолютное большинство объектов в Wikidata можно свести либо к человеку, либо к городу либо к другому гео-объекту.

И у города и у человека (место пребывания или рождения или хоть смерти) есть координаты.

Получается что почти всё можно выразить географически, вопрос только как будет выглядеть "запрос".

В SQL это было бы нагромождение JOIN и знание первичные ключей.
В SPARQL 4-20 JOIN это вообще норма, причём первичные ключи как таковые не нужны.

Где-то 30 примеров уже было на https://www.wikidata.org/wiki/Wikidata: ... #Geography

К примеру, "Крупнейший город в каждой из стран".

Причём (если кто-то не смотрел 5минутное видео) в нижней части можно выбрать "Формат">"Карта" или Bar chart
Последний раз редактировалось d1g 10 ноя 2016, 16:13, всего редактировалось 1 раз.

d1g
Интересующийся
Сообщения: 19
Зарегистрирован: 10 май 2016, 19:42
Репутация: 3

до 4 экранов дописал

Сообщение d1g » 10 ноя 2016, 16:13

Пока остановлюсь (5 экранов, 25K) т.к. не хочется все редкие нюансы и каждую тривиальную вещь из SPARQL/Wikidata спецификации пересказывать.

Для большинства текущих данных в Wikidata, которые я смотрел за эти 3-4 дня, выбранной мной информации должно хватить.

Некоторая неупорядоченность изложения есть, т.к. там несколько не совсем связанных тем-вопросов рассматривается и с разными примерами.

Александр Мурый
Гуру
Сообщения: 5015
Зарегистрирован: 26 сен 2009, 16:26
Статьи: 3
Проекты: 5/1
Репутация: 707
Ваше звание: званий не имею
Откуда: Москва

Re: SPARQL на примерах Wikidata

Сообщение Александр Мурый » 22 ноя 2016, 16:18

В разделе "Географические свойства в Wikidata" есть такие строки:
Больше миллиона:
...
Более 100 тысяч, но менее миллиона:
...
Редкие, менее 10000:
Они к чему относятся?
Редактор материалов, модератор форума

d1g
Интересующийся
Сообщения: 19
Зарегистрирован: 10 май 2016, 19:42
Репутация: 3

Re: SPARQL на примерах Wikidata

Сообщение d1g » 26 ноя 2016, 13:16

Александр Мурый писал(а):
Больше миллиона:
...
Редкие
Они к чему относятся?
Это связано с ссылкой чуть выше "Отчёт количества объектов по каждому свойств". Изменил её на "Отчёт количества использований каждого свойства".

Какие свойства популярные, а какие - нет (или редкие или незаполненные).

Есть две особенности свойств, которые мешают называть эту метрику кроме как "популярность свойства":
  • У одного объекта, одно и то же свойство может быть использовано несколько раз
  • Свойство может использоваться в качестве Квалификатора, причём несколько раз

Ответить

Вернуться в «Материалы сайта»