Семантическая паутина мертва? Онтологии мертвы?
Я разрабатываю план работы для своей диссертации на тему «База знаний с помощью установленной онтологии для групп интересов вокруг водно-болотных угодий» . Я исследовал и разрабатывал онтологии для этого, но я все еще неясен во многих вещах. Какой язык моделирования для онтологий?
Какая методология для онтологий лучше? ОТК или МЕТОНТОЛОГИЯ ?
Есть ли программа, которая делает как делает
Cratilo - это программное обеспечение для анализа текстовых корпусов и для извлечения конкретных терминов из области обучения (оно разработано профессорами Хорхе Антонио Мехиа, Франсиско Хавьером Альваресом и Джоном Альбейру Санчесом, Институт философии Университета Антиокии). Позволяет проводить лексический анализ текстов, выявлять слова, которые встречаются по частоте и расположению в тексте. Через процесс распознавания Cratylus идентифицирует все слова в тексте и создает базу данных, становится черновиком анализа работы. Есть ли другие подобные инструменты?
Можно ли использовать термины, найденные Кратило, для создания базы знаний?
Какие существуют открытые семантические рамки, которые можно использовать для таких вещей?
Есть ли программное обеспечение, которое автоматически создает RDF, OWL и XML? Как работает Tails? Jena? Кунжутное?
источник
Ответы:
(Хотя я думаю, что ваш вопрос обычно не рассматривается как хороший вопрос для этого сайта, я думаю, что его следует сохранить, потому что почти все новички в этой области поначалу так же запутаны, и трудно найти прямую, трезвую и сбалансированную информацию об этом.)
Семантическая паутина мертва? Онтологии мертвы?
Многие люди отошли от Семантической паутины. С другой стороны, многие все еще используют его. Там всегда было много путаницы о том, где его ценность. Существуют варианты использования, которые действительно извлекают выгоду из семантических веб-технологий, но их довольно мало и они далеко друг от друга.
Связанные открытые данные
Вот почему частично было создано подполе «Связанные открытые данные». Связанные данные можно рассматривать как более прагматичную урезанную версию семантической паутины (или в качестве необходимого инструмента для более глубокого представления о семантической паутине).
Связанные данные, хотя и более прагматичны, но все еще используют онтологии. Просто не так сложно использовать OWL и сначала разрабатывать ваши онтологии, причем очень формально.
База знаний, такая как Freebase (сейчас заменяется Wikidata ), даже не основывается на технологиях семантической паутины (хотя она всегда была доступна и в виде дампов RDF). С другой стороны, даже Freebase основывается на концепциях, подобных тем, что существуют в семантической сети, и у него есть форма онтологий.
Программное обеспечение для генерации онтологий
Не существует программного обеспечения, которое бы автоматически создавало высококачественные онтологии для вас. По крайней мере, не в смысле OWL / логических онтологий первого порядка. С другой стороны, многие виды программного обеспечения, включая упомянутое вами Cratilo, могут помочь вам сделать более низкий шаг в семантическом спектре. например, глоссарий или даже фолксономию, которая впоследствии может быть преобразована в большую часть таксономии или онтологии. другие алгоритмы. Может даже существовать программное обеспечение для создания полноценных онтологий OWL, но я думаю, что это все еще довольно активная область исследований.
Онтологии и методологии
Как всегда, все зависит от ваших потребностей и целей. В таких областях, как биомедицина и науки о жизни в целом, они создают сложные формальные онтологии, потому что у них есть данные с очень разнообразной структурой, а онтологии помогают им организовывать и использовать вещи. Напротив, интернет-магазину может быть лучше придерживаться нормального моделирования реляционных баз данных и добавлять только глобальные идентификаторы (URI) в духе связанных данных, если они хотят построить правильный граф знаний позже.
Даже если вам нужны онтологии, вы можете сначала пропустить методологии. Особенно, если вы действительно новичок в этой области и мало знаете о своих потребностях.
Йена, Сезам, ...
Jena, Sesame, Virtuoso и т. Д. Являются триплетами - они используются для хранения и запроса RDF. Большинство онтологий могут быть представлены в RDF. Даже те, которые написаны на OWL. RDF имеет семантическую часть, RDF / S, которая позволяет сформулировать некоторые базовые онтологии. Этого вполне может быть достаточно для начала. Даже RDF / S могут запутаться и запутаться, когда вы начнете думать о пустых узлах, именованных графах (они фиксированы? Они динамические?) И т. Д.
Хотя я думаю, что ваш вопрос обычно не считается хорошим вопросом для этого сайта, я думаю, что он должен быть сохранен, потому что почти все новички в этой области поначалу смущены подобным образом, и трудно найти прямую, трезвую и сбалансированную информацию о Это.
источник
В вашем посте слишком много слишком общих проблем.
Сейчас мы определенно находимся в летней эре искусственного интеллекта (в отличие от зимнего искусственного интеллекта ), и исследованию семантической паутины уделяется меньше внимания.
Тем не менее, есть много проектов, связанных с построением онтологий. Google имеет Knowledge Graph и знаний Vault . Оба из них используют Freebase (среди других источников).
Есть десятки ссылок, которые я могу дать вам, чтобы ответить на некоторые ваши вопросы, но лучшее, что вы можете сделать, это просмотреть страницы W3C Semantic Web .
Взгляните на RDF, SPARQL, OWL, Virtuoso, Protege - это стандарты де-факто.
С точки зрения извлечения онтологий из текстовых корпусов - существуют различные инструменты. Ни один из них не идеален, поэтому вам действительно нужно провести какое-то исследование и найти то, что соответствует вашим потребностям. Например, есть OntoLearn Reloaded (этот документ является относительно новым, поэтому вы можете просмотреть библиографию, чтобы найти другие подходы).
источник
Существует также академический проект DBPedia , RDF-версия подмножества Википедии.
По данным поисковой системы Alexa, которая ранжирует веб-сайты в соответствии с их популярностью в Интернете, она входит в число 100 000 лучших веб-сайтов - неплохо, не совсем неактуально.
Общий интерес к сайту DBpedia.org в период 2015–2016 гг., По-видимому, был довольно постоянным. Смотрите скриншот.
Другие подобные сайты (по данным Alexa) гораздо менее популярны.
Так что я бы сказал, что Semantic Web Acceptance не умер, просто пахнет смешно.
источник