Материал из Semantic Future




Скачать 425,08 Kb.
НазваниеМатериал из Semantic Future
страница1/4
Дата публикации13.04.2013
Размер425,08 Kb.
ТипДокументы
pochit.ru > Философия > Документы
  1   2   3   4
http://semanticfuture.net/

Категория:Онтологии

Материал из Semantic Future

Ключевое звено любой семантически-ориентированной системы - семантика предметной области, т.е. смысл тех категорий, в которых мы описываем предметную область для системы. В жёстко структурированных моделях данных, таких как реляционная модель, семантика закладывается в схему базы данных: мы даем имя полю таблицы базы данных, хотя бы отчасти отражающих смысл значений в этом поле.

Однако, ставить знак равенства между схемой базы данных и онтологией, между XML DTD (или XML Schema) и онтологией неверно. Почему? Те, кто знаком с философскими категориями, наверняка вспомнят, что онтология - это, буквально, учение о бытии (ontos + logos)- о том, как устроен мир, какова его структура, каковы и насколько сильны слабы взаимодействия между элементами этого мира.

Однако, в середине 80х гг. XX века происходит переоткрытие понятия "онтология". Отчасти это случилось в связи с нашумевшим тогда проектом CYC - проектом создания базы так называемых "общеизвестных" знаний (common sense knowledge). Оказалось, что многие "кусочки" знаний, закодированные в CYC, имеют универсальное значение и одинаково воспринимаются разными людьми и сообществами. Так появилось понимание того факта, что взаимодействие разных исследовательских сообществ невозможно без наличия "слоя-посредника". В таком "слое-посреднике" должен определяться словарь некой предметной области - те термины, которые используют все исследователи в этой области. Таким посредником и выступили онтологии предметных областей (domain ontologies).

На первых порах, в сфере информационных технологий часто противопоставляли два определения онтологии: более философское (определение Николы Гуарино) и более практическое (определение Томаса Грабера).

В философском контексте, онтология[1] – система категорий, используемая для рассмотрения с учетом конкретного видения мира. John Sowa так и пишет: предметом онтологии являются категории (потенциально) существующих вещей.

В контексте информационных систем, онтология[2] – формализованное описание общепринятого понимания некоторой предметной области, с помощью которого могут общаться люди, компьютерные системы.

На самом деле, вопрос в отличии двух определений сводится к разным требованиям к "слою-посреднику": в одном случае нужна строгая формальная теория, формальный язык (например, язык исчисления предикатов 1-го порядка, или его фрагменты, лежащие в основе логик дескрипций - description logics), в другом - достаточно списка терминов предметной области (онтологии - словари).



  1. Guarino N. Formal Ontology and Information Systems / N. Guarino // Formal Ontology in Information Systems : (Frontiers in Artificial Intelligence and Applications) : proceedings. — Amsterdam : IOS Press / Ohmsha, 1998. — P. 3—15.

  2. Uschold M. Ontologies: Principles, Methods and Applications / M. Uschold, M. Gruninger // Knowledge Engineering Review. — 1996. — Vol. 11, No. 2. — P. 99—155.

Подкатегории

Показано 2 подкатегории из 2.

O

Страницы в категории «Онтологии»

Показано 10 страниц этой категории из 10.

"

P

В

Н

О

Ч

Э


На пути к 4D

^ Материал из Semantic Future

Щербак Сергей Сергеевич

Shcherbak Sergey



^ Род деятельности:

научно-исследовательская деятельность, блогинг, web-разработка

Роль участника:

Участник, Бюрократ

^ Основной раздел:

Semantic Web

Круг интересов:

Искусственный интеллект, Инженерия знаний

^ Дата рождения:

15.12.1979

Место рождения:

Богодухов, Украина

Гражданство:

Украина

Сайт:

http://shcherbak.net

Nickname

Shcherbak

Подробнее:

рус.

Рассуждая на тему онтологий, столкнулся с тем, что Semantic Web при всей своей полезности может уйти с арены намного раньше, чем получит широкое признание и внедрение.

Причем его уход будет связан с введением какого-то нового понятия или бренда, типа Semantic Web 2 или Web 3.0. Естественно, опыт полученный в рамках Semantic Web не будет утрачен и в полной мере будет использоваться в рамках «нового бренда», но вот Semantic Web в том виде который мы знаем (пирог Semantic Web) вряд ли будет существовать. Уже четыре года Semantic Web пытается привлечь к себе внимание, а результаты с учетом глобальности Web не очень то и большие.

Конечно, сделано очень много... и стандарты представления знаний, алгоритмы обработки и программные средства, позволяющие обрабатывать знания(?!). Но все упирается в то, что человек должен (!) сам подготовить информацию в доступном для «машинного понимания» виде.

А это как минимум требует определенных знаний и навыков в моделировании предметных областей и т.п.

Кроме того, мы говорим пока, не о том, что самый посещаемый ресурс на сегодня – это DBpedia, где собраны в машинопонятном виде огромные запасы знаний о различных предметных областях, а о том, что зайдя, например, на WikiPedia мы получаем информацию быстро и по существу. Подчеркивая тот факт, что мы(!) что-то ищем и мы (!) потребляем какую-то информацию. А ведь одна из целей Semantic Web именно в том, что бы вы набрали запрос, а ваш программный агент, нашел и самую-самую интересную(и главное релевантную) информацию Вам предоставил. Т.е. нужно для начала хотя бы исключить один элемент из цепочки “потребления” информации – наше участие в поиске.

Читая, интервью с Тимом Бернесом Ли на тему “Semantic Web открыт для бизнеса”, смотрю на все изменяющуюся картинку «пирога» Semantic Web и понимаю, что упрощение Semantic Web приведет, конечно, к увеличению числа пользователей, активно использующих технологии и сервисы Semantic Web, но революции, которая наблюдалась при появлении технологии XML в 1999 году не будет. По крайней мере пока. А жаль!

Скорее всего, тенденции развития Semantic Web будут идти в сторону интеграции с другими не поддерживаемыми W3C стандартами. Здесь прежде всего стоит упомянуть о языке веб-онтологий OWL.

OWL – это язык для представления знаний о реальном мире. Причем описание объектов осуществляется в настоящем времени и нет ни какой возможности на уровне языка посмотреть состояния объектов ” вчера ”, «позавчера» и т.д . Т.Е. в OWL нет поддержки «версионности» объектов. Что, на мой взгляд, является серьезным недостатком.

Конечно, версионность в онтологии на OWL можно привнести извне, например, применяя системы контроля версии SVN или CVS. Но это возможно только в случаях, если мы говорим о «файловых» онтологиях. А что делать с онтологиями, которые хранятся в базах данных или в rdf store? Здесь тоже можно найти весьма эффективное решение, но это все частности, а ведь Semantic Web претендует прежде всего на универсализм и унифицированные решения.

В OWL, представляются знания о трехмерных объектах вне учета изменения их состояния во времени. OWL – онтологии называют еще трехмерными онтологиями или 3D онтологиями. В тоже время, онтологии, которые поддерживают четвертое измерение – время – называют четырехмерными онтологиями или 4D онтологиями.

Вот бы поддержку 4D в OWL… Но в скором времени, это вряд ли возможно. Скорее всего подобная функциональность будет привлечена из других стандартов онтологий. Например, из стандарта ISO-15926 ([1]). В рамках которого в части 2 (ISO 15926-2) описана модель 4D-онтологии, а в ISO 15926-7 предложены способы реализации методов интеграции распределенных систем на основе стандартов W3C.

Для скорейшей интеграции стандартов онтологий можно разрабатывать средства трансляции онтологий, например, на языке ATL (ATLAS Transformation Language) ([2]).

Поддерживая оптимизм Тима Бернеса Ли по поводу дальнейшего развития Semantic Web надеемся на лучшее :)


http://www.dialog-21.ru/dialog2008/materials/html/Zagorulko.htm

^ Портал знаний по компьютерной лингвистике: содержательный доступ к лингвистическим информационным ресурсам1[1]

Загорулько Ю.А. (zagor@iis.nsk.su), Боровикова О.И. (olesya@iis.nsk.su), Загорулько Г.Б. (gal@iis.nsk.su)
Институт систем информатики имени А.П.Ершова СО РАН, Новосибирск, Россия
Рассматривается Интернет-портал знаний, обеспечивающий систематизацию знаний и информационных ресурсов по компьютерной лингвистике, их интеграцию в единое информационное пространство, а также содержательный доступ к ним (поиск информации в терминах предметной области портала и управляемую знаниями навигацию).
Введение
В связи с постоянно растущими потребностями в средствах автоматической обработки документов и естественно-языковых, в том числе речевых, интерфейсах, возникает необходимость в эффективном доступе не только к публикациям, описывающим методы и подходы к обработке текстов, но и разного рода словарям, программным компонентам и алгоритмам, реализующим различные задачи обработки текста или речи. И, хотя в настоящее время в сети Интернет представлен большой объем знаний и информационных ресурсов по этой тематике, доступ к таким ресурсам значительно затруднен, так как они лишь частично систематизированы и при этом рассредоточены по различным Интернет-сайтам, каталогам и электронным архивам.

Для решения этой проблемы существует несколько подходов. В рамках одного из них создаются различные Интернет-ресурсы (форумы, рассылки, комьюнити-порталы), выполняющие информационную поддержку разнообразных тематических сообществ. Самым известным ресурсом такого рода, имеющим отношение к компьютерной лингвистике, является англоязычный каталог LINGUIST List (http://linguistlist.org/), созданный для общения и обмена знаниями между лингвистами и содержащий информацию о публикациях, персоналиях, научных учреждениях и других организациях лингвистического направления, грантах, конкурсах, проектах, фондах и источниках финансирования, конференциях и семинарах лингвистической тематики. LINGUIST List предоставляет возможность поиска ресурсов по таким параметрам, как страна, язык, раздел лингвистики.

К российским аналогам LINGUIST List можно отнести научно-образовательный портал "Лингвистика в России: ресурсы для исследователей" (http://uisrussia.msu.ru/linguist/index.jsp) и сайт “Российская лингвистика (RUSLING)” (http://rusling.narod.ru), создаваемый в Отделении лингвистических исследований ВИНИТИ РАН. Портал "Лингвистика в России” содержит иерархически организованный каталог ссылок на наиболее значимые лингвистические ресурсы и позволяет осуществлять навигацию по разделам портала с помощью иерархических связей внутри этих разделов и по ссылкам на связанные с ними области (разделы). Тематические категории этого портала представлены разделами по компьютерной, теоретической и прикладной лингвистике и их приложениям (смежным областям), а также разделами, посвященными русскому языку, языкам мира и народов РФ. Портал “Российская лингвистика” предлагает лингвистам «информационную карту» для поиска информации об организациях, научных исследованиях и публикациях, лингвистических ресурсах и персоналиях. Он содержит обширный каталог ссылок на словари и корпуса текстов для различных языков (в том числе славянских), а также сведения о российских лингвистах, предоставляя возможность их поиска не только по алфавиту, но и по области и объекту (языку) исследования.

Информационное наполнение порталов такого типа в значительной мере зависит от способа сбора информации (его автоматизированности) и личного вклада и активности каждого участника сообщества.

Другой подход направлен на представление лингвистических ресурсов непосредственно для работы с лингвистическими данными. К таким проектам относятся работы по переводу текстов в цифровые форматы, созданию средств их хранения и обработки, построению лингвистических онтологий и web-интерфейсов для описания и наполнения ресурсов лингвистическими данными. Среди таких проектов можно отметить проект E-MELD (http://emeld.org), в рамках которого создается лингвистическая онтология GOLD (General Ontology for Linguistic Description), представляющая общеязыковые знания в виде иерархических структур.

Как правило, проекты, разрабатываемые в рамках описанных выше подходов, направлены на описание и сохранение общеязыковой лингвистической информации, а не для интеграции ресурсов по компьютерной лингвистике и обеспечения к ним содержательного доступа широкому кругу пользователей.

Для решения этой проблемы нами разрабатывается специализированный Интернет-портал знаний – портал знаний по компьютерной лингвистике. Как информационный ресурс такой портал знаний обеспечивает следующие возможности:

  • представление научной дисциплины «компьютерная лингвистика» (используемых в ней терминов и понятий, тематических разделов, объектов и методов исследования, научных результатов и т.п.) и участников научной деятельности в рамках этой дисциплины (персоналий, групп, сообществ и других организаций, включенных в процесс исследования);

  • интеграцию доступных информационных ресурсов по компьютерной лингвистике в единое информационное пространство;

  • содержательный доступ к систематизированным знаниям и данным, относящимся к компьютерной лингвистике, т.е. возможность поиска и получения информации в терминах предметной области портала, а также удобную навигацию по всему информационному пространству портала, базирующуюся на модели предметной области;

  • персонификацию пользовательского интерфейса (способа и степени подробности предоставления информации, поиска и навигации по порталу);

  • информационную поддержку пользователей, т.е. анонсирование разного рода событий и мероприятий, касающихся данной дисциплины.

  1   2   3   4

Похожие:

Материал из Semantic Future iconДоклад на конференции «Science & our future»
Стендовый доклад на конференции «Science & our future», Москва, 15-19 мая 2005 года
Материал из Semantic Future iconShanghai: the present and the future

Материал из Semantic Future iconАвтор фи полностью
Любой материал (Картон, пенопласт, природный материал, ватман, древесина, бросовый материал и т д.)
Материал из Semantic Future iconПроект "future"
Тория представляет собой физико-математическое осмысление гравитации (статической и особенно динамической составляющей этого явления)...
Материал из Semantic Future icon3 Наличие подвала (техподполья ) технический подвал, материал стен...
Наличие подвала (техподполья ) технический подвал, материал стен блочный, материал перекрытий железобетон
Материал из Semantic Future iconThe same text in russian
По своим планам, целям и задачам nasa request For Information (rfi): Scientific Connections between nasa’s Earth Science Division...
Материал из Semantic Future iconМетодический материал
Методический материал к изучению дисциплины “Логистика” утвержден цикловой методической комиссией
Материал из Semantic Future iconНа 9-ти страницах освидетельствования технического состояния общедомового...
Наличие подвала (техподполья ) технический подвал, материал стен блочный, материал перекрытий железобетон
Материал из Semantic Future iconФормирование нравственно-правовой культуры учащихся младшего школьного возраста
Предлагаемый материал используется учителями начальных классов в воспитательной работе. В приложении содержится практический материал,...
Материал из Semantic Future iconТема : Оператор ветвление
Усвоить новый учебный материал, закрепить и применить новый учебный материал в традиционной и нетрадиционной форме
Вы можете разместить ссылку на наш сайт:
Школьные материалы


При копировании материала укажите ссылку © 2019
контакты
pochit.ru
Главная страница