Современные информационные технологии/1.Компьютерная инженерия.

Амосова Е.С.

Институт проблем химической физики РАН, Россия

РАЗРАБОТКА ОНТОЛОГИЧЕСКОЙ МОДЕЛИ ПРЕДМЕТНОЙ ОБЛАСТИ «ИННОВАЦИОННЫЕ РАЗРАБОТКИ В НАУЧНЫХ ИССЛЕДОВАНИЯХ»

В настоящее время использование онтологий для моделирования предметных областей современных информационных систем получает все более широкое распространение [1, 2], в частности, в системах в сети Интернет. Онтологическая модель позволяет разработать модель метаданных, что значительно улучшает использование системы широким кругом пользователей с точки зрения организации взаимодействия и применения семантического поиска. Поэтому задача построения онтологической модели предметной области «Инновационные разработки в научных исследованиях» является актуальной и сложной научно-практической задачей. Сложность поставленной задачи определяется, в частности, наличием множества межпредметных и междисциплинарных связей и различными целями конечных пользователей системы: ученых, экспертов, бизнесменов, политиков, сотрудников общественных и коммерческих организаций.

Целью настоящей статьи является разработка и создание онтологической модели предметной области «Инновационные разработки в научных исследованиях».

Инновационный процесс со структурной точки зрения представляет собой комплекс последовательно взаимосвязанных действий по созданию, освоению и распространению инновации, в том числе, включает в себя деятельность, обеспечивающую создание инноваций, - научно-технические услуги, маркетинговые исследования, разработку бизнес-плана проекта, оценку экономической эффективности инновации, подготовку и переподготовку кадров, организационную и финансовую деятельность.

Онтология области научно-исследовательской деятельности представляет собой структуру, отображающую процесс научной деятельности. Научные исследования возможны только при наличии полной и достоверной информации и наборов данных: начиная с этапа подачи заявки и заканчивая этапом публикации рецензии на разработку. Информационные системы по текущим исследованиям (CRIS) должны собирать воедино всю информацию, лежащую в основе научных исследований.

Попытки создания единой модели данных для информационных систем по научным разработкам предпринимаются не первый год [3-5].

При создании онтологии определённой предметной области в первую очередь следует составить глоссарий, т.е. список всех терминов, которые имеют отношение к данной предметной области. На данном этапе к работе привлекаются эксперты в предметной области. Словарь предметной области научных исследований с учётом особенностей российских научно-исследовательских учреждений может выглядеть следующим образом (основные термины):

ПЕРСОНА – любой человек, тем или иным образом участвующий в процессе создания и продвижения инновационных разработок.

ДИРЕКТОР - первый, главный руководитель компании, фирмы, направления деятельности. Директор управляет компанией в соответствии с ее уставом, имеет право первой подписи на денежных документах и обладает правом приема и увольнения с работы сотрудников.

ЗАМЕСТИТЕЛЬ ДИРЕКТОРА - официальное название должности помощника начальника какого-нибудь учреждения.

РУКОВОДИТЕЛЬ ПОДРАЗДЕЛЕНИЯ – лицо, заведующее структурным подразделением организации.

НАУЧНЫЙ СОТРУДНИК - проводит научные исследования, совершенствует и разрабатывает новые теории, концепции и методы и осуществляет их практическое применение.

ИНЖЕНЕР - специалист с высшим техническим образованием.

РАЗРАБОТЧИК - специалист, занимающийся разработкой проекта (схемы, механизма, аппаратуры).

АВТОР ПУБЛИКАЦИИ - человек или учреждение, ответственные за создание письменной работы, чьё имя или название указано на титульной странице или в другой части публикации. У одной работы может быть несколько совместных авторов.

РЕДАКТОР ПУБЛИКАЦИИ - лицо, обрабатывающее и подготовляющее, редактирующее текст для печати или оформляющее издание.

ЭКСПЕРТ - сведущее лицо, специалист, привлекаемый для того, чтобы высказать свое мнение, дать заключение по поводу какого-нибудь дела, вопроса.

РУКОВОДИТЕЛЬ ПРОЕКТА – лицо, возглавляющее проект.

ИССЛЕДОВАТЕЛЬ - лицо, занимающееся научными исследованиями.

ИНВЕСТОР - лицо, организация или государство, производящие инвестицию.

ЗАКАЗЧИК РАБОТ – лицо или организация, размещающие заказ на выполнение определённых работ.

ВЛАДЕЛЕЦ ИНТЕЛЛЕКТУАЛЬНОЙ СОБСТВЕННОСТИ – человек или организация, которая обладает правами собственности.

ПРОЕКТ - уникальный набор процессов, состоящих из скоординированных и управляемых задач с начальной и конечной датами, предпринятых для достижения цели.

ИННОВАЦИОННАЯ РАЗРАБОТКА – разработка новых или усовершенствованных технологий, видов продукции или услуг.

ИДЕЯ - мысленный образ чего-либо, понятие о чем-либо.

НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЕ РАБОТЫ - творческая деятельность, направленная на получение новых знаний и способов их применения.

ОПЫТНО-КОНСТРУКТОРСКИЕ РАБОТЫ - комплекс работ, выполняемых при создании или модернизации продукции: разработка конструкторской и технологической документации на опытные образцы (опытную партию), изготовление и испытания опытных образцов (опытной партии).

ОПЫТНО-ТЕХНОЛОГИЧЕСКИЕ РАБОТЫ - комплекс работ по созданию новых веществ, материалов и/или технологических процессов и по изготовлению технической документации на них.

РЕЗУЛЬТАТЫ НИОКР – новые знания или новые изделия и технологии, полученные в ходе научно-исследовательских и опытно-конструкторских работ.

ПРОДУКТ - материальные или нематериальные результаты проектов (физический продукт, программное обеспечение, результаты исследований).

ОРГАНИЗАЦИЯ - общественное объединение или государственное учреждение.

НИИ – научно-исследовательский институт: учреждение, занимающееся исследованиями в области науки и техники, разработкой НИР и НИОКР, разновидность института.

КОММЕРЧЕСКАЯ СТРУКТУРА - это юридическое лицо, имеющее основной целью получение прибыли.

ПРАВООБЛАДАТЕЛЬ - физическое или юридическое лицо, обладающее какими либо определенными правами.

ЧИСЛЕННОСТЬ СОТРУДНИКОВ – число сотрудников данной организации

НАПРАВЛЕНИЕ ДЕЯТЕЛЬНОСТИ – вид деятельности, которым занимается организация

ПРОГРАММА ФИНАНСИРОВАНИЯ – источник финансовых ресурсов для проекта, программы или любой другой научной деятельности.

ПУБЛИКАЦИЯ - статья или иной материал, преданный гласности в средствах массовой информации.

Составив список терминов предметной области, необходимо распределить, какие из этих понятий являются основными классами, какие подклассами, а какие – свойствами классов. В классы выделены ПЕРСОНА, ОРГАНИЗАЦИЯ, ПРОЕКТ, ПУБЛИКАЦИЯ, ПРОДУКТ, ПАТЕНТ, ПРОГРАММА ФИНАНСИРОВАНИЯ, а разновидности организаций и публикаций являются подклассами. Для создания модели используется редактор Protege.

Должности и виды деятельности определяют свойства связей между основными классами. Так, например, между Персоной и НИИ (подклассом Организации) можно выделить следующие связи:

- имеет_директора, является_директором,

- имеет_заместителя_директора, является_заместителем_директора,

- имеет_руководителя_подразделения, является_руководителем_подразделения,

- имеет_научного_сотрудника, работает_научным_сотрудником_в,

- имеет_инженера, работает_инженером_в.

После того как заданы прямые и обратные связи между всеми классами, определяются свойства классов. Названия организаций и проектов, имена людей, выходные данные публикаций, идентификаторы проектов, даты начала и конца проектов и другие свойства задаются как свойства данных.

Схема фрагмента модели:

Класс ОРГАНИЗАЦИЯ разбит на подклассы по типам организаций: НИИ, академический институт, университет, правительство и т.д.

Организации могут быть связаны друг с другом отношениями типа включает/состоит_в.

Организации и Персоны связаны с Публикациями отношениями типа имеет_автора/является_автором.

Персоны связаны с подклассом Организации НИИ отношениями типа имеет_директора/является_директором, имеет_заместителя_директора/является_заместителем_директора, имеет_руководителя_подразделения/является_руководителем_подразделения, имеет_научного_сотрудника/работает_научным_сотрудником_в, имеет_инженера/работает_инженером_в.

В работе поэтапно разработана онтологическая модель предметной области «Инновационные разработки в научных исследованиях». Разработанная модель будет использована для создания RDF хранилища и организации семантического поиска в информационной системе «Учет результатов интеллектуальной деятельности МПХФ РАН».

Литература:

1. Лапшин В.А. Онтологии в компьютерных системах. М.: Научный мир, 2010.

2. Gruber T.R. The role of common ontology in achieving sharable, reusable knowledge bases // Principles of Knowledge Representation and Reasoning. Proceedings of the Second International Conference. J.A. Allen, R. Fikes, E. Sandewell – eds. Morgan Kaufmann, 1991, 601-602.

3. Бездушный А.Н., Жижченко А.Б., Кулагин М.В., Серебряков В.А. Интегрированная система информационных ресурсов РАН и технология разработки цифровых библиотек // Программирование, 2000. № 4. С. 3-14.

4. Паринов С.И. Онлайновое будущее науки: наукометрическая сигнальная система. М.: ГУ ВШЭ, Серия препринтов «Количественный анализ в экономике», № 01, 2007. – 52 с

5. Зацман И.М. Информационные ресурсы для систем мониторинга в сфере науки // Системы и средства информатики. - 2005. - Вып. 15. - С. 288-318.