Современные информационные
технологии/1.Компьютерная инженерия.
Амосова Е.С.
Институт проблем химической физики
РАН, Россия
РАЗРАБОТКА
ОНТОЛОГИЧЕСКОЙ МОДЕЛИ ПРЕДМЕТНОЙ ОБЛАСТИ «ИННОВАЦИОННЫЕ РАЗРАБОТКИ В НАУЧНЫХ
ИССЛЕДОВАНИЯХ»
В настоящее время использование
онтологий для моделирования предметных областей современных информационных
систем получает все более широкое распространение [1, 2], в частности, в
системах в сети Интернет. Онтологическая модель позволяет разработать модель
метаданных, что значительно улучшает использование системы широким кругом
пользователей с точки зрения организации взаимодействия и применения
семантического поиска. Поэтому задача построения онтологической модели
предметной области «Инновационные разработки в научных исследованиях» является
актуальной и сложной научно-практической задачей. Сложность поставленной задачи
определяется, в частности, наличием множества межпредметных и междисциплинарных
связей и различными целями конечных пользователей системы: ученых, экспертов,
бизнесменов, политиков, сотрудников общественных и коммерческих организаций.
Целью настоящей статьи
является разработка и создание онтологической модели предметной области «Инновационные
разработки в научных исследованиях».
Инновационный процесс со
структурной точки зрения представляет собой комплекс последовательно
взаимосвязанных действий по созданию, освоению и распространению инновации, в
том числе, включает в себя деятельность, обеспечивающую создание инноваций, -
научно-технические услуги, маркетинговые исследования, разработку бизнес-плана
проекта, оценку экономической эффективности инновации, подготовку и
переподготовку кадров, организационную и финансовую деятельность.
Онтология области
научно-исследовательской деятельности представляет собой структуру, отображающую
процесс научной деятельности. Научные исследования возможны только при наличии
полной и достоверной информации и наборов данных: начиная с этапа подачи заявки
и заканчивая этапом публикации рецензии на разработку. Информационные системы
по текущим исследованиям (CRIS) должны
собирать воедино всю информацию, лежащую в основе научных исследований.
Попытки создания единой модели
данных для информационных систем по научным разработкам предпринимаются не
первый год [3-5].
При создании онтологии определённой предметной
области в первую очередь следует составить глоссарий, т.е. список всех
терминов, которые имеют отношение к данной предметной области. На данном этапе
к работе привлекаются эксперты в предметной области. Словарь предметной области
научных исследований с учётом особенностей российских научно-исследовательских
учреждений может выглядеть следующим образом (основные термины):
ПЕРСОНА – любой человек, тем или иным образом
участвующий в процессе создания и продвижения инновационных разработок.
ДИРЕКТОР - первый, главный руководитель
компании, фирмы, направления деятельности. Директор управляет компанией в
соответствии с ее уставом, имеет право первой подписи на денежных документах и
обладает правом приема и увольнения с работы сотрудников.
ЗАМЕСТИТЕЛЬ ДИРЕКТОРА - официальное название
должности помощника начальника какого-нибудь учреждения.
РУКОВОДИТЕЛЬ ПОДРАЗДЕЛЕНИЯ – лицо, заведующее
структурным подразделением организации.
НАУЧНЫЙ СОТРУДНИК - проводит научные
исследования, совершенствует и разрабатывает новые теории, концепции и методы и
осуществляет их практическое применение.
ИНЖЕНЕР - специалист с высшим техническим
образованием.
РАЗРАБОТЧИК - специалист, занимающийся
разработкой проекта (схемы, механизма, аппаратуры).
АВТОР ПУБЛИКАЦИИ - человек или учреждение,
ответственные за создание письменной работы, чьё имя или название указано на
титульной странице или в другой части публикации. У одной работы может быть
несколько совместных авторов.
РЕДАКТОР ПУБЛИКАЦИИ - лицо, обрабатывающее и
подготовляющее, редактирующее текст для печати или оформляющее издание.
ЭКСПЕРТ - сведущее лицо, специалист,
привлекаемый для того, чтобы высказать свое мнение, дать заключение по поводу
какого-нибудь дела, вопроса.
РУКОВОДИТЕЛЬ ПРОЕКТА – лицо, возглавляющее
проект.
ИССЛЕДОВАТЕЛЬ - лицо, занимающееся научными
исследованиями.
ИНВЕСТОР - лицо, организация или государство,
производящие инвестицию.
ЗАКАЗЧИК РАБОТ – лицо или организация,
размещающие заказ на выполнение определённых работ.
ВЛАДЕЛЕЦ ИНТЕЛЛЕКТУАЛЬНОЙ СОБСТВЕННОСТИ –
человек или организация, которая обладает правами собственности.
ПРОЕКТ - уникальный набор процессов, состоящих
из скоординированных и управляемых задач с начальной и конечной датами,
предпринятых для достижения цели.
ИННОВАЦИОННАЯ РАЗРАБОТКА – разработка новых или
усовершенствованных технологий, видов продукции или услуг.
ИДЕЯ - мысленный образ
чего-либо, понятие о чем-либо.
НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЕ РАБОТЫ - творческая
деятельность, направленная на получение новых знаний и способов их применения.
ОПЫТНО-КОНСТРУКТОРСКИЕ РАБОТЫ - комплекс работ,
выполняемых при создании или модернизации продукции: разработка конструкторской
и технологической документации на опытные образцы (опытную партию),
изготовление и испытания опытных образцов (опытной партии).
ОПЫТНО-ТЕХНОЛОГИЧЕСКИЕ РАБОТЫ - комплекс работ
по созданию новых веществ, материалов и/или технологических процессов и по
изготовлению технической документации на них.
РЕЗУЛЬТАТЫ НИОКР – новые знания или новые
изделия и технологии, полученные в ходе научно-исследовательских и
опытно-конструкторских работ.
ПРОДУКТ - материальные или нематериальные
результаты проектов (физический продукт, программное обеспечение, результаты
исследований).
ОРГАНИЗАЦИЯ - общественное
объединение или государственное учреждение.
НИИ – научно-исследовательский институт:
учреждение, занимающееся исследованиями в области науки и техники, разработкой
НИР и НИОКР, разновидность института.
КОММЕРЧЕСКАЯ СТРУКТУРА - это юридическое лицо,
имеющее основной целью получение прибыли.
ПРАВООБЛАДАТЕЛЬ - физическое или юридическое
лицо, обладающее какими либо определенными правами.
ЧИСЛЕННОСТЬ СОТРУДНИКОВ – число сотрудников
данной организации
НАПРАВЛЕНИЕ ДЕЯТЕЛЬНОСТИ – вид деятельности,
которым занимается организация
ПРОГРАММА ФИНАНСИРОВАНИЯ – источник финансовых
ресурсов для проекта, программы или любой другой научной деятельности.
ПУБЛИКАЦИЯ - статья или иной материал, преданный
гласности в средствах массовой информации.
Составив список терминов
предметной области, необходимо распределить, какие из этих понятий являются
основными классами, какие подклассами, а какие – свойствами классов. В классы
выделены ПЕРСОНА, ОРГАНИЗАЦИЯ, ПРОЕКТ, ПУБЛИКАЦИЯ, ПРОДУКТ, ПАТЕНТ, ПРОГРАММА
ФИНАНСИРОВАНИЯ, а разновидности организаций и публикаций являются подклассами.
Для создания модели используется редактор Protege.

Должности и виды деятельности определяют
свойства связей между основными классами. Так, например, между Персоной и НИИ
(подклассом Организации) можно выделить следующие связи:
- имеет_директора,
является_директором,
- имеет_заместителя_директора,
является_заместителем_директора,
- имеет_руководителя_подразделения,
является_руководителем_подразделения,
- имеет_научного_сотрудника,
работает_научным_сотрудником_в,
- имеет_инженера,
работает_инженером_в.

После того как заданы прямые и
обратные связи между всеми классами, определяются свойства классов. Названия
организаций и проектов, имена людей, выходные данные публикаций, идентификаторы
проектов, даты начала и конца проектов и другие свойства задаются как свойства
данных.
Схема
фрагмента модели:
Класс
ОРГАНИЗАЦИЯ разбит на подклассы по типам организаций: НИИ, академический
институт, университет, правительство и т.д.
Организации
могут быть связаны друг с другом отношениями типа включает/состоит_в.
Организации
и Персоны связаны с Публикациями отношениями типа
имеет_автора/является_автором.
Персоны
связаны с подклассом Организации НИИ отношениями типа имеет_директора/является_директором,
имеет_заместителя_директора/является_заместителем_директора,
имеет_руководителя_подразделения/является_руководителем_подразделения,
имеет_научного_сотрудника/работает_научным_сотрудником_в,
имеет_инженера/работает_инженером_в.

В работе поэтапно разработана
онтологическая модель предметной области «Инновационные разработки в научных
исследованиях». Разработанная модель будет использована для создания RDF хранилища
и организации семантического поиска в информационной системе «Учет результатов
интеллектуальной деятельности МПХФ РАН».
Литература:
1. Лапшин В.А. Онтологии
в компьютерных системах. М.: Научный
мир, 2010.
2. Gruber T.R. The role of common ontology in achieving sharable,
reusable knowledge bases // Principles of Knowledge Representation and
Reasoning. Proceedings of the Second International Conference. J.A. Allen, R.
Fikes, E. Sandewell – eds. Morgan Kaufmann, 1991, 601-602.
3. Бездушный
А.Н., Жижченко А.Б., Кулагин М.В., Серебряков В.А. Интегрированная система информационных ресурсов
РАН и технология разработки цифровых библиотек
// Программирование, 2000. № 4. С. 3-14.
4. Паринов С.И. Онлайновое будущее науки:
наукометрическая сигнальная система. М.: ГУ ВШЭ, Серия препринтов
«Количественный анализ в экономике», № 01, 2007. – 52 с
5. Зацман И.М.
Информационные ресурсы для систем мониторинга в сфере науки // Системы и
средства информатики. - 2005. - Вып. 15. - С. 288-318.