Ярцева О.І., Перевозніков С.І., Озеранський В.С.

Вінницький національний технічний університет

Кластерний аналіз у системі діагностування

На сучасному етапі розвитку засобів діагностування все більшого значення набувають методи  непорушуючого контролю. Особливо гострими постають питання визначення ефективності  процесу тестування, яке  значною мірою зале­жить від обраного методу тестового діагностування, простежуються спроби використати елементи і компоненти, зокрема самонавчання та експертні систе­ми.

Однак при цьому не вироблено чіткої методології та відповідних стратегій: не розглядають питання взаємодо­повнення компонентів в реалізації процесу тестового діагностування та оцінювання ефективності їх викорис­тання.

При діагностуванні технічних систем значна кількість діагностичних ознак мають описовий характер [1], тому виникає необхідність застосування методів стохастичного факторного аналізу, які дають змогу врахувати вплив сукупності факторів, що носять імовірнісний, невизначений характер.

Сучасні системи доступу до даних є комплексом апаратно-програмних засобів, що дають змогу одержувати доступ до даних та забезпечувати їх зберігання для подальшого використання. Разом зі збільшенням обсягів даних збільшується і кількість апаратно програмних засобів для їх обробки і передачі.

Відомо, що структура розбиття гіперграфу повинна відповідати ряду формальних обмежень. Можливості апаратно–програмних засобів систем покомпонентного діагностування здійснювати штучні канали передачі тестової інформації роблять перспективним дослідження алгоритмів змінної компонентної структури, що грунтуються на декомпозиційному підході (створення штучних фрагментів тільки на час проведення діагностичного експерименту, зручних та раціональних для цієї мети).

Формалізовані математичні залежності не завжди дають змогу зрозуміти взаємозв’язки компонентів розбиття, як наслідок зменшується ефективність пошуку несправностей згідно спрямованості процесу діагностування.

Графічне представлення структури цифрового пристрою  надає можливість визначити число повних і неповних компонентів, а також проаналізувати особливості взаємного перетинання компонентів. Змінюючи положення елементів у матриці структури цифрового пристрою змінюється структура графу, а, отже, і кількість зв’язків між компонентами.

Будь-яку структуру цифрового пристрою можна подати у вигляді матриці елементів та компонентів. Перестановка елементу матриці змінює його координати в просторі, змінюючи при цьому зв’язки між компонентами. Таким чином, можна отримати декілька варіантів представлення однієї і тієї ж структури, не змінюючи при цьому формальний показник розбиття гіперграфу G  на компоненти :       .

Основою кластеризації об'єктів є матриця відстаней D між елементами в таблиці елементів і компонентів. Використовуючи матрицю відстаней D , можна реалізувати агломеративну ієрархічну процедуру кластерного аналізу (КА). Принцип роботи ієрархічних агломеративних процедур полягає в послідовному об'єднанні груп елементів спочатку найближчих, а потім все більш віддалених один від одного [2].

На першому кроці алгоритму кожне спостереження розглядається як

окремий кластер. Надалі на кожному кроці роботи алгоритму відбувається

об'єднання двох найближчих кластерів, тобто якщо , то створюється новий кластер  і знову будується матриця відстаней між елементами, розмірність якої не змінюється, а кількість зв’язків зменшується.

Робота алгоритму закінчується, коли всі спостереження об'єднані в один кластер. Ієрархічні методи кластеризації, хоча й точні, але трудомісткі: на кожному кроці необхідно вибудовувати матрицю відстаней для всіх поточних кластерів.

Тому при наявності великої кількості об'єктів застосовують інші методи, загальним недоліком яких є апріорне знання числа кластерів. В ієрархічних же процедурах кластеризації оптимальне число кластерів – один з результатів роботи алгоритму.

 

Література

1. Телішевська А.В. Формалізація вхідної інформації для діагностики

неврологічних захворювань. / А.В. Телішевська, А.І. Поворознюк // Матеріали науково-практичної конференції «MicroCad 2011». – Харків. –

2011. – С. 162 – 167.

2. Ким Дж.-О. Факторный, дискриминантный и кластерный анализ / Дж.-О.

Ким, Ч.У. Мьюллер, У.Р. Клекка. – М: Финансы и статистика, 1989. – 215 с.