В. Яровець, М.Стрільчук, В.Бабенко
Як було показано в першій частині роботи, увесь масив даних з 957-ми крил, було поділено на 4 кластери-групи, для подальшого аналізу яких застосовано дискримінантний аналіз. Останній проводився методом покрокового включення змінних (forward stepwise), який дає змогу включати в класифікаційну модель лише ті змінні, які істотно впливають на класифікацію даних. Результати проведеного в пакеті Statistica дискримінантного аналізу, описаної в ч.І вибірки, наведено в табл. 1, а матрицю коректності класифікації – у таблиці 2.
Таблиця 1
Підсумкові результати дискримінантного аналізу
Таблиця 1 включає всі чотири індекси CI, DsA, HI та RI, розміщені в порядку зменшення впливу їх дисперсій на класифікацію даних. Статистика Вілкса λ для побудованої моделі є досить малою і дорівнює 0,173, а р-рівень відповідної їй статистики Фішера менший, ніж 10-4 , що свідчить про достатньо добре розділення груп дискримінантними функціями. Значення першого стовбчика таблиці (Wilks’ – Lambda) вказують як зміниться статистика Вілкса при вилученні відповідного індекса з класифікаційної моделі, а другого (Partial – Lambda) – одиночний внесок відповідного індекса в класифікацію даних (чим меншим є значення λр , тим істотніший одиночний вплив змінної на класифікацію даних). Таким чином, з чотирьох ознак (CI, DsA, HI та RI) найбільш значимим для дискримінації, тобто поділу на окремі групи, є радіальний індекс RI. Другою ознакою, яка найбільш суттєво впливає на поділ масиву крил на групи, є індекс CI. Третім, по значимості, є індекс НІ, а найменш впливовим є індекс DsA.
Таблиця 2
Матриця коректності класифікації
Достовірність класифікації масиву крил для групи 1 становить 98,4%, групи 2 – 91,6%, групи 3 – 92,0%, групи 4 – 82,5% (див. стовбець Percent Correct в табл.2)
Таблиця 3
Кооефіцієти дискримінантних функцій (канонічних змінних)
В таблиці 3 наведені коефіцієнти дискримінантних функцій, власні значення їхньої коваріаційної матриці, та відсоток дисперсії перших канонічних змінних. Вказані коефіцієнти дають змогу обчислити значення цих функцій для кожного спостереження, а саме:
Розміщення даних у просторах відповідних канонічних змінних наведено на рис. 1.
Рис. 1. Розміщення даних у просторах канонічних змінних
В пакеті Statistica нами побудовано модель класифікації нових об’єктів за допомогою класифікаційних функцій. Коефіцієнти класифікаційних функцій наведено в таблиці 4.
Таблиця 4
Кооефіцієти класифікаційних функцій
Самі класифікаційні функції можуть бути обчислені за формулами:
Об’єкт відносимо до тієї групи, класифікаційна функція для якої виявляється найбільшою. Наприклад, для об’єкта з характеристиками RI = 1,516, CI = 2,75, HI = 0,895, DsA = 1,64 класифікаційні функції дорівнюють: f1 = 324,7, f2 = 318,798, f3 = 324,656, f4 = 325,334. Найбільшого значення набуває четверта функція, тому об’єкт має бути віднесений до четвертої групи класифікації.
Розподіл бджіл окремих колоній за кластерами наведено у таблиці 5
Таблиця 5
Дані розподілу бджіл окремих колоній по групах
Таким чином ми вважаємо, що одержаний результат по класифікації крил бджіл за чотирма індексами дає підстави вважати його достатнім для первинної експрес-оцінки окремих бджіл на предмет приналежності до певних груп-кластерів.
Наступним логічним кроком був пошук умовно «чистопородних» бджолородин, які б могли бути маркерами і могли б бути «прив᾿язані» до встановлених груп-кластерів. Кілька таких колоній a.m.carnica з матками (ШО, кроси ліній Perner) було знайдено та досліджено. Результати наведно нижче в табл. 6, 7, 8 та на рис.2
Таблиця 6
Середні та похибки індесів CI, DsA, HI, RI для бджолородини № Colonia1
Таблиця 7
Середні та похибки індесів CI, DsA, HI, RI для бджолородини № Colonia2
Таблиця 8
Середні та похибки індесів CI, DsA, HI, RI разом для бджолородин № Colonia1 та № Colonia2
Рис. 2. Гістограми розподілу крил бджіл бджолородин № Colonia1 та № Colonia2 між групами-кластерами
Із 145 крил 27 можуть вважатись такими, як «зальотні», тобто бджоли з інших бджолородин, або такі, при оцифровці жилкування яких, були допущені помилки.
Таким чином, було здійснено «прив᾿язку», тобто здійснена ідентифікація, кластера 2 до породи a.m.carnica.
Нажаль, автори не мали таких надійних даних для інших порід. Тому використано крила сімей з матками F1 та F2 a.m.ligustica (природнього осімінення). Результат дослідження для двох сімей показано в табл. 9, 10, 11 та на рис. 3.
Таблиця 9
Середні та похибки індесів CI, DsA, HI, RI для бджолородини № Lig.1.F
Таблиця 10
Середні та похибки індесів CI, DsA, HI, RI для бджолородини № Lig.2.F
Таблиця 11
Середні та похибки індесів CI, DsA, HI, RI разом для бджолородин № Lig.1.F та № Lig.2.F
Рис. 3. Гістограми розподілу крил бджіл бджолородин № Lig.1.F та № Lig.2.F між групами-кластерами
Із 111 крил 13 можуть вважатись такими, як «зальотні», тобто бджоли з інших бджолородин, або такі, при оцифровці жилкування яких, були допущені помилки.
Знаючи, що крила групи 2 відносяться до породи a.m.carnica, можна з певною достовірністю вважати, що крила групи 1 відносяться саме до породи a.m.ligustica (правильніше, до їх помісей). Таким чином, було здійснено ідентифікацію кластерів 1 та 2 до порід a.m.ligustica та a.m.carnica, відповідно.
Використовуючи наведені нами результати, пасічники мають можливість ідентифікувати не тільки окремих особин, а також окремі бджолородини на предмет їхньої «чистопородності», або навпаки, якщо це стосується порід або помісей a.m.carnica та a.m.ligustica.
Залишається відкритим питання про ідентифікацію кластерів-груп 3 та 4, що буде предметом подальших досліджень.
Висновки:
- Враховуючи високу достовірність результатів, можна впевнено стверджувати, що навіть невелика кількість морфометричних параметрів, дозволяє в першому наближенні провести класифікацію бджіл у бджолородинах за допомогою програмного забезпечення STATISTICA.
- Досліджено дві колонії, які впевнено можуть бути віднесені до породи a.m.carnica.
- Досліджено кілька колоній, які можуть з певною достовірністю віднесені до помісей породи a.m.ligustica.
- Здійснено ідентифікацію груп-кластерів №1 та №2.
- Побудована класифікаційна модель та обчислені коефіцієнти класифікаційних функцій, що дає змогу пасічникам самостійно провести експрес аналіз для класифікації окремих бджіл та колоній.
Стаття надана В. Яровець