IІ. Класифікація бджіл та бджолиних колоній за деякими морфометричними ознаками, індексами: CI, DsA, HI, RI

В. Яровець, М.Стрільчук, В.Бабенко

ПЕРША ЧАСТИНА

Як було показано в першій частині роботи, увесь масив даних з 957-ми  крил, було поділено на 4 кластери-групи,  для подальшого аналізу яких застосовано дискримінантний аналіз. Останній проводився методом покрокового включення змінних (forward stepwise), який дає змогу включати в класифікаційну модель лише ті змінні, які істотно впливають на класифікацію даних. Результати проведеного в пакеті Statistica дискримінантного аналізу, описаної в ч.І вибірки, наведено в табл. 1, а матрицю коректності класифікації – у таблиці 2. 

Таблиця 1

Підсумкові результати дискримінантного аналізу

 

Таблиця 1  включає всі чотири індекси CI, DsA, HI та RI, розміщені в порядку зменшення впливу їх дисперсій на класифікацію даних. Статистика Вілкса λ  для побудованої моделі є досить малою і дорівнює 0,173, а р-рівень відповідної їй статистики Фішера менший, ніж 10-4 , що свідчить про достатньо добре розділення груп дискримінантними функціями. Значення першого стовбчика таблиці  (Wilks’ – Lambda) вказують як зміниться статистика Вілкса при вилученні відповідного індекса з класифікаційної моделі, а другого (Partial – Lambda) – одиночний внесок відповідного індекса в класифікацію даних (чим меншим є значення λр , тим істотніший одиночний вплив змінної на класифікацію даних).  Таким чином, з чотирьох ознак (CI, DsA, HI та RI) найбільш значимим для дискримінації, тобто поділу на окремі групи, є радіальний індекс RI. Другою ознакою, яка найбільш суттєво впливає на поділ масиву крил на групи, є індекс CI. Третім,  по значимості, є індекс НІ, а найменш впливовим є індекс DsA.

Таблиця 2

Матриця коректності класифікації

Достовірність класифікації масиву крил для групи 1 становить 98,4%, групи 2 – 91,6%, групи 3 – 92,0%, групи 4 – 82,5% (див. стовбець Percent Correct  в табл.2)

Таблиця 3

Кооефіцієти дискримінантних функцій (канонічних змінних)

В таблиці 3 наведені коефіцієнти дискримінантних функцій, власні значення їхньої коваріаційної матриці, та відсоток дисперсії перших канонічних змінних. Вказані коефіцієнти дають змогу обчислити значення цих функцій для кожного спостереження, а саме:

Розміщення даних у просторах відповідних канонічних змінних наведено на рис. 1.

Рис. 1. Розміщення даних у просторах канонічних змінних

В пакеті Statistica нами побудовано модель класифікації нових об’єктів за допомогою класифікаційних функцій. Коефіцієнти класифікаційних функцій наведено в таблиці 4.

Таблиця 4

Кооефіцієти класифікаційних функцій

Самі класифікаційні функції можуть бути обчислені за формулами:

Об’єкт відносимо до тієї групи, класифікаційна функція для якої виявляється найбільшою. Наприклад, для об’єкта з характеристиками  RI = 1,516, CI = 2,75, HI = 0,895, DsA = 1,64 класифікаційні функції дорівнюють: f1 = 324,7, f2 = 318,798, f3 = 324,656, f4 = 325,334. Найбільшого значення набуває четверта функція, тому об’єкт має бути віднесений до четвертої групи класифікації. 

Розподіл бджіл окремих колоній за кластерами наведено у таблиці  5

Таблиця 5

Дані розподілу бджіл окремих колоній по групах

Таким чином ми вважаємо, що одержаний результат  по класифікації крил бджіл за чотирма індексами дає підстави вважати його достатнім  для первинної експрес-оцінки окремих бджіл на предмет приналежності до певних груп-кластерів.

Наступним логічним кроком  був пошук  умовно «чистопородних» бджолородин, які б могли бути маркерами і могли б бути «прив᾿язані» до встановлених  груп-кластерів. Кілька таких колоній a.m.carnica з матками (ШО, кроси ліній Perner) було знайдено та досліджено. Результати наведно нижче в  табл. 6, 7, 8 та на рис.2

Таблиця 6

Середні та похибки індесів CI, DsA, HI, RI  для бджолородини № Colonia1

Таблиця 7

Середні та похибки індесів CI, DsA, HI, RI  для бджолородини № Colonia2

Таблиця 8

Середні та похибки індесів CI, DsA, HI, RI  разом для бджолородин № Colonia1 та № Colonia2

Рис. 2.    Гістограми розподілу крил бджіл бджолородин № Colonia1 та № Colonia2 між групами-кластерами

Із 145 крил 27 можуть вважатись такими,  як «зальотні», тобто бджоли з інших бджолородин, або такі, при  оцифровці жилкування яких, були допущені помилки.

Таким чином, було здійснено «прив᾿язку», тобто здійснена ідентифікація,  кластера 2 до породи a.m.carnica.

Нажаль, автори не мали таких надійних даних для інших порід. Тому використано крила сімей з матками F1 та  F2   a.m.ligustica (природнього осімінення). Результат дослідження для двох сімей показано в  табл. 9, 10, 11  та на рис. 3.

Таблиця 9

Середні та похибки індесів CI, DsA, HI, RI  для бджолородини № Lig.1.F

Таблиця 10

Середні та похибки індесів CI, DsA, HI, RI  для бджолородини № Lig.2.F

Таблиця 11

Середні та похибки індесів CI, DsA, HI, RI  разом для бджолородин № Lig.1.F та № Lig.2.F

Рис. 3.    Гістограми розподілу крил бджіл бджолородин № Lig.1.F та № Lig.2.F між групами-кластерами

Із 111 крил 13 можуть вважатись такими, як «зальотні», тобто бджоли з інших бджолородин, або такі, при  оцифровці жилкування яких, були допущені помилки.

Знаючи, що крила групи 2 відносяться до породи a.m.carnica, можна з певною достовірністю вважати, що крила  групи 1 відносяться саме до породи a.m.ligustica (правильніше, до їх помісей). Таким чином, було здійснено ідентифікацію кластерів 1 та 2 до порід a.m.ligustica та a.m.carnica, відповідно.

Використовуючи наведені нами результати, пасічники мають можливість ідентифікувати не тільки окремих особин, а також окремі бджолородини на предмет їхньої «чистопородності», або навпаки, якщо це стосується порід або помісей a.m.carnica та a.m.ligustica.

Залишається відкритим питання про ідентифікацію кластерів-груп 3 та 4, що буде предметом подальших досліджень.

Висновки:

  1. Враховуючи високу достовірність результатів, можна впевнено стверджувати, що навіть невелика кількість морфометричних параметрів, дозволяє в першому наближенні провести класифікацію бджіл у бджолородинах за допомогою програмного забезпечення STATISTICA.
  2. Досліджено дві колонії, які впевнено можуть бути віднесені до породи a.m.carnica.
  3. Досліджено кілька колоній, які можуть з певною достовірністю віднесені до помісей породи a.m.ligustica.
  4. Здійснено ідентифікацію груп-кластерів №1 та №2.
  5. Побудована класифікаційна модель та обчислені коефіцієнти класифікаційних функцій, що дає змогу пасічникам самостійно провести експрес аналіз для класифікації окремих бджіл та колоній.

Стаття надана В. Яровець

I. Класифікація бджіл та бджолиних колоній за деякими морфометричними ознаками, індексами: CI, DsA, HI, RI

В. Яровець, М.Стрільчук, В.Бабенко

Згідно літературних джерел [1,2,3],  на території України, як і на Європейському континенті,  розповсюджений вид бджіл медоносних Apis Mellifera. У свою чергу він поділяєься на підвиди (можна умовно назвати їх породами або типами), з яких на теренах України поширені чотири , а саме : середньоросійська, сіра гірська кавказська, італійська та карніка. Окрім цього, деякі дослідники виокремлюють карпатську,  поліську темну лісову та українську степову популяції.

В Україні немає жодного ізольованого облітника для неплідних маток, де можна було б одержувати племінний матеріал потрібної породи. Останніми роками пасічники, що займаються виводом маток, почали використовувати штучне запліднення, з метою одержання маток з прогнозованими властивостями. Та цей метод ще широко не  використовується в практиці. А тому, на більшості пасік реально існують помісі згаданих вище порід. Фенотипи останніх достатньо вивчені та описані в багатьох джерелах;  можна послатись на фундаментальну роботу Ф.Рутнера [ 4] . Вважаючи на те, що ми також мали справу з помісями, термін «порода» надалі в тексті вживатись не буде, а натомність застосуємо  терміни «група» або «кластер».

Однією з фенотипічних ознак бджіл є морфометрична ознака – жилкування крила.  В класичній морфометрії, запропонованій Ф.Рутнером [4],  на бджолиному крилі вимірюються відстані між точками на перетині жилок та певний кут між визначеними відрізками, на основі чого обчислюються індекси CI, DsA, HI. Розроблено систему класів для вказаних індексів, що дає можливість емпіричним чином  встановити взаємозвязок між породою та відповідними класами для кожного з індексів окремо. Недоліком такого підходу є те, що індекси «працюють» незалежно і безпосередньо не пов’язані між собою. Спроби ідентифікувати звичайну робочу колонію бджіл, що апріорі не має «чистопородності»,  шляхом обєднання  у дво- або три- вимірні моделі значень CI, DsA та HI індексів між собою (тобто взаємоповязати індекси), не дають достатньої прогнозованості приналежності колоній до певної породи бджіл. Цей недолік усунуто в подальшому розвитку морфометрії у роботах [5,6,7,8], де використано значно більшу кількість точок на крилі та значно більше визначених параметрів ідентифікації ( 5 індексів, 7 лінійних відрізків та 17 кутів), та застосовано методи статистичної обробки інформації.

Не маючи такої великої бази даних, нам було цікаво встановити, чи можна одержати достовірний результат, використовуючи чотири вказаних індекси, за допомогою методів статистичної обробки даних?

Мета роботи: дослідити можливість класифікації окремих бджіл та  бджолородин за кількома морфометричними ознаками, а саме : кубітального індекса (CI  ), дискоїдального зміщення ( DsA ), гантельного індекса ( HI ) та радіального індекса (RI) в комплексі, на підставі кластерного та дискримінантного аналізу даних.

Метою I.ч. роботи було за допомогою кластерного аналізу виділити основні групи класифікації експериментальних даних та оцінити їхні їстатистичні характеристики.

Методика роботи: за експериментальний матеріал слугували колонії бджіл з одної пасіки у селі Штукар, Миколаївській області, Веселинівського р-ну, яка розпочала свою історію у 2016 році. Сім’ї (16 шт.), були куплені із невідомими помісями бджіл, а також за сезони 2016-2017 рр, кількість було збільшено до 50. При збільшенні сімей використовувались в основному матки, виведені самостійно від кращих за ГКО вже існуючих, а також прикуплялись матки вільного спарування порід імовірно лігустика, бакфаст, карніка (ІО). Пасіка знаходиться по центру  села (довжина села 3 км) та  оточена іншими пасіками. В цілому в селі близько 300 бджолосімей.

У кожній родині із зимового підмору відбиралось від 50 до 100 бджіл, з яких використовували праве крило для одержання світлин потрібної якості з допомогою цифрового мікроскопа. В роботі використано 957 крил від 12 бджолиних колоній. Проміри жилкування виконувались на комп’ютері з використанням програми оцифровування крил TpsDig2  [ 9],  в результаті чого одержували масив координат 8-и точок з кожного крила. Обчислення індексів CI, DsA, HI, RI  виконувались власною програмою за стандартною методикою [4,11].  Радіальний індекс визначався згідно роботи [8], за формулою RI = aR/bR , де aR та bR – відрізки,   П-2 та 1-П відповідно, прямої 1-2 ( рис.1). Необхідно зауважити, що в роботі  [8] точка №1  (на рис.1) ставиться, на відміну від нашої роботи, дещо вище і має номер №7 . Це незначно впливає на визначення радіального індекса, а також більш суттєво впливає на визначення індекса DsA. Але для статистичних параметрів масиву даних в цілому, це не має вагомого значення через те, що похибка вимірювання при цьому є систематичною та достатньо стабільною.

Рис.1  Розташування 8-и точок на крилі, координати яких оцифровувались програмою  TpsDig2.

Статистична обробка результатів обчислення цих індексів виконувалась за допомогою пакета прикладних програм  STATISTICA 8.0 компанії StatSoft   [ 10].

Результат роботи:

На першому етапі масив обсягом 957 елементів стандартизованих даних по індексам  CI, DsA, HI та RI був підданий кластерному аналізу. Ієрархічне дерево кластеризації  (рис.2), побудоване на підставі евклідових відстаней між досліджуваними об’єктами та правила “повного зв’язку” між групами, що дає змогу поділяти вибірку на чотири групи – «кластери»…

Рис.2. Ієрархічне дерево кластеризації бджіл за індесами CI, DsA, HI та RI

Розподіл об’єктів на чотири кластери був здійснений методом k-середніх. Середні  значення стандартизованих показників  індексів CI, DsA, HI та RI для кожного кластера  наведено на рис. 3.

Рис. 3. Середні значення стандартизованих показників CI, DsA, HI та RI

Однофакторний дисперсійний аналіз показників індексів CI, DsA, HI та RI показує статистично достовірну  (< 0,001) відмінність міжгрупових (MS Effect) та внутрігрупових (MS Error)  дисперсій (таблиця 1). Іншими словами:  значення середніх вказаних індексів для кожної   з  груп суттєво відмінні між собою, а це є вагомою підставою вважати поділ  на чотири групи  достовірним.

Таблиця 1

Результати однофакторного дисперсійного аналізу

Таблиця 3

Довірчі інтервали для середніх значень індексів CI, DsA, HI та RI

На рис. 4 показано порівняльні характеристики  індексів CI, DsA, HI та RI для кожного з отриманих кластерів.

Рис. 4. Довірчі інтервали для середніх значень індексів CI, DsA, HI та RI

(Mean – середнє значення індекса, SE – його стандартна похибка, Mean±1,96SE – 95%-й довірчий інтервал для середнього значення).

Парні кореляції між значеннями індексів CI, DsA, HI та RI та їхній р-рівень наведено у таблиці 4.

Таблиця 4

Матриця парних кореляцій значень індексів CI, DsA, HI та RI

Зауважимо, що більшість кореляційних зав’язків між цими індексами є слабкими (r < 0,5),  що означає важливість усіх чотирьох індексів для класифікації даних.

Розподіл за кластерами у колоніях наведено на рис. 5. В жодній з колоній пасіки немає представників лише одного або  двох кластерів.  Тільки дві колонії №45 та №15 можна віднести до таких,  що містять бджіл, які належать до трьох груп. Інші колонії містять бджоли, що належать до чотирьох груп. Для колоній №45, 24 спостерігається переважання бджіл однієї групи над іншими. Та більшість колоній характеризуються більш-менш рівномірним розподілом бджіл по групах. Очевидно,  що матки в таких колоніях були запліднені трутнями різного сорту(помісі або породи). Це вказує на те, що трутневий фон на досліджуваній пасіці є достатньо неоднорідним.

Рис.5 Розподіл крил окремих колоній за групами-«кластерами»

Висновки:

  1. Показано, що за допомогою програмного забезпечення STATISTICA в першому наближенні можна успішно провести класифікацію бджіл у бджолородинах  навіть за  невеликою кількістю морфометричних параметрів, а саме CI, DsA, HI та RI.
  2. Аналіз статистичних оцінок індексів по кластерах, наведених на рис.4, вказує на добру роздільну здатність  поєднання середніх значень індексів для поділу на чотири кластери, не дивлячись на те, що значення середніх індекса  DsA  для 1-го та 3-го кластерів практично перекриваються (рис.4 ).
  3. Встановлено, що між індексами не існує сильних взаємозв’язків, що вимагає використання усіх чотирьох індексів для проведення класифікації.
  4. За своїм складом досліджені колонії бджіл в першому наближенні можуть бути поділені на чотири групи.
  5. Опосередковано можна вважати, що трутневий фон на досліджуваній пасіці є неоднорідний.
  6. Середні значення індексів та довірчі інтервали їх значень для встановлених груп можуть використовуватись пасічниками для ідентифікації колоній.

Літературні джерела

  1. А.І.Черкасова, В.М.Блонська, П.О.Губа, І.К.Давиденко, О.М.Яцун, П.А.Возний, Н.В.Муквич. Бджільництво/- Київ.-вид.»Урожай».-1989.-300 с.
  2. Г.А.Аветисян, В.О.Губін, М.К.Шевчук та ін.;відпов. за вип. В.А.Гайдар, В.П.Пилипенко. Карпатські бджоли/-Ужгород.-вид.»Карпати».-1982.-224 с.
  3. А.И.Рут, Э.Р.Рут, Х.Х.Рут, М.Дж.Дейолл, Дж.А.Рут. Энциклопедия пчеловодства/-М.-«Художественная литература»,МП»Брат».-1993.-386 с.
  4. Ф.Рутнер. Техника разведения и селекционный отбор пчел/-Москва.-АСТ»Астрель».-2006.-176 с.
  5. Ruttner, F. Biogegraphy and Taxonomy of Honeybees./- Springer‐Verlag. Berlin—Heidelberg—New York—London—Paris—Tokyo.- 1988.- 284 pages.
  6. DuPraw E.J. Non-Linnean Taxonomy . /- 1964.- -202.- 849–852.
  7. Adam Tofilski . Using geometric morphometrics and standard morphometry to discriminate three honeybee subspecies./- Apidologie 39.-2008.- 558–563
  8. DAWINO (Discriminant Analysis With Numerical Output). Morphometrical analysis and taxonometrical classification of honey bees by wing characters/- http://beedol.cz/dawino/DAWINO_prosp_EN.pdf
  9. TpsDig/ http://life.bio.sunysb.edu/morph/soft-dataacq.html
  10. StatSoft.Inc.(2001).Электронный учебник по статистике/-M. StatSoft.http://www.StatSoft.ru/home/textbook/default.html
  11. Программа для определения породной принадлежности пчел медоносных Apis Mellifera по жилкованию крыла. «Порода по крыльям». Карташев А.Б./-Российская Федерация.-Свидетельство о гос. регистации №2016663003.-2016.

Стаття надана В. Яровець

ДРУГА ЧАСТИНА