Математика/4. Математичне моделювання

 

Хардіков О.Є.

Навчально-науковий комплекс «Інститут прикладного системного аналізу» Національного технічного університету України «Київський політехнічний інститут»

Моделювання врожайності соняшнику в залежності від NDVI і погодних факторів

 

Задачі оцінки стану рослинності та прогнозування врожайності сільськогосподарських культур складають основу сучасних досліджень в області точного землеробства та економічного планування в аграрній промисловості. Найбільш перспективні напрямки досліджень пов'язані з асиміляцією даних дистанційного зондування Землі в існуючі моделі розвитку рослин і створенням нових методів на їх основі [1].

Рослини володіють унікальним спектром поглинання, визначеним наявністю різних пігментів, вмістом води і фізичною структурою листя. Спектр змінюється з плином часу в залежності від фази розвитку, біологічного виду, стану навколишнього середовища та стану рослини. Тому спектр поглинання принципово може бути використаний для задач оцінки стану рослинності.

NDVI (Normalized Difference Vegetation Index) - нормалізований відносний індекс рослинності - простий кількісний показник кількості фотосинтетичної активної біомаси [2].

Аналіз та побудова моделей були виконані на основі статистичних даних (середні показники NDVI, температури повітря у °C, кількості опадів у мм, врожайності поля (ц/га)), виміряних на полях компанії «Агротон», де вирощувався соняшник, за часовий проміжок з 2009 по 2012 роки за допомогою програми SAS Enterprise Miner.

Перелік умовних скорочень і позначень у назвах параметрів моделей:

-       Productivity – врожайність поля;

-       ndvi.i.j – середнє значення NDVI за тижні року номер i, j;

-       precip.i.j – середнє значення кількості опадів за тижні року номер i, j;

-       temp.i.j – середнє значення температури за тижні року номер i, j.

-       Intercept – вільний член моделі.

Метод лінійної регресії [3].

Productivity = – 149,777 * Intercept + 52,397 * ndvi.29.30 – 38,931 * ndvi.27.28 + 26,617 * ndvi.25.26 + 7,072 * temp.23.24 + 5,500 * temp.27.28 – 4,018 * temp.25.26 – 3,100 * temp.19.20

Метод LARS з вибором моделі по значенню ASE на перевірочній вибірці.

Productivity = – 9,810 * Intercept + 14,932 * ndvi.25.26 + 18,960 * ndvi.29.30 + 1,218 * ndvi.31.32 – 0,971 * precip.19.20 + 0,566 * precip.23.24 – 0,053 * temp.25.26 + 0,244 * temp.29.30

Метод LARS з вибором моделі по значенню SBC.

Productivity = – 9,083 * Intercept + 14,206 * ndvi.25.26 + 19,763 * ndvi.29.30 – 0,983 * precip.19.20 + 0,543 * precip.23.24 – 0,066 * temp.25.26 + 0,252 * temp.29.30

Метод PLS.

Productivity =6,767 * Intercept – 14,783 * ndvi.19.20 + 9,894 * ndvi.21.22 – 8,944 * ndvi.23.24 + 34,979 * ndvi.25.26 – 45,693 * ndvi.27.28 + 48,214 * ndvi.29.30 + 16,681 * ndvi.31.32 – 13,481 * ndvi.33.34 – 0,148 * precip.19.20 + 2,238 * precip.29.30 – 0,124 * temp.25.26 – 0,772 * temp.29.30 + 0,041 * temp.31.32

Метод лінійної регресії з відбором значущих змінних за допомогою дерева рішень.

Productivity = – 12,119 * Intercept + 27,347 * ndvi.25.26 – 40,750 * ndvi.27.28 + 60,514 * ndvi.29.30 + 0,172 * precip.23.24

Метод градієнтного бустінгу. Для побудови моделі (дерева) були відібрані змінні: temp.19.20, temp.21.22, temp.25.26, temp.27.28, ndvi.19.20, ndvi.21.22, ndvi.23.24, ndvi.25.26, ndvi.27.28, ndvi.29.30, ndvi.31.32, ndvi.33.34, precip.19.20, precip.23.24, precip.27.28.

Табл. 1. Значення критеріїв якості побудованих моделей

Вибірка

Навчальна

Перевірочна

Модель

RASE

SSE

MAX error

RASE

SSE

MAX error

Gradient Boosting

1,836

185,452

8,562

2,041

95,785

4,724

LARS Validation

3,050

511,625

11,534

2,626

158,562

7,062

LARS SBC

3,059

514,795

11,591

2,642

160,522

7,129

Partial Least Squares

2,810

434,427

10,140

2,842

185,792

8,389

Regression after DTree

2,931

472,452

11,143

3,007

207,943

8,437

Regression

2,896

461,165

11,146

2,755

174,534

7,469

В результаті аналізу статистичних характеристик якості моделі та оцінок прогнозів визначено адекватні моделі процесів. Зроблено оцінку якості отриманих результатів прогнозів за множиною статистичних характеристик якості. За результатами статичного прогнозування динаміки активів найкращою моделлю процесу виявилася модель градієнтного бустінгу (Gradient Boosting), у якої корінь з середнього квадрату похибки на перевірочній вибірці (RASE) склав менше, ніж 14% від середнього значення врожайності (по досліджуваних даних).

 

Література:

1. Куссуль Н.Н., Ільїн Н.І., Скакун С.В., Лавренюк А.Н. Оцінка стану рослинності і прогнозування врожайності озимих культур України по супутниковим даним // International Book Series "Decision Making and Business Intelligence, Strategies and Techniques". – 2008. №3.с.103-109.

2. Офіційний сайт центру прийому і обробки спеціальної інформації та контролю навігаційного поля (ЦПОСІ та КНП) та архіву даних дистанційного зондування Землі [Електронний ресурс] – Доступний з: www.dzz.gov.ua.

3. Бідюк П.І., Меняйленко О.С., Половцев О.В. Методи прогнозування. — Луганськ: Альма Матер, 2008. — 607 с.