Современные информационные
технологии/ 2. Вычислительная техника и программирование
К.т.н. Самарець Н.М.
Дніпропетровський державний аграрно-економічний
університет, Україна
Економетричне
моделювання із застосуванням вільного програмного забезпечення
Важливу роль у ефективному
управлінні та плануванні діяльністю сучасного агропромислового підприємства
може відігравати економіко-математичне моделювання різноманітних процесів
сільськогосподарської діяльності. Зокрема, значне місце серед сучасних методів
прогнозування економічних показників займає кореляційно-регресійний аналіз. У
даний час досліднику доступна велика кількість програмних продуктів, які можуть
бути використані для вирішення економіко-математичних задач. Разом з цим, на
сьогоднішній день у різних сферах спостерігається перехід від пропрієтарного
програмного забезпечення (від англ. proprietary software), на яке зберігаються як немайнові, так і майнові авторські права, до вільного, автори і
власники якого дозволяють вивчати, модифікувати і поширювати свій продукт. Крім
зменшення витрат на інформатизацію, основними перевагами вільного ПЗ є також
усунення залежності від одного постачальника, безпечність, висока швидкість
розробки нових релізів та випуску нових поправок і програмних продуктів. Цілою
низкою країн визнано необхідність використання вільного ПЗ у державному секторі
та сфері освіти.
До вільного ПЗ належить, зокрема, Ubuntu — операційна система для використання на ПК,
ноутбуках і серверах. Ubuntu побудовано на основі Debian
GNU/Linux - популярного дистрибутиву GNU/Linux. Вона містить офісний
пакет для роботи з текстами, електронними таблицями та презентаціями, програми
для спілкування в Інтернет і багато інших. Важливо те, що система GNU - не
єдиний статичний набір програм: користувачі можуть вибирати різні пакети згідно
своїх бажань. Одним із офіційних відгалужень Ubuntu є проект Lubuntu, метою створення якого є легковісний
енергоефективний дистрибутив з малим споживанням ресурсів. Первинне тестування
показало, що в порівнянні з Ubuntu, Lubuntu використовує майже вдвічі менше
пам'яті при звичайній установці на настільному комп'ютері та майже втричі менше
при завантаженні з LiveCD.
Для потреб
економіко-математичного моделювання, зокрема, кореляційно-регресійного аналізу,
зручно використовувати пакет GNUmeric - вільний табличний процесор, що входить у базову
поставку Lubuntu. Він випускається під ліцензією GNU General Public License і підтримується на GNU/Linux, Mac OS X (PowerPC), Microsoft Windows, ReactOS, SkyOS,
BeOS та інших ОС. GNUmeric
може взаємодіяти з іншими програмами табличних обчислень. Крім типових функцій
табличних обчислень, в нього входить великий набір додаткових функцій, таких як
рішення лінійних і нелінійних рівнянь, статистичний аналіз і інженерні
розрахунки. Проект має ряд особливостей: не перевантажений інтерфейс, розширені функції для
телекомунікацій і фінансів, велика кількість вбудованих
інженерних та статистичних функцій, висока якість діаграм та широкі можливості
їх форматування та експорту в різні графічні формати, відсутність обмежень
кількості листів у файлі, можливість зміни кольору тексту для імен листів ЕТ,
можливість форматування окремих елементів тексту в комірках ЕТ, створення
користувацьких функцій на мовах Perl та Python і
т.д. Пакет надає засоби для імпорту та
експорту таблиць у форматах MS Excel і OpenOffice та забезпечує повну
сумісність з Excel на рівні доступних функцій.
GNUmeric використовує власний
формат даних (*.gnumeric), але список підтримуваних форматів досить великий (MS
Excel, HTML, OpenDocument, CSV, TSV, DIF та ін.). Функціональність GNUmeric
може бути значно розширена за рахунок використання додаткових модулів. Зважаючи на компактність та високу швидкодію, GNUmeric часто включають до складу різних LiveCD – ОС для завантаження зі
змінного носія (CD, DVD, USB-накопичувач і т. д.).
Із використанням пакету GNUmeric ОС
Lubuntu проведено кореляційно-регресійний аналіз виробництва
соняшника у Дніпропетровській області. По даним офіційного веб-сайту dneprstat.gov.ua Головного управління статистики області за 1996-2012 роки побудовано
економетричну модель залежності середніх цін реалізації сільськогосподарськими
підприємствами (крім малих) соняшника (У,
грн. за т) від його посівних площ (Х1,
тис. га) та урожайності (Х2,
ц з 1 га площі збирання). Для того, щоб деяким чином уникнути випадкових
коливань рівнів рядів динаміки, вихідні дані вирівняно за допомогою тричленної
рухомої середньої. Рівняння відповідної лінійної регресії, отримане згідно з
даними вибіркової сукупності за допомогою
інструменту «Регрессия» (Gnumeric → Статистика → Зависимые
наблюдения → Регрессия), має вид:
Yx = -3727,95 +
3,74x1 + 255,37x2.
Аналіз тісноти зв’язку між ознаками показує
існування сильної додатної кореляції: коефіцієнт множинної кореляції Ryx1x2=0,96. Множинний коефіцієнт детермінації R2yx1x2=0,914, тобто 91,4% варіації У
визначаються варіацією Х1
та Х2, а 8,6% варіації У пояснюються дією не включених до регресійної
моделі факторів. Оцінка значущості коефіцієнтів регресії по t-розподілу Стьюдента показує їх
статистичну значущість на рівні значущості a=0,05: ti > t(12;0,05)=2,179. Оцінка значущості рівняння регресії в
цілому за допомогою F-критерію Фішера
дозволяє зробити висновок, що регресійна модель адекватна: розраховане значення
F = 63,4, критичне значення F(2;12;0,05) = 3,88, отже, F > F(2;12;0,05). За допомогою інструменту «Корреляция» (Gnumeric →
Статистика → Описательные статистики → Корреляция) отримано
наступні значення коефіцієнтів парної кореляції: ryx1=0,78; ryx2=0,89; rx1x2=0,54. Таким чином, існує тісний лінійний зв’язок усіх
незалежних факторів із залежною змінною.
Точковий
прогноз одержано при підстановці прогнозних значень факторних ознак у рівняння
регресії, наприклад, yx(533,7;
17,1)=2645,5. Інтервальний прогноз визначає нижню та верхню границі проміжку, в
якому знаходиться істинне значення прогнозованої результативної ознаки: yx=2645,5±Sостt(12;0,05) = 2645,5±602,7, тобто (2042,9; 3248,2).
На базі зазначених даних вибіркової сукупності побудована
також нелінійна двофакторна регресія, яка виявилась статистично не значущою. Необхідно
зауважити, що застосована у проведених розрахунках вибірка не є
репрезентативною, і зроблені висновки умовні.