Современные информационные технологи/3. Программное обеспечение

 

 

К.е.н. Чистякова В.Ф., Калашнікова Н.К., Герасимова І.Г.

 

Дніпропетровський державний аграрний університет, Україна

 

Можливості використання вільного програмного забезпечення при статистичній обробці даних

 

 

Статистичний аналіз масових явищ і процесів є необхідною ланкою в системі управління економікою та державою в цілому. Стохастична природа економічних, екологічних, агроекологічних даних обумовлює необхідність застосування методів математичної статистики для їх обробки та аналізу.

А тому важливою складовою професійної підготовки спеціаліста будь-якого напрямку діяльності є оволодіння багатим арсеналом методів статистичної обробки даних з використанням комп'ютерних технологій для проведення аналізу впливу випадкових факторів та прийняття рішень, які мають ймовірнісну основу. Розділ «Теорія ймовірностей та математична статистика» є складовою навчальних планів підготовки спеціалістів практично всіх природничих, технічних та гуманітарних напрямків освіти у вищих навчальних закладах.

Потужні комп’ютерні засоби і ефективне програмне забезпечення, в тому числі спеціалізовані програми статистичного аналізу даних, зробили складний апарат математичної статистики доступним широкому колу спеціалістів різних галузей науки та практичної діяльності та простим у використанні. Інформаційне освітнє середовище є важливим чинником, що забезпечує необхідну якість освіти і надає необхідні умови для розвитку всіх суб'єктів освітнього процесу.

Багато років табличний процесор Microsoft Excel вважався стандартом інформаційної підготовки студентів. Оснащений засобами статистичної обробки даних, він містить в собі такі процедури як засоби описової статистики, критерії відмінності, кореляційні, регресійні та інші методи. Перевагою цього програмного продукту є також його широка розповсюдженість. До недоліків відносяться немала вартість продукту, обмеження ліцензії, використання закритих форматів зберігання інформації, а також регулярна зміна цих форматів з проблемами сумісності старих версій і нових форматів.

Недостатнє фінансування освітніх установ змушує шукати рішення, що надають можливість заощадити під час купівлі обладнання, а вже купівля ліцензійного програмного забезпечення є достатньо великою проблемою. Найбільш очевидним способом розв’язання даної проблеми є використання безкоштовного і вільно поширюваного програмного забезпечення.

Окрім цього останнім часом в суспільстві помітно проявилися і загальні тенденції, пов'язані з підвищенням уваги до ліцензійної чистоти використовуваних програм, вимогами застосовувати при зберіганні інформації сертифіковані формати, і при цьому стали поширюватися програмні продукти із відкритим кодом. Вільне ПО розповсюджується з дозволом кожному використовувати, копіювати і поширювати його, як в точності, так і з модифікаціями, безоплатно (тобто дарма) або за плату. Зокрема, це означає, що мають бути доступні початкові тексти програм.

На сьогоднішній день викладачі мають десятки або навіть сотні вільних програм, які допоможуть їм у викладанні різноманітних дисциплін. Так, наприклад, замість ОС Windows можна використовувати Linux, замість офісного пакета Microsoft Office можна комфортно користуватись OpenOffice, який дозволить не тільки зберегти сумісність з форматом даних Microsoft Office, а і використовувати даний функціонал під операційною системою як Windows, так і Linux.

До складу вбудованих функцій OpenOffice.org Calc входять функції категорії статистичні, їх можна використовувати у формулах для складного аналізу даних, обчислювати показники описової статистики, F- та T- тести. При ознайомленні студентів з основними поняттями математичної статистики в курсі інформатики доцільно буде вивчення функцій, які програмують показники описової статистики, наприклад, MAX, MIN, AVERAGE, MEDIAN, MODE, COUNT, VAR, STDEV, CORREL.

Побудову регресійного рівняння прямої методом найменших квадратів та його використання в практичній діяльності можна продемонструвати функціями INTERCEPT, SLOPE та FORECAST, які підбирають пряму лінію до масиву даних, а також знаходять відповідно точку перетину прямої з віссю Oy, її нахил, та прогнозовану точку на ній.

Можливості обробки даних значно розширюються, якщо використати засоби макропрограмування, які автоматизують окремі процедури та полегшують роботу користувача. При цьому тут підтримується версія мови програмування Basic, є вбудована можливість, окрім створення і застосування макросів, ще й написання власних підпрограм і модулів.

Таким чином, якщо мова йде про початкове вивчення OO Calc.org, яке не потребує глибокого аналізу даних, то це саме та програма, яка стане альтернативою MS Excel. Але для більш поглибленої деталізованої обробки статистичних даних однієї програми OO Calc.org недостатньо, оскільки в ній немає можливості автоматичного застосування перевірки адекватності і статистичної значимості побудованої економетричної моделі на базі статистичних даних. Таку можливість можуть надати електронні таблиці Gnumeric з проекту GNOME Office.

В меню Сервіс електронної таблиці Gnumeric вбудовано команду Статистичний аналіз (Statistical Analysis) для проведення статистичного аналізу табличних даних, зокрема є набір інструментів з такими можливостями:

·          однофакторний та двофакторний дисперсійний аналіз;

·          обчислення кореляції та коваріації;

·          знаходження характеристик описової статистики;

·          прогнозування методами експоненціального згладжування та ковзкого середнього;

·          побудова частотних таблиць і гістограм;

·          Фур'є-аналіз;

·          обчислення рангів, розміщень і персентилів;

·          здійснення регресійного аналізу;

·          групування вибірок за періодичним або випадковим законами розподілів;

·          порівняння середніх значень двох рівних вибірок (t-тест), двох нерівних вибірок з рівними дисперсіями (t-тест), двох нерівних вибірок з нерівними дисперсіями (t-тест), двох вибірок з відомими дисперсіями (z-тест);

·          порівняння дисперсії двох вибірок (f-тест).

Крім того, в Gnumeric можна будувати кореляційні матриці будь-якої вимірності.

Таким чином, якщо потрібно поглибити та деталізувати аналіз даних, виконаний у OO Calc.org, то можливо зберегти їх у форматі *.gnumeric та застосувати інструментарій електронних таблиць Gnumeric.

Проте слід зазначити, що в обох пакетах вищеописаних програм немає поліноміального типу лінії тренду на відміну від MS Excel, тому економічний аналіз з точки зору макро- або мікроекономіки не може бути повним. Разом з тим процесор ЕТ OpenOffice.org Calc підтримує імпорт, обробку і збереження даних у форматах файлів процесора ЕТ Microsoft Excel – файлах формату *.xls.

Окрім економії значних коштів, які у випадку використання пропрієнтарного програмного забезпечення скеровувались на придбання ліцензій, використання вільного програмного забезпечення дає змогу українським фахівцям долучитися до розробки вільного програмного забезпечення (у тім числі і його українізації), що у випадку використання пропрієтарного програмного забезпечення просто неможливо. Вільне програмне забезпечення дає можливість учням вивчати, як воно працює.

Недостатнє фінансування освітніх установ змушує шукати рішення, що надають можливість заощадити під час купівлі обладнання, ліцензійного програмного забезпечення. Найбільш оптимальним способом розв’язання даної проблеми є використання безкоштовного і вільно поширюваного програмного забезпечення.

Враховуючи посилення ситуації з контролю за ліцензійною чистотою, використання ліцензійного програмного забезпечення, яке не потребує істотних вкладень, стає все більш актуальним питанням.

Останнім часом, розробники програм намагаються забезпечити підтримку повнофункціональних електронних таблиць та простий перехід для окремих користувачів і організацій від програм, що вимагають для використання ліцензії, до альтернативних.

Але не можна не сказати про недоліки вільного програмного забезпечення, до яких відносяться: відсутність підтримки розробників, менша сфера функціональності, а також значно менша популярність серед користувачів і високі вимоги до рівня фахівців, котрі займаються впровадженням і підтримкою використання програмних засобів. Але вільне програмне забезпечення дає свободу в керуванні комп’ютерами, на відміну від пропрієтарного (власницького) дає можливість вивчати самі програми і виступає опосередкованим стимулюючим фактором до навчання.

На сьогоднішній день багатьма країнами визнано доцільність використання вільного ПЗ в державному секторі та сфері освіти. Вільне програмне забезпечення містить у собі чималу кількість важливих, у тому числі й стратегічних, переваг, чи не найголовнішою серед яких є можливість суттєвого заощадження бюджетних коштів. Проте нормативна неврегульованість, недостатня обізнаність населення стосовно його переваг, а також доволі спорадичні та несистемні згадки про нього у вітчизняних медіа є найголовнішими причинами інерційності користувачів у даному питанні.