Білоніжка І.С., викладач

Національний технічний університет України «Київський політехнічний інститут імені І. Сікорського»

 

АНАЛІЗ ТОНАЛЬНОСТІ ТЕКСТУ

(СЕНТИМЕНТ-АНАЛІЗ)

 

Аналіз тональності тексту є полем дослідження, яке аналізує думки людей, настрої, оцінки, ставлення і емоції, виражені за допомогою писемної мови. Це один з найбільш активних напрямків досліджень в області комп’ютерної обробки природної мови.

Питанню аналізу тональності тексту присвячували свої роботи наступні науковці: Котельніков Є.В., Клевнікова М.В., Prawobo R., Therwall M.

Актуальність. Насправді це дослідження поширилось за межі лінгвістичних  і комп'ютерних наук в соціальні та інші галузі науки через його важливість для суспільства в цілому та бізнесу. Зростаюча важливість аналізу настроїв збігається із поширенням соціальних медіа:   обговорення на форумах, коментування, відгуки та огляди,  блоги, мікроблоги, Twitter і соціальні мережі стають все більш популярними. Вперше в історії людства ми тепер маємо величезний обсяг даних, записаних у цифровій формі для аналізу.
   Системи аналізу тональності тексту застосовуються практично у всіх бізнес - і соціальних сферах, тому що думки мають вирішальне значення для майже всіх видів людської діяльності. Наші переконання і сприйняття дійсності, вибори, які ми робимо, багато в чому обумовлені тим, як інші бачать і оцінюють світ. З цієї причини, коли нам потрібно прийняти рішення, ми часто шукаємо або запитуємо думки інших. Це справедливо не тільки для людей, а й для організацій.

Аналіз тональності тексту застосовується у рекламі, маркетингу для аналізу відгуків покупців на продукти на послуги, у медіа-індустрії, соціології, політології для збору даних (наприклад, політичних поглядів виборців) тощо.

Під визначенням тональності тексту мають на увазі виділення фрагментів тексту, що виражають позитивну чи негативні емоційність у ставленні до об’єкта емоційної оцінки (об’єкта тональності).

Об’єктом може виступати як власна назва, так і назва продукту (наприклад, найменування бренду), організації, послуги по відношенню до якого аналізується текст.

Таким чином, тональність тексту зумовлена такими трьома факторами:

1.     Суб’єкт тональності - це автор тексту, рецензії, коментаря і т.д.

2.     Тональна оцінка – це емоційне ставлення автора до об’єкта тональності, виражене у використанні специфічної лексики при написанні тексту. Використовуючи комп’ютерні засоби аналізу тексту можна отримати наступні оцінки: позитивна тональність, негативна тональність, нейтральна.

3.     Об’єкт тональності – продукт, подія, персона чи явище, про які висловлюється автор.

Оцінка тональності текстів призначена для отримання зворотнього зв’язку між споживачами послуги і виробниками послуги.

Отже, аналіз тональності є одним з напрямків в автоматизованому аналізі текстів. Під тональністю тексту або розуміється позитивне або негативне ставлення його автора до об’єкта, що фігурує в тексті. Будь-який користувач мережі Інтернет може залишати свої відгуки про товар або послугу, висловлювати думку про людей і події. Фактори, що зумовлюють тональність тексту – це  суб’єкт та об’єкт тональності та тональна оцінка.

  Подальші вивчення можуть бути присвячені дослідженню та аналізу обробки текстів за допомогою програмного забезпечення (наприклад, Text Analysis, доступний у Google docs, SentiStrength тощо).

Література:

1. Bing Liu. Sentiment Analysis and Opinion Mining, Morgan &  Claypool Publishers, May 2012.