Білоніжка І.С., викладач
Національний
технічний університет України «Київський політехнічний інститут імені І.
Сікорського»
АНАЛІЗ ТОНАЛЬНОСТІ
ТЕКСТУ
(СЕНТИМЕНТ-АНАЛІЗ)
Аналіз тональності тексту є полем дослідження, яке аналізує думки
людей, настрої, оцінки, ставлення і емоції, виражені за допомогою писемної
мови. Це один з найбільш активних напрямків досліджень в області комп’ютерної обробки
природної мови.
Питанню аналізу тональності тексту присвячували свої
роботи наступні науковці: Котельніков Є.В., Клевнікова М.В., Prawobo R., Therwall M.
Актуальність. Насправді це дослідження поширилось за межі лінгвістичних і комп'ютерних наук в соціальні та інші галузі
науки через його важливість для суспільства в цілому та бізнесу. Зростаюча
важливість аналізу настроїв збігається із поширенням соціальних медіа: обговорення
на форумах, коментування, відгуки та огляди, блоги, мікроблоги, Twitter і соціальні мережі
стають все більш популярними. Вперше в історії людства ми тепер маємо
величезний обсяг даних, записаних у цифровій формі для аналізу.
Системи аналізу тональності тексту застосовуються
практично у всіх бізнес - і соціальних сферах, тому що думки мають вирішальне
значення для майже всіх видів людської діяльності. Наші переконання і
сприйняття дійсності, вибори, які ми робимо, багато в чому обумовлені тим, як
інші бачать і оцінюють світ. З цієї причини, коли нам потрібно прийняти
рішення, ми часто шукаємо або запитуємо думки інших. Це справедливо не тільки
для людей, а й для організацій.
Аналіз
тональності тексту застосовується у рекламі, маркетингу для аналізу
відгуків покупців
на продукти
на послуги, у медіа-індустрії, соціології, політології
для збору даних (наприклад, політичних поглядів виборців)
тощо.
Під визначенням тональності тексту мають на увазі
виділення фрагментів тексту, що виражають позитивну чи негативні емоційність у
ставленні до об’єкта емоційної оцінки (об’єкта тональності).
Об’єктом може виступати як власна назва, так і назва
продукту (наприклад, найменування бренду), організації, послуги по відношенню
до якого аналізується текст.
Таким чином, тональність тексту зумовлена такими трьома
факторами:
1.
Суб’єкт тональності - це автор тексту, рецензії, коментаря і т.д.
2.
Тональна оцінка – це емоційне ставлення автора до об’єкта тональності,
виражене у використанні специфічної лексики при написанні тексту.
Використовуючи комп’ютерні засоби аналізу тексту можна отримати наступні
оцінки: позитивна тональність, негативна тональність, нейтральна.
3.
Об’єкт тональності – продукт, подія, персона чи явище, про які
висловлюється автор.
Оцінка тональності текстів призначена для отримання зворотнього
зв’язку між споживачами послуги і виробниками послуги.
Отже,
аналіз тональності є одним з напрямків в автоматизованому аналізі текстів. Під
тональністю тексту або розуміється позитивне або негативне ставлення його автора до об’єкта,
що фігурує в тексті. Будь-який користувач мережі Інтернет може залишати свої
відгуки про товар або послугу, висловлювати думку про людей і події. Фактори, що
зумовлюють тональність
тексту –
це суб’єкт та об’єкт тональності та
тональна оцінка.
Подальші вивчення можуть бути присвячені
дослідженню та аналізу обробки текстів за допомогою програмного забезпечення
(наприклад, Text Analysis,
доступний у Google docs, SentiStrength тощо).
Література:
1. Bing Liu.
Sentiment Analysis and Opinion Mining, Morgan & Claypool Publishers, May 2012.