Автоматизированный фоносемантический и контент-анализ

Часть 1: Фоносемантический анализ

Текст 1: Михаил Прившин — Лоси. Художественный рассказ, краткое содержание: "Охотник-дед рассказал, как однажды встретил в реке лосиху с двумя лосятами. Хотя сначала он хотел её застрелить, вид того, как малыши тонут в грязи и отстают, заставил его передумать. Когда дед показался, лосиха не убежала, а яростно пошла на него, защищая детей. Выбравшись на берег, лосята сразу начали играть. Эта картина материнской любви и детской беззаботности так тронула старика, что он забыл об охоте и просто наблюдал, как они спокойно уходят в лес"



Текст 2: Виталий Бианки — Неизвестный зверь. Художественный рассказ, краткое содержание: "Колхозник в лесу нашёл в яме странного зверя и ударил его топором. Он принёс его домой, но никто не мог опознать. Пока колхозник ходил за лесником, зверь очнулся, вырвался и убежал. Лесник объяснил, что это барсук безобидный лесной житель, который питается кореньями и лягушками. Дети пожалели, что не угостили его печёной картошкой"



Тексты схожи по тематике, но имеют разный посыл. Текст 2 (Бианки) воспринимается программой более негативно, поскольку в нём описывается насилие, присутствует много восклицаний и много заведомо негативных слов (стукнул, клыкастый, хищные и пр.). Текст 1 (Прившина) напротив - содержит большое количество слов, воспринимающихся позитивно (хорошенькие, спокойно, удивился и пр.)

Часть 2: 
На мой взгляд, word cloud точнее отражает содержание текста, поскольку в нём можно увидеть ключевые слова. А модель текста, как мне показалось, указала на самые частые слова. Так как текст художественный, он наполнен междометиями, предлогами и связующими словами. Модель получилась неточной, не отражающей смысл текста. Легче было бы определить тематику текста через word cloud
Текст 1

Текст 2
    


Комментарии

Популярные сообщения из этого блога

Eye-Tracking анализ

Невключенное наблюдение (видеоконтент)