Автоматизированный фоносемантический и контент-анализ
Часть 1: Фоносемантический анализ
Текст 1: Михаил Прившин — Лоси. Художественный рассказ, краткое содержание: "Охотник-дед рассказал, как однажды встретил в реке лосиху с двумя лосятами. Хотя сначала он хотел её застрелить, вид того, как малыши тонут в грязи и отстают, заставил его передумать. Когда дед показался, лосиха не убежала, а яростно пошла на него, защищая детей. Выбравшись на берег, лосята сразу начали играть. Эта картина материнской любви и детской беззаботности так тронула старика, что он забыл об охоте и просто наблюдал, как они спокойно уходят в лес"
Текст 2: Виталий Бианки — Неизвестный зверь. Художественный рассказ, краткое содержание: "Колхозник в лесу нашёл в яме странного зверя и ударил его топором. Он принёс его домой, но никто не мог опознать. Пока колхозник ходил за лесником, зверь очнулся, вырвался и убежал. Лесник объяснил, что это барсук безобидный лесной житель, который питается кореньями и лягушками. Дети пожалели, что не угостили его печёной картошкой"
Тексты схожи по тематике, но имеют разный посыл. Текст 2 (Бианки) воспринимается программой более негативно, поскольку в нём описывается насилие, присутствует много восклицаний и много заведомо негативных слов (стукнул, клыкастый, хищные и пр.). Текст 1 (Прившина) напротив - содержит большое количество слов, воспринимающихся позитивно (хорошенькие, спокойно, удивился и пр.)
Часть 2:
На мой взгляд, word cloud точнее отражает содержание текста, поскольку в нём можно увидеть ключевые слова. А модель текста, как мне показалось, указала на самые частые слова. Так как текст художественный, он наполнен междометиями, предлогами и связующими словами. Модель получилась неточной, не отражающей смысл текста. Легче было бы определить тематику текста через word cloud
Текст 1
Текст 2

Комментарии
Отправить комментарий