Автоматизированный фоносемантический и контент-анализ

октября 31, 2025

Часть 1: Фоносемантический анализ

Текст 1: Михаил Прившин — Лоси. Художественный рассказ, краткое содержание: "Охотник-дед рассказал, как однажды встретил в реке лосиху с двумя лосятами. Хотя сначала он хотел её застрелить, вид того, как малыши тонут в грязи и отстают, заставил его передумать. Когда дед показался, лосиха не убежала, а яростно пошла на него, защищая детей. Выбравшись на берег, лосята сразу начали играть. Эта картина материнской любви и детской беззаботности так тронула старика, что он забыл об охоте и просто наблюдал, как они спокойно уходят в лес"

Текст 2: Виталий Бианки — Неизвестный зверь. Художественный рассказ, краткое содержание: "Колхозник в лесу нашёл в яме странного зверя и ударил его топором. Он принёс его домой, но никто не мог опознать. Пока колхозник ходил за лесником, зверь очнулся, вырвался и убежал. Лесник объяснил, что это барсук безобидный лесной житель, который питается кореньями и лягушками. Дети пожалели, что не угостили его печёной картошкой"

Тексты схожи по тематике, но имеют разный посыл. Текст 2 (Бианки) воспринимается программой более негативно, поскольку в нём описывается насилие, присутствует много восклицаний и много заведомо негативных слов (стукнул, клыкастый, хищные и пр.). Текст 1 (Прившина) напротив - содержит большое количество слов, воспринимающихся позитивно (хорошенькие, спокойно, удивился и пр.)

Часть 2:

На мой взгляд, word cloud точнее отражает содержание текста, поскольку в нём можно увидеть ключевые слова. А модель текста, как мне показалось, указала на самые частые слова. Так как текст художественный, он наполнен междометиями, предлогами и связующими словами. Модель получилась неточной, не отражающей смысл текста. Легче было бы определить тематику текста через word cloud

Текст 1