Сообщения

Сообщения за март, 2025

Практическое задание №5. Автоматизированный кластерный анализ

Изображение
1.  Для анализа я выбрала 10 новостных текстов из раздела "криминал" сайта 74.ru 2. Тексты разделились на две группы. В группе, выделенной голубым, оказались тексты, в которых содержалась информация об убийствах, а если конкретно - о непосредственно самих инцидентах. В другую же группу объединились тексты, в которых сообщалась о задержаниях преступников следователями. Такое разделение обусловлено общностью ключевых слов в текстах. 3. Число групп меняется при изменении уровня кластеризации. При смещении разделителя вправо - увеличивается, при смещении влево - уменьшается.

Практическое задание №4. Автоматизированный контент-анализ с моделью текста

Изображение
 Для анализа я выбрала две рецензии кинокритиков на фильм "Конклав", одну положительную и одну негативную.  Текст №1 Текст №2 И в первом, и во втором случае модель текста среди ключевых слов в основном выделяет предлоги, союзы и частицы, которые не дают чёткого понимания о содержании текста.  Word cloud же позволяет увидеть большое количество слов, по которым действительно можно судить о тематике текста. Поэтому определять тематику, на мой взгляд, легче и удобнее по методике Word cloud.

Практическое задание №3. Sentiment Analysis в социальных медиа

Изображение
 1. Alexander McQueen Соотношение позитивных упоминаний к негативным равняется 9:1. Преобладают позитивные и нейтральные  упоминания. Преобладает фотоконтент (45%), после него видеоконтент (28%) Ключевые слова дают понять, что больше всего пользователей интересует ретроспектива работ дизайнера 2. Gucci Соотношение позитивных упоминаний к негативным равняется 4:1. Преобладают позитивные и нейтральные  упоминания. Преобладает видеоконтент (38%), после него фото (35%) Ключевые слова дают понять, что больше всего пользователей интересуют определенные позиции из продукции бренда 3. Рената Литвинова Соотношение позитивных упоминаний к негативным равняется 1:2. Преобладают (хоть и всего на одну единицу) негативные упоминания и нейтральные. Преобладает фотоконтент (47%), после него с небольшим отрывом видеоконтент (44%) Ключевые слова дают понять, что больше всего пользователей интересуют участие Литвиновой в съёмках для брендов и известных изданий Вывод: Имя дизайнера и название...

Практическое задание №2. Структурный sentiment анализ информации с моделями MDS, ACM и оценкой дисперсии

Изображение
 Для проведения анализа я выбрала два текста одной направленности, но разной эмоциональной окраски. Это две рецензии на музыкальные альбомы. Первая - с негативной и сильно эмоциональной реакцией, вторая с позитивной, но более сдержанной. 1  2 Вывод: второй текст действительно более положительный, но менее эмоциональный, чем первый. Наиболее точную оценку, на мой взгляд, даёт модель MDS.