ВЫЯВЛЕНИЕ ЗНАЧИМЫХ ТЕМ ПРИ ПОМОЩИ АЛГОРИТМА LDA НА МАТЕРИАЛЕ НЕМЕЦКОГО МЕДИАДИСКУРСА
DOI:
https://doi.org/10.21638/spbu33.2024.122Аннотация
Методы тематического моделирования позволяют получить представление о тематическом наполнении текстов и выявить скрытые семантические структуры. Каждый текст может быть представлен несколькими темами, таким образом также можно определить схожесть текстов и более широко — общие тенденции, характерные для текстов, нацеленных на конкретную аудиторию. Целью статьи является формирование круга тем, которые интересуют читателей, на материале современного немецкоязычного дискурса, посвященного разным сферам жизни. В работе продемонстрированы результаты построения нескольких моделей тематического моделирования при помощи алгоритма латентного размещения Дирихле (LDA) применительно к текстам немецкоязычных источников: журнала «Zeitschrift für Ideengeschichte», который посвящен вопросам истории и развития политических, религиозных, философских и литературных идей и мыслей, и студенческого периодического издания «Moritz. Magazin» Грайфсвальдского университета. Выделенные ключевые слова получили экспертную оценку. Результаты применения алгоритма LDA показывают, что с течением времени в журнале «Zeitschrift für Ideengeschichte» можно заметить переход от более узких тем к более широким. Проведенный анализ продемонстрировал достаточно низкую схожесть между текстами разных годов данного журнала, однако в рамках выборок одного года были выявлены похожие тексты согласно мере TF-IDF. Несмотря на первоначально заявленную разноплановость рассмотренных журналов, именно политическая составляющая является для них общей. Однако в издании «Moritz.Magazin» данная тема прослеживается более отчетливо, в то время как в статьях журнала «Zeitschrift für Ideengeschichte» политический настрой подается опосредованно через отсылку к определенным мыслителям и темам. В ходе исследования был предварительно определен перечень тем, интересующих представителей двух значимых кругов современной Германии, относящихся к образованному университетскому сообществу, и тем самым был описан некоторый идейный ландшафт страны.
Ключевые слова:
тематические маркеры, ключевые слова, латентное размещение Дирихле (LDA), медиадискурс, немецкий язык
Скачивания
Библиографические ссылки
Литература
References
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Условия передачи авторских прав на статьи и рецензии, опубликованные в ежегодном периодическом издании «Немецкая филология» регулируются условиями Лицензионного Договора автора с Санкт-Петербургским государственным университетом. В соответствии с Лицензионным Договором опубликованные материалы находятся в открытом доступе, а авторам бесплатно предоставляется неограниченные возможности их распространения и самостоятельного архивирования.