Я работаю над небольшим (200 МБ) корпусом текста, который я хочу изучить с помощью некоторого кластерного анализа. Какие книги или статьи на эту тему вы бы порекомендовали?
Я работаю над небольшим (200 МБ) корпусом текста, который я хочу изучить с помощью некоторого кластерного анализа. Какие книги или статьи на эту тему вы бы порекомендовали?
Возможно, стоит взглянуть на книги М. В. Берри:
Они состоят из серии прикладных и обзорных работ. Последняя версия доступна в формате PDF по следующему адресу: http://bit.ly/deNeiy .
Вот несколько ссылок, связанных с CA в применении к интеллектуальному анализу текста:
Вы также можете взглянуть на скрытый семантический анализ , но посмотрите на мой ответ: проработка проблемы кластеризации .
Поиск групп в данных. Введение в кластерный анализ от профессоров Леонарда Кауфмана и Питера Дж. Руссеу.
Я читаю книгу и считаю ее очень полезной, потому что:
Нашей целью было написать прикладную книгу для обычного пользователя. Мы хотели сделать кластерный анализ доступным для людей, которые не обязательно имеют сильный математический или статистический опыт.
Он предоставляет теоретическое содержание для понимания функций, доступных в R
пакете Cluster .
Главы могут быть прочитаны индивидуально согласно кластерному методу.
исключением является глава 3, которая построена на главе 2
Главы книги:
Ссылки:
Kaufman, L. & Rousseeuw, PJ (2005). Поиск групп в данных. Введение в кластерный анализ (с. 342). John Wiley & Sons Inc.
Maechler, M. (2013). Кластерный анализ Extended Rousseeuw et al. КРАН.
Эта глава Введение в интеллектуальный анализ данных доступна онлайн и дает хороший обзор.
источник
Кластерный анализ Брайана С. Эверитта - это прекрасная книга по кластерному анализу.
источник
Не совсем о текстовом майнинге, но мне очень понравился «Исследовательский анализ данных с помощью MATLAB» Мартинеса и Мартинеса.
источник
Еще одна углубленная книга, на которую стоит обратить внимание: Справочник кластерного анализа , Hennig et al. (2015)
источник