Лекция 10. Кластеризация: распространённые методы. Brown clustering

Лекция №10 курса «Введение в обработку естественного языка » (осень 2019). Преподаватель — Антон Михайлович Алексеев Страница лекции на сайте CSC: 21:13 На самом деле формула purity на слайде верна. Для каждого предсказанного кластера вычисляется мощность наибольшего пересечения с кластером из “истинных“. Затем эти величины не усредняются, а делятся на N — то есть число кластеризуемых объектов. 1:23:59 Речь о тексте Себастиана по мотивам EMNLP-2017. Вот он:
Back to Top