Практическое занятие по обработке текста в gensim с помощью алгоритма word2vec

Яндекс организует семинар Льва Константиновского, посвящённый обработке текста. Лев Константиновский — специалист по анализу текста, программирует на Python и Java. Получил большой опыт в финансовых учреждениях. Менеджер исследований и разработки в RaRe Technologies. Также является комьюнити-менеджером в open source проекте Gensim, где участвует в разработке одноимённой библиотеки алгоритмов машинного обучения для понимания естественных языков. Автор прочтёт практическое введение в обработку текстов, написанных на естественных языках с помощью open source приложения gensim, познакомит участников с теорией алгоритма word2vec. Слушатели смогут научиться автоматически привязывать теги к документам на примере жанров и киносценариев. Также рассмотрят семь разных алгоритмов обработки текста: word2vec, doc2vec и другие.
Back to Top