Эмбеддинги Word2Vec, GloVe, FastText, SentenceBERT. Метод TF-IDF. Токенизация BPE и WordPiece
Материалы к видео:
Больше материалов по NLP: Ml16EbQoepcwMGNi
00:00 - зачем нужны эмбеддинги?
00:47 - one-hot encoding
01:51 - Word2vec
04:23 - GloVe
07:54 - FastText
09:21 - ELMo
11:09 - BERT
12:22 - tf-idf
15:27 - Sentence Transformers
18:05 - BPE
20:32 - WordPiece