Обработка естественного языка (NLP) посредством spaCy и Python | Курс для начинающих | Эпизод 4
В этом видео.
* Распознавание именованных сущностей.
- Распознавание именованных сущностей NER - важная задача в NLP. Визуализация и анализ извлеченных данных. Атрибуты токена для извлечения и анализа информации.
- Обсуждение основных элементов spaCy и машинного обучения. Важность понимания машинного обучения для работы с текстом.
* Векторы слов.
- Объяснение важности векторов слов для понимания текста.
- Векторы слов как числовые представления слов (эмбеддинги) в многомерном пространстве. Использование векторов слов для анализа текста. Преимущества многомерного представления слов перед одномерным.
- Обучение векторов слов. Использование больших коллекций текстов для понимания смысла слов. Важность понимания векторов слов для работы с NLP.
- Использование векторов слов в spaCy, демонстрация на примерах.
- Сходство векторов слов не определяет их синонимичность. Вычисление коэффициента сходства между объектами в spaCy через встраивание слов и предсказание биграмм. Использование эмбеддингов. Пример расчета сходства документов.
• Автор: Dr. William Mattingly, канал (@freecodecamp)
• Переводчики: Алексей Баврин, Екатерина Рубан
• Редактор и чтец: Евгений Бартов
• Оригинальное видео:
---
Записаться на курсы переводчиков/учебную практику; заказать перевод/редактуру: ,