Обработка естественного языка (NLP) посредством spaCy и Python | Курс для начинающих | Эпизод 3
В этом видео.
Лингвистическая разметка.
* Работа с текстом и создание объекта Doc:
- Создание объекта Doc с использованием модели NLP.
- Различия между текстовым объектом и объектом Doc
- Итерация по текстовому объекту и объекту Doc
* Преимущества spaCy в работе с текстом:
- Разбивка текста на символы
- Автоматическое удаление знаков препинания из токенов
- Чёткое определение границ предложений
- Сегментация текста по предложениям с минимальным количеством кода
* Атрибуты токенов:
- Типы атрибутов и именованные сущности
- Наиболее востребованные типы
- Пример работы с атрибутами токенов
* Лемма и морфологический анализ. Идентификация частей речи.
* Анализ частей речи и зависимостей. Визуализация структуры предложений.
• Автор: Dr. William Mattingly, канал (@freecodecamp)
• Переводчик: Анна Бессонов
• Редактор и чтец: Евгений Бартов
• Оригинальное видео:
---
Записаться на курсы переводчиков/учебную практику; заказать перевод/редактуру: ,