Корпусная лингвистика

Лекция “Корпусная лингвистика“ Лектор: Пиперски Александр Чедович к.ф.н., ведущий научный сотрудник учебно-научной лаборатории социолингвистики ФГБОУ ВО “Российский государственный гуманитарный университет“. Автор книги “Конструирование языков: от эсперанто до дотракийского“. Одним из важнейших инструментов современной лингвистики являются языковые корпуса — большие оцифрованные собрания текстов, с помощью которых можно исследовать разные особенности языкового употребления. Современный русский язык представлен множеством легко доступных корпусов, которые позволяют узнать много интересных вещей о том, как реально функционирует язык, как он меняется и чем отличается от предписаний, которые мы находим в словарях и грамматиках. 1. Методы лингвистического исследования: интроспекция, эксперимент, наблюдение над реальностью — в свете противопоставления языка и речи. 2. Лингвистические корпуса как инструмент наблюдения над речевой реальностью. 3. История создания лингвистических корпусов русского языка. 4. Обзор основных существующих корпусов русского языка: Национальный корпус русского языка, ruTenTen, Araneum Russicum, Генеральный интернет-корпус русского языка и др. 5. Уровни разметки корпусов 6. Стандарты морфологической разметки для русского языка. Снятие омонимии. 7. Подсчёт частотности по корпусам. Частотные словари. Закон Ципфа. 8. Проблемы разработки интернет-корпусов 9. Примеры исследований современного русского языка на материале корпуса Araneum Russicum Maximum. 10. Примеры исследований региональной вариативности русского языка на материале Генерального интернет-корпуса русского языка.
Back to Top