Безопасность LLM.Данил Капустин

Подробно расскажу о существующих уязвимостях в больших языковых моделях (Large Language Models, LLM) — как в open-source, так и в проприетарных. Начну с обзора различных типов уязвимостей, которые могут возникнуть при использовании LLM. Далее выделю наиболее часто встречающиеся уязвимости и приведу примеры реальных атак, которые мы использовали для тестирования собственных и клиентских продуктов. Затем перейдем к ключевой теме доклада — обсуждению способов защиты от этих атак. Представлю текущие методы и подходы, которые могут использоваться для повышения безопасности LLM. Одна из ключевых идей моего выступления — это привлечение внимания сообщества к вопросам безопасности языковых моделей. Важно, чтобы исследователи и разработчики понимали серьезность этих угроз и работали над их предотвращением. Надеюсь, что доклад поможет поднять осведомленность о проблемах безопасности и вдохновит других на разработку продуктов с языковыми моделями, которые будут более безопасными и надежными.

25 views