Распознавание образов и машинное обучение. Чтение 33. Сети смешанных распределений. Байесовский вывод
1. На практике часто приходится иметь дело с данными из мультимодальных распределений, иными словами, когда выходные целевые значение не зависят функционально от входных векторов: одному X может соответствовать несколько t. Бесхитростные нейросети, предсказывающие t непосредственно по X, будут плохими моделями в таких ситуациях.
Но можно сконструировать нейросеть, предсказывающую не сами целевые значения, а параметры смеси нормальных распределений этих целевых значений. У нейросети, описывающей такое распределение, должны быть три группы значений в выходном векторе: центры распределений, их дисперсии и их веса в смеси. Немного любви требуется последним -- весам смеси, -- чтобы они вели себя как вероятности. Но мы знаем, что с этим делать: softmax-кодирование -- наше всё. Остаётся взять в качестве ошибки минус логарифм функции правдоподобия такого распределения, а дальше -- дело техники. На примере мы убеждаемся, что такого рода нейросети лучше аппроксимируют наборы данных с нефункциональными зависимостями.
2. Начинаем работать с нейросетями байесовскими методами. Дело это для нас уже не хитрое, но всё ещё требующее высокой техники. С благословения Томаса Байеса вводим априорное распределение для весов нейросети (нормальное, а какое же ещё?), правдоподобие используем тоже нормальное с центром (математическим ожиданием), задаваемым функцией нейросети. Здесь мы поступаем в точности так же, как в случае с линейными моделями регрессии и классификации. Далее необходимо максимизировать апостериорное распределение параметров. Методами оптимизации довольно легко найти набор параметров нейросети, который послужит центром постериорного распределения.
Но на этом наборе параметров будет достигаться лишь локальный максимум. Проблема в том, что нейросеть, которая функцией входит во все эти вероятности не является линейной. Поэтому, апостериорное распределение не будет нормальным, и в большинстве случаев окажется мультимодальным. Поэтому нам придётся приближать его методом Лапласа.
Но и на этом трудности не заканчиваются, потому что для вычисления предсказывающего распределения нужно интегрировать распределения, в которые снова будет входить нелинейная функция нейросети. Здесь мы прибегаем к адвокатской помощи Брука Тейлора, который помогает свести задачу к линейной в малой окрестности обнаруженных максимизацией апостериорного распределения параметров нейросети.
#теорвер и #machinelearning, #иммуроран и прикладной #матан
1 view
404
130
4 years ago 00:13:37 508.7K
Как работают системы распознавания лиц и образов?
1 year ago 00:00:18 1.9K
Распознавание лица. Образы
5 months ago 00:39:49 1
Искусственный интеллект, ChatGPT и распознавание образов / Шелия Губерман
5 years ago 00:01:00 1.7K
Уникальная российская разработка позволила ускорить в 10 раз распознавание образов нейросетью
8 months ago 01:18:39 262
Распознавание образов и машинное обучение. Чтение 34. Байесовское обучение нейросетей
7 months ago 01:01:58 47
Распознавание образов и машинное обучение. Чтение 36. Разнообразие ядер
3 years ago 00:01:27 2.2K
Классная иллюстрация того, как работают свёрточные нейронные сети (CNN) для распознавания образов
3 years ago 01:21:30 149
Семинар 4 (Распознавание образов, теория информации).
8 years ago 00:24:24 3.8K
Распознавание образов. Персептрон // Валерий Опойцев
7 months ago 00:50:02 291
Распознавание образов и машинное обучение. Чтение 41. Гауссовские процессы: классификация, или no pain, no gain
7 months ago 01:14:33 30
Распознавание образов и машинное обучение. Чтение 38. Гауссовские процессы
6 years ago 00:01:38 3.1K
Распознавание образов при помощи AI
1 year ago 01:01:16 154
Распознавание образов и машинное обучение. Чтение 20. Многоклассовый ИНКП. Пробит-регрессия
7 months ago 01:06:01 40
Распознавание образов и машинное обучение. Чтение 39. Регрессия через гауссовский процесс
3 years ago 00:01:15 2.6K
Распознавание образов в технических системах | ИППТ
10 months ago 00:34:00 5
Cyberpunk 2077 ➪ # 78) Распознавание образов
2 years ago 01:10:02 40
РО_Л3
5 years ago 00:51:40 2.7K
И.В. Бондарь “Распознавание образов“
2 years ago 00:01:30 4.8K
Программирование дронов: полет и распознавание образов
4 years ago 00:03:51 18K
Распознавание видеопотока в SimInTech
8 months ago 00:59:07 57
Распознавание образов и машинное обучение. Чтение 35. За пределами нейросетей: ядерные методы