В этом видео расскажем как нейросеть может помочь превращать фотографии в 3D модель, используя технологию глубокого обучения. На мой взгляд это самая популярная сегодня задача Deep Learning: генерации 3D-объектов из одного двухмерного изображения.
Я могу использовать обученную нейросеть, которая способна распознавать объекты на фотографии и создавать трехмерные модели этих объектов. Для этого нейросеть обучается на большом количестве фотографий, на которых изображены различные объекты, и затем она может использовать эту информацию для создания трехмерных моделей этих объектов.
Нейросеть PIFU - это алгоритм машинного обучения, который позволяет создавать 3D-модели человека на основе одной фотографии.
Нейронная сеть, называемая генеративно-состязательной сетью (GAN), может быть обучена для преобразования двухмерных изображений в трехмерные модели. В данном случае нейросеть использует маску глубины изображения для определения глубины каждого пикселя на изображении. Затем эта информация используется для создания трехмерной модели, которая включает в себя текстуры и цвета, соответствующие исходному изображению.
Нейросети способны не только создавать 3D модели из изображений, но и по текстовому описанию. Создание 3d моделей по текстовому описанию было лишь вопросом времени. Компания OpenAI создала генеративную нейросеть Shap-E, которая способна преобразовывать текстовые промты в 3D-модели.