
Компания Apple представила инновационное решение в области искусственного интеллекта, позволяющее создавать трёхмерные сцены на основе одного плоского изображения. Эта технология значительно ускоряет процесс генерации 3D-моделей и обеспечивает их реалистичность.
Новая технология от Apple
Исследование, опубликованное Apple под названием «Чёткий монокулярный синтез изображения менее чем за секунду», описывает, как модель SHARP создаёт 3D-сцены, используя метод гауссовской развёртки. Традиционно для подобных задач требуются десятки или даже сотни снимков с различных ракурсов, но SHARP справляется с этой задачей, имея всего одно изображение и выполняя все вычисления за один проход нейросети.
Технические детали и ограничения
Модель SHARP обучена на обширном массиве синтетических и реальных данных, что позволяет ей понимать и анализировать закономерности глубины и геометрии в различных сценах. На основе полученной фотографии SHARP прогнозирует положение и внешний вид трёхмерных «колоколов Гаусса», создавая тем самым полное трёхмерное представление сцены. Однако методика имеет свои ограничения: невидимые части сцены не дорисовываются, что ограничивает возможности изменения точки обзора.
Практическое применение и перспективы
Apple опубликовала исходный код модели SHARP на GitHub, что открывает возможности для её дальнейшего изучения и применения в индустрии. Примечательно, что модель может работать не только со статическими изображениями, но и с видеофайлами, что расширяет её применение в различных областях, включая виртуальную реальность и игры.
Таким образом, новаторская технология от Apple открывает новые горизонты в сфере 3D-моделирования, делая его более доступным и быстрым. Это может привести к значительным изменениям в подходах к созданию контента и его визуализации.



