Запись DSML Reading Club #2 уже на канале!

17 мая 2025 г. в 13:45

Открыть в Telegram
News image
Запись DSML Reading Club #2 уже на канале!

Ануар Таскынов рассказал про Visual Geometry Grounded Transformer

VGGT — это foundation-модель нового поколения для задач 3D компьютерного зрения. Она способна по одному, нескольким или даже сотням изображений сцены сразу предсказывать ключевые 3D характеристики: параметры камеры, карты глубины, плотные облака точек и трекинг в 3D.

В отличие от традиционных подходов, VGGT работает как единая универсальная модель без необходимости в сложной постобработке, оставаясь при этом быстрой (менее 1 секунды на реконструкцию) и точной — она показывает SOTA-результаты по нескольким 3D задачам.

Хост семинара: Еламан Абдуллин
Скачать презентацию

Смотреть видео: youtube.com/watch?v=TVZoU1m5WKI

Comments

Member discussion for this news item or vacancy.

Checking sign-in status...