SOTA 논문 리뷰 3

LRM: LARGE RECONSTRUCTION MODEL FOR SINGLE IMAGE TO 3D 리뷰

Abstract 5초 이내 single 입력 이미지로부터 3D 모델 예측하는 최초의 lrm 제안함 NeRF를 직접 예측하기 위해서 학습 가능한 5억개의 매개변수를 갖춤 확장성 뛰어난 Transformer 기반의 아키텍처를 제안함 대규모 다중 뷰 데이터에 대해 end-to-end 방식으로 train함 일반화 가능한 모델 → 고품질 3D 재구성 생성 가능 1. Intro 임의 개체의 single 이미지에서 즉시 3D 모양을 만드는 것 3D geometry의 ambiguity 대문에 초기 학습 기반 방법은 class 데이터 활용해서 특정 범주에서 잘 수행되었었음 형태별 최적화(NeRF 최적화) 일관된 geometry를 구성 근데 이게 느리고 비현실적임 Transformer 는 확장성 뛰어나고 효과적임 3D 데..

SOTA 논문 리뷰 2024.02.24

Structure from Motion 리뷰

가장 최근에 나온 SOTA 논문은 아니지만 3D 입문하기 전 가장 기초적인 논문이라 리뷰를 해보려고 한다. Structure From Motion => Motion에서 Structure를 찾겠다는 뜻이다. 보통 SFM은 2D 이미지를 3D 이미지로 바꿀 때 많이 쓰는 개념이다. 2D이미지에서 3D 이미지를 알아내려면 하나의 뷰로는 어렵다. 왜냐하면 앵글마다 객체의 모양이 많이 바뀔 수 있고 하나의 뷰로는 그것들을 다 담기가 어렵기 때문이다. 그래서 여기서는 여러 개의 뷰를 사용하여 3D 이미지를 추출하게 된다. 전체적인 flow는 다음과 같다. 1. Correspondence Search Feature Extraction 여러 개의 이미지들에서 이미지의 특징점만 추출하는 단계이다. 지도에서 길을 찾을 때..

SOTA 논문 리뷰 2024.01.31

LDC: Lightweight Dense CNN for Edge Detection 논문 리뷰

원래는 AI 중심으로 블로그를 운영하려고 했었는데 최근에 그렇게 하기보다는 책 리뷰를 많이 한 것 같다. 다시 본질로 돌아가서... SOTA 논문 리뷰 첫 글부터 작성해보겠다. Edge detection 쪽을 공부할 일이 생겨서 Sota 에 들어가서 찾아보다가 LDC를 발견하게 되었다. 해당 논문에 대해 정리된 다른 블로그도 있지만 직접 읽어보고 글을 샅샅이 뜯어보고 싶어서 읽어보며 리뷰를 작성하게 되었다. Abstract 본 논문에서는 에지 검출을 위한 LDC(Lightweight Dense Convolutional) 신경망을 제시한다. 제안된 모델은 두 가지 SOTA 방식을 적용한 것이지만 요구되는 것은 이보다 적다. 이러한 접근법들과 비교하여 4%의 파라미터들이 제안된 아키텍처는 얇은 에지 맵들을 ..

SOTA 논문 리뷰 2024.01.05