컴퓨터 비전
-
[논문] Video Super-Resolution Based on Deep learning: A Comprehensive Survey컴퓨터 비전 2023. 8. 18. 18:27
비디오 고해상도화 알고리즘을 연구하기 위해 서베이논문을 읽었습니다. 해당 논문 링크는 아래와 같습니다. https://arxiv.org/abs/2007.12928 1. Methods (1) Methods with Alignment MEMC (Motion estimation and Motion compensation) 타겟 프레임 주변 프레임들을 먼저 정렬한 뒤, reconstruction 하는 방식 DC (Deformable convolution) CNN은 계층 안에서 고정된 구조를 사용함 → 다양한 형태의 변화를 모델링하는 것을 제한함 → CNN은 복잡한 형태 변화를 잘 표현 못 함. 따라서, deformable (형태가 없는) 컨볼루션이 필요함. Target feature maps와 그 주변의 fea..
-
[논문] ViT_An Image is worth 16x16 words: Transformers for Image Recognition at scale컴퓨터 비전 2022. 4. 26. 17:22
Vision Transformer 분야가 많은 관심을 받고 있습니다. NLP에서만 주로 쓰이던 transformer 구조를 Vision 분야에 적용해서 높은 성능을 구현한 논문입니다. 논문 링크는 다음과 같습니다. An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale While the Transformer architecture has become the de-facto standard for natural language processing tasks, its applications to computer vision remain limited. In vision, attention is either applied in co..
-
[논문] Object Detection in 20 Years - A Survey컴퓨터 비전 2022. 4. 8. 10:40
Object Detection이 지난 20년간 어떻게 발전 되어 왔는지 요약 해둔 논문이 있어서 소개하고자 합니다. (아직, Object Detection을 배우는 단계라서 잘 못 이해한 부분이 있을 수 있습니다.) 페이퍼 원본은 아래 링크에서 확인 할 수 있습니다. Object Detection in 20 Years: A Survey Object detection, as of one the most fundamental and challenging problems in computer vision, has received great attention in recent years. Its development in the past two decades can be regarded as an epitome..