홈
태그

분류 전체보기 (145)

ABOUT ME

-

트위터
인스타그램

Today: -

Yesterday: -

Total: -

엔지니어 한다운의 저널

컨텐츠 검색

Vit

[논문] ViT_An Image is worth 16x16 words: Transformers for Image Recognition at scale
컴퓨터 비전 2022. 4. 26. 17:22

Vision Transformer 분야가 많은 관심을 받고 있습니다. NLP에서만 주로 쓰이던 transformer 구조를 Vision 분야에 적용해서 높은 성능을 구현한 논문입니다. 논문 링크는 다음과 같습니다. An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale While the Transformer architecture has become the de-facto standard for natural language processing tasks, its applications to computer vision remain limited. In vision, attention is either applied in co..

이전

1

다음

LINK

부트캠프 인덱스 GitHub 포트폴리오

ADMIN

admin 글쓰기

티스토리툴바