여러 공부 14

[논문 - ESPCN] Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network

논문 https://arxiv.org/pdf/1609.05158v2.pdf 0. Abstract 최근 몇몇 모델은 복원 전에 bicubic interpolation 등을 사용해서 LR -> HR을 만들었습니다. 저자는 해당 방식이 하위 최적화이고, 계산 복잡도를 추가하는 것을 증명할 것입니다. 해당 논문에서는 LR 공간에서 뽑아낸 특징 맵을 사용한 CNN 구조를 제안합니다. 추가로 마지막 LR 특징 맵에서 HR로 가는 upscaling 필터를 배움으로써 효율적인 sub-pixel conv layer를 소개합니다. 성능도 좋았으며, 계산 복잡도도 줄었습니다. 1. Introduction SR은 역함수가 없는 low-pass 필터와 subsampling 작업을 통해 손실되는 고주파 정보 때문에 어려운 문제입..

[논문 - Inception v2, v3] Rethinking the Inception Architecture for Computer Vision

논문 https://paperswithcode.com/paper/rethinking-the-inception-architecture-for Papers with Code - Rethinking the Inception Architecture for Computer Vision #8 best model for Retinal OCT Disease Classification on OCT2017 (Acc metric) paperswithcode.com 앞의 글을 읽으시면 이해에 도움이 됩니다. 2023.08.07 - [여러 공부/논문 리뷰] - [논문 - GoogLeNet] Going deeper with convolutions [논문 - GoogLeNet] Going deeper with convolution..

[논문 - GoogLeNet] Going deeper with convolutions

논문 https://arxiv.org/abs/1409.4842 Going Deeper with Convolutions We propose a deep convolutional neural network architecture codenamed "Inception", which was responsible for setting the new state of the art for classification and detection in the ImageNet Large-Scale Visual Recognition Challenge 2014 (ILSVRC 2014). The arxiv.org 0. Abstract 본 논문에서는 Inception 모듈을 제안합니다. 해당 구조의 특징은 컴퓨팅 자원의 효율성을 향..

[논문 - ResNet] Deep Residual Learning for Image Recognition

논문 https://arxiv.org/abs/1512.03385 Deep Residual Learning for Image Recognition Deeper neural networks are more difficult to train. We present a residual learning framework to ease the training of networks that are substantially deeper than those used previously. We explicitly reformulate the layers as learning residual functions with arxiv.org 0. Abstract 깊은 신경망은 학습하기가 어려움 저자는 기존에 사용한 방법보다 더 깊..

[논문 리뷰] Deep Learned Super Resolution for Feature Film Production

0. Abstract 고화질의 이미지를 만들기 위한 Upscaling 기술은 비용이 비싸고, 생산하기 어렵다. 최근 딥러닝 기술이 기존의 전통적인 알고리즘을 능가하여 upscale 된 이미지의 디테일과 미세 부분을 향상했다. 저자는 고화질의 콘텐츠를 생산하고, 렌더링 비용을 감소하는데 유용한 upscaling 기술을 딥러닝으로 수행하는 것에 대한 동기와 도전에 대해서 얘기한다. 1. Background & Related Work nearest-neighbor, bilinear, bicubic interpolation 같이 이미지의 해상도를 올리는 여러 기술이 있다. Deep Convolution Neural Network는 LR 이미지와 HR 이미지를 매핑하는 학습을 함으로써 상당한 복원 퀄리티를 입증했..

[논문 리뷰] BasicVSR : The Search for Essential Components in Video Super-Resolution and Beyond

해당 논문 리뷰에서는 IconVSR에 대한 설명을 하지 않습니다. 또한 다른 모델에 대한 설명도 하지 않습니다. 추후 시간이 된다면 부족한 설명을 덧붙이도록 하겠습니다. 0. Abstract VSR은 시간적 차원을 추가로 이용하기 때문에 image SR에 비하여 좀 더 많은 구성요소를 가지는 경향이 있다. 복잡한 디자인은 흔하지 않다. 본 연구에서는 이러한 매듭을 풀고, VSR에서 4개의 기본적인 기능으로 안내되는 가장 중요한 구성요소를 재고려하려고 한다. Propagation, Alignment, Aggregation, Upsampling 이미 존재하는 몇몇의 구성요소에 약간의 디자인을 더함으로써, 많은 SOTA와 비교해도 speed와 restolration quality 측면에서 향상한 간결한 pip..

[논문 리뷰] VSRnet - Video Super-Resolution With Convolutional Neural Networks

0. Abstract 해당 논문에서는 공간 초해상도를 향상하기 위해 비디오의 spatial, temporal 차원을 학습한 CNN을 제안한다. 연속적인 프레임은 motion cmpensate되고, 초해상화된 비디오 프레임을 결과로 내기 위한 입력으로 이용된다. 또한 하나의 CNN architecture에서 비디오 프레임을 연결하는 다양한 옵션에 대해서도 연구했다. 깊은 신경망의 학습을 위한 이미지 데이터베이스는 구할 수 있다. 하지만, 신경망을 학습하기 위한 충분한 수준의 비디오 데이터베이스는 구하기 어렵다. 우리는 이미지로 사전학습된 모델을 사용함으로써, 상대적으로 적은 비디오 데이터베이스를 사용해도 당대 최고의 성능을 내는 모델을 학습할 수 있었다. 1. Introduction UHD(3,840 x ..

[논문 리뷰] SRGAN - Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network

0. Abstract 더 깊고 더 빠른 CNN을 사용하여 빠르고 정확한 single image SR이 가능함에도 불구하고, 한 가지 큰 문제점이 있다. 큰 upscaling factor에서 어떻게 미세한 텍스쳐 디테일을 복구할 것인가에 대해서다. 최근 연구는 대부분 MSE(mean squared reconstruction error)를 최소화 하는데 초점을 맞추고 있다. 그 결과는 PSNR(peak signal-to-noise, 높을 수록 좋음, MSE와의 반비례)를 높이지만, 세부 정보(high-frequency detail)가 부족하고, 더 높은 해상도에서 시각적으로 기대되는 충실도와 일치하지 않는다는 것이 불만족스럽다. 즉, 해당 논문은 MSE, PSNR이 SR을 측정하는데 절대적으로 정확한 측정법..

[논문 리뷰] VGGNET - very deep convolutional networks for large-scale image recognition

Abstract 우선 초록에서는 해당 논문이 convolution network depth가 대규모 이미지 인식에 있어서 얼만큼 영향을 끼치는지 조사했다고 설명합니다. 해당 연구팀은 기존의 CNN 모델에서 3 x 3 Conv Filter를 16~19 층을 쌓음으로써 상당한 성능 향상이 있었다고 합니다.. 이러한 발견은 이미지넷 챌린지 2014에서 localisation에서는 1등, classification에서는 2등을 기록하였다고 합니다. 또한 결과물이 다른 데이터셋에 대하여 일반화가 잘되어 최고의 결과를 내었다고 합니다. 1. Introdution 서론에서는 이미지넷과 같은 대규모 이미지 저장소와 GPU의 발전이 Convolutional network의 대규모 이미지, 비디오 인식을 성공시킨 역할이라..