본 포스팅은 2022-09-19(월), 국민대학교 김장호교수님의 컴퓨터 비전 수업을 통해 배운내용을 정리하기 위해 작성하는 게시글입니다.
# 엣지(Edge)란?
엣지(Edge)는 그 뜻 그대로 경계이다. 이미지에서 경계는 여러가지 이유로 표현 될 수 있으며, 우리 눈으로 봤을때 뭔가가 구분되는 그러한 지점이다. 물체의 경계 기준으로 큰 변화량을 가지게 되는데 이러한 원리를 이용해서 엣지를 검출한다.
## 엣지(Edge)의 유용성
단순 원본 영상에성의 엣지검출만 하여도 우리는 영상에 대한 어느정도의 추론이 가능하다. 사람 두명의 모습이 보이고, 얼핏 보면 펜싱을 하고 있는 모습임을 유추 가능하다. 엣지 자체만으로 형태를 구분할 수 있게 된다. 그러나 이러한 엣지 검출해도 한계점이 분명 존재한다. 실종된 엣지, 거짓엣지와 같은 잘못된 엣지들이 검출되는 것인데, 빨간색으로 표시된 부분을 살펴보면 쓸모 없는 엣지임을 알 수 있다.
# Images as functions
저번 강의에서도 나온 내용이미지만 이미지는 함수로써 해석이 가능하다.
예를들어, 한 명도 한채널의 값만을 가지고 있는 이미지가 있다고 가정해보자. 해당 이미지에 f(4,2) = 3이라는 값이 나오게 된다. f(5,2) = 4라는 값이 나올 것이다. 이렇게 이미지를 함수로 생각이 가능한 것이다.
조금더 확장해 3채널의 R,G,B값을 가지는 이미지가 있다고 가정해보면 아래와 같을 것이다.
이렇게 이미지를 함수로써 생각하는 덕분에 함수가 지니는 특성을 이용해서 수식을 계산 할 수 있게 된다.
# Detecting Edges
엣지의 특성을 보면 경계를 기준으로 값이 급격하게 바뀜을 알 수 있다.
f(0) , f(1) 에서는 비슷한 값을 가지다가 f(3)에서의 값은 급격하게 상승함을 알 수 있다. 여기서 값은 R,G,B 값 명도든 그 채널에 양자화된 값일 것이다. 이렇게 급격하게 변화하는 곳을 우리는 미분을 통해서 찾을 수 있다.
# 디지털 영상에서의 미분
## 1차원 공간에서의 미분방정식
극한의 개념을 도입하여 미분한다. 미분이 가지는 의미는 접점에서의 기울기가 될 것이다. 여기서 델타x는 변화량이다. 이 변화량을 극한을 이용했기 때문에 접점까지 축소 시킬 수 있었다.
## 디지털 공간에서의 미분
디지털(이미지)공간에서 미분의 델타x는 조금 다른 의미로 해석 할 수 있다. 이미 픽셀이라는 단위로 한칸한칸이 띄워졌기 때문에 한픽셀 앞이 아마 가장가까운 공간이 될 것이다. 델타x는 그렇게 1, 즉 1픽셀이 된다. 1의 식에 대입해주면 f(x+1) - f(x)라는 최종적인 식이 나오게 된다.
#Images as functions에서 설명했던거와 같이 여기서 f(x)에서 x는 x번째 픽셀이 가지고 있는 값이라는 의미로 해석된다. 그렇다면 f(x+1) - f(x)라는 것은 x+1번째 픽셀이 가지고 있는 값에서 x번째 픽셀의 값을 뺀 값이라는 의미를 가진다. 이에 해당하는 마스크를 에지연산자로 사용한다.
위처럼, 마스크를 통해서 f의 도함수 f'(x)를 구할 수 있다. 마스크를 이용하지 않고 f(x+1) - f(x)라는 것을 이용해서도 쉽게 4라는 미분값을 얻어 낼 수 있다.
## 2차 미분 - 2계도함수
2차도 똑같이 하면 [1, -2, 1]의 마스크를 얻어 낼 수 있다.
마스크를 이용해 2차 도함수도 쉽게 구할 수 있을 것이다.
# 현실에서
## 노이즈(잡음) 존재
현실에서는 노이즈가 있기 때문에 가우시안 필터와 같은 스무딩을 통해서 노이즈를 없애 줘야한다.
## 델타x의 확장
델타x가 1인 경우에는 바로 다음 픽셀을 보기 때문에 너무 촘촘하고 그렇기 때문에 연산해야 하는 값이 많아 진다. 델타x를 2로 확장해야 한다.
## 2차원 확장
f(x)는 1차원 가로 또는 세로에서만의 엣지 검출이 된다. 그렇기 때문에 2차원으로 확장하여 가로,세로를 모두 찾을 수 있도록 개념을 확장해야 한다.
'•Compter Science > Computer Vision' 카테고리의 다른 글
[컴퓨터비전#6/09-26] 기계학습의 종류와 개념, 손실함수, 손실함수와 파라메타 (2) | 2022.09.28 |
---|---|
[컴퓨터비전#5/09-21] 그레디언트(엣지방향,강도), 소벨마스크 엣지검출, 엣지 잡음과 DOG & LOG 마스크 (1) | 2022.09.22 |
[컴퓨터비전#3/09-16] 필터링( 메디안, 평균, 가우시안), 동차좌표와 동차행렬 (1) | 2022.09.19 |
[컴퓨터비전#2/09-14] 히스토그램, 히스토그램 평활화, 점연산(선형,비선형,디졸브),영역연산(상관,컨볼루션) (0) | 2022.09.15 |
[컴퓨터비전#1/09-07] 샘플링과 양자학, PTE, 정밀도(Precision), 재현율(Recall), 정확도(Accuracy) (0) | 2022.09.08 |