본 포스팅은 2022-09-07(수), 국민대학교 김장호교수님의 컴퓨터 비전 수업을 통해 배운내용을 정리하기 위해 작성하는 게시글입니다.
# 획득과 표현
컴퓨터 비전을 배우기에 앞서, 어떻게 사물이 카메라를 통해서 받아들여지는지를 알아야한다. 사람의 눈에서 수정체는 카메라에서 렌즈역할과 같고, 망막은 CCD센서(필름)에 해당한다.
# 샘플링과 양자화
카메라를 통해 사진을 찍을경우 샘플링과 양자화를 거치게 된다. 컴퓨터가 이해할 수 있는 디지털신호로 변환을 할 수 있다.
샘플링은 실제 찍은 사진에서 유한개의 데이터로 줄여서 뽑게되는 행위이다. 가량(b)사진에서의 격자가 M*N이라면 M*N의 갯수로 샘플링을 하게 된것이다. 픽셀과 같이 생각하면 쉽다고 하셨다. 그렇게 샘플링된 아날로그의 데이터를 양자화를 거쳐 디지털화 시킨다. 가령 샘플링된 사진에서 명암(L)에 따라서 양자화를 하게 된다면 (c)에서와 같은 디지털화 된 데이터를 가질 수 있다.
이후 얻어진 디지털에 대한 좌표계를 통해서 표현할 수 있다. 색은 R,G,B의 값을 가지고 표현하게 되는데, fr(x), fg(x), fb(x)의 세 채널로 구성하여 해당 좌표에서의 색을 표현 할 수 있게 된다. 이때 좌표계는 사용되는 언어마다 다르기 때문에 연구를 할때마다 샘플 사진을 통해서 좌표계의 시작위치를 한번씩 확인하라고 하셨다. 이렇게 얻어낸 디지털 자료들은 숫자배열을 통해서 표시한다.
# 과학적 접근과 공학적 접근
사람이 시각데이터를 처리하는 과정은 매우 복잡하며 빠르다. 우리가 보고 느끼는 것과 같은 수준으로 컴퓨터 비전을 처리 할 수 있도록 하는 것은 현재로써 불가능하다. 이러한 이유로 과학적 접근과 공학적 접근의 측면으로 컴퓨터 비전을 바라볼 수 있다.
## 과학적 접근
과학적 접근은 <목표1> 을 달성하려는 노력으로 뇌공학과같은 연구들이 동반되어야 한다. 인공지능이 필수적으로 들어가야 한다. 그러나 아직은 어려운 문제이다. 역문제, 불량 문제, 다양한 변형 발생 문제들을 넘어야 한다.
## 공학적 접근
<목표2>를 달성하려는 노력이며, 특정 상황에서 특정 임무를 수행하도록 하는 시스템을 만드는 것이다. 제약사항이 있기 때문에 그만큼 연구에 필요한 자원을 아낄 수 있다. 특정상황에서만 작동 하도록 하면 되기 떄문이다. 예를들어 반도체 칩의 불량을 검사하기 위해서 사용하는 컴퓨터 비전은 사람의 경우보다 이미 더 뛰어나다고 한다.
# 계층적 처리
전처리 -> 특징추출 -> 해석 의 과정으로 계층적인 처리가 이루어진다. 전처리는 영상의 잡음(노이즈)를 처리하고 개선해주는 준비과정이고, 특징 추출과정에서는 에지,선분,영역,텍스처 등등 특징과 특징 벡터를 추출하는 과정이다.
과거의 머신러닝에서는 이러한 특징추출을 인간이 개입했지만, 최근들어선 최신 비전처리에서는 이러한 과정들 모두 컴퓨터가 처리 할 수 있도록 한다. 그렇기 때문에 교수님께서 최신경향을 반영하기 위해서 수업내용을 수정하셨다 했다.
# 머신러닝과 PTE
Learing이란 경험(experience)을통해서 프로세서의 성능(performance)을 개선하는 것이다. 그렇게 탄생한 PTE(Performace(성능), Task(작업), Experience(경험))을 잘 고안하고 정의해야 한다.
그렇기 때문에 주어진 문제(TASK)에 대해서 직관적이고 철저한 이해, 합리적인 제약조건의 수립이 필요하다.
예를들어 얼국 인식기를 만들어야하는 상황에서, 일정한 정면얼굴만을 Task로 정할 것인지, 자연에서와 같은 수많은 각도에서의 얼굴을 처리 할 것인지에 관한 것이다.
머신에서의 경험은 데이터(DATA)이다. 질과 양적으로 우수한 데이터베이스를 수집해야하며, 학습집합과 테스트 집합을 잘 수집해야한다.
# 성능 평가
이번 수업에서는 Precision(정밀도), Recall(재현율), Accuracy(정확도)에 대한 개념을 간단히 알 수 있었다. 정밀도와 정확도는 비슷한거 다르기 때문에 주의 해야한다.
## Precision(정밀도)
정밀도는 모델이 True라고 분류한 것 중에 실제 True인 것에 대한 비율이다. 분모는 분류결과 True에 해당한다. 교재에서는 정확률이라고도 표현해 정확도(Accuracy)와 헷갈린다.
## Recall(재현율)
재현율이란 실제 True인 것 중에서 모델이 True라고 예측한 비율이다. 분모는 실제정답 True에 해당한다.
## Accuracy(정확도)
Precision과 Recall에서는 True를 Ture라고 옳게 예측한 경우만 다루었다. 그러나 False를 False라고 예측한 경우도 모델이 옳게 예측한 경우이다.
# 성능 측정
정밀도(==정확률 Precision)는 (얼굴이라 인식한것 중에 진짜 얼굴인 것) / (얼굴이라고 인식한 것) 이기 때문에 12/14이다.
재현율(Recall)은 ( 얼굴이라 인식한것 중에 진짜 얼굴인 것) / ( 실제 얼굴 인것 ) 12/15이다.
'•Compter Science > Computer Vision' 카테고리의 다른 글
[컴퓨터비전#6/09-26] 기계학습의 종류와 개념, 손실함수, 손실함수와 파라메타 (2) | 2022.09.28 |
---|---|
[컴퓨터비전#5/09-21] 그레디언트(엣지방향,강도), 소벨마스크 엣지검출, 엣지 잡음과 DOG & LOG 마스크 (1) | 2022.09.22 |
[컴퓨터비전#4/09-19] 엣지 검출, 엣지 검출을 위한 미분 활용, 이미지에서의 미분 개념 (1) | 2022.09.20 |
[컴퓨터비전#3/09-16] 필터링( 메디안, 평균, 가우시안), 동차좌표와 동차행렬 (1) | 2022.09.19 |
[컴퓨터비전#2/09-14] 히스토그램, 히스토그램 평활화, 점연산(선형,비선형,디졸브),영역연산(상관,컨볼루션) (0) | 2022.09.15 |