3 - 2학기/영상 처리

컴퓨터 비전과 영상처리는 무엇인가?

harvartz의 일지 2021. 3. 2. 18:04

영상 처리에 대한 글을 쓰게 된 배경은 이번 학기에 영상 처리라는 강의를 들으면서 공부한 내용을 따로 정리하기 위해서 쓰는 글이다. 필력이 좋지는 않지만 이해하면서 읽어주시면 감사하겠습니다 : )

 

 

컴퓨터 비전과 영상처리라는 말을 들으면 어떤 생각이 나는가?

 

비전은 영어로 Vision, 시력, 눈, 시야라는 뜻을 가지고 있다. 그렇다면 컴퓨터의 시력? 눈? 이라고 생각할 수 있다. 그리고 영상처리는 말그대로 영상을 어떤 과정을 통해 처리하는 듯한 느낌이 든다.

 

 

이제부터 본격적으로 컴퓨터 비전(computer vision)과 영상처리(image processing)이 무엇인지 확인해보자.

 

인간의 오감중에서는 시각은 가장 강력한 인지 기능이라고 볼 수 있다. 이러한 시각이라는 감각을 컴퓨터를 통해 사용할 수 있게 하는 것이 컴퓨터 비전의 목적이다.

 

(조금 더 구체적으로 이야기하면 카메라를 통해서 이미지, 영상이라는 데이터를 받았을 때, 이런 데이터를 어떻게 처리할 수 있을까? 라는 의문점이 이 학문의 의문점이다)

 

영상처리는 무엇인가? 디지털 영상을 다루는 학문, 많은 응용에서 사용되는 넓은 영역의 기술을 총칭한다고 한다. 쉽게 풀어서 이야기하면 입력되는 데이터에서 원하는 부분을 잘 보기 위해서 처리하는 학문이라고 생각하자!

 

이에 대한 예시를 들어보자.

 

학생들이 수업을 듣고 있는데 졸고 있는 학생을 확인하고 싶다! 졸고 있는 학생들은 대부분 고개를 숙여서 잠을 자니 일정 부분이 고개를 숙여있으면 인식을 시켜서 영상 처리하는 방법이 있다. (엉터리같지만 이런 늬앙스라는 것만 생각해보자)

 

 

결국 영상처리의 최종 목표는 사람처럼 인식할 수 있게하는 것이 최종 목표이다.

 

지금까지 확인했을 때 가장 강력한 영상 처리(이미지 프로세싱) 시스템은 인간의 눈과 뇌로 구성된 시스템이라고 한다.

 

 

영상 처리의 역사

1. 디지털 영상 처리의 시초는 달 표면을 찍은 사진의 화질 개선을 위해서 컴퓨터를 사용하면서 디지털 영상 처리 분야가 생겼다.

 

컴퓨터 비전

1. 컴퓨터를 이용하여 시각 기능을 갖는 기계 장치를 만드는 기술 분야

2. 투시된 영상들로부터 주어진 장면에 관한 유용한 정보를 추출하여 물리적인 대상을 명확하게 의미있게 기술하도록 하는 과정

 

위에서도 말했지만 궁극적인 목표로는 인간의 시각을 모방하는 것이다. 기계가 사람처럼 처리할 때까지 컴퓨터 비전 분야는 계속해서 발전될 것이다.

 

컴퓨터 비전 연대기

 

1. 사진의 태동 - 현존하는 가장 오래된 사진

2. 초창기 컴퓨터 비전 글자를 인식하게 만드는 프로그램 (20x20 비트맵 이미지로 받는 것이다)

3. 현재의 컴퓨터 비전 로봇이 수건의 모서리를 찾아 접고, 크기별로 정리하는 로봇

4. 미래의 컴퓨터 비전 인간을 뛰어넘는 고도의 시각을 지닌 휴머노이드

 

 

컴퓨터 비전은 왜 필요한 것인가? 사용되는 분야로는 무엇이 있을까? 어떤 분야에서 사용되는가?

 

산업 분야

- 공장의 자동화 : 제품에 이상이 있는지 검사하기 위해서 사람이 꼼꼼하게 검사하려면 시간이 너무 오래걸린다. 그래서 공장에서 이런 효율성을 높히기 위해 적용된다.

 

오락 분야

- 사람의 동작을 인식시키는 기능 혹은 게임이나 가전을 편안하게 제어할 수 있는 인터페이스로 사용하기도 한다(손짓으로 넘기면 채널이 넘어가는 것과 같은 경우가 있다)

 

교통 분야

- 자동차의 자율 주차 기능, 번호판을 인식하여 과속 단속, 주차 관리

 

보안 분야

- 홍채 인식, 지문 인식, 짐을 검사하는 시스템

 

계산 사진학 분야

- 비교적 새로운 분야이다. 여러장의 사진을 찍어 그것들을 이어 붙여 파노라마 영상 제작하는 기능

 

의료 분야

- 연구 개발비가 가장 많이 투입되고 고가의 장비를 사용하는 분야

- 여러 장의 2차원 단층 영상으로부터 3차원 영상을 생성하는 기능

- 수술 부위를 찾아 안내하는 수술용 로봇

- 혈액 샘플을 보고 단위 면적당 적혈구의 수 카운트

- 특정 세포의 움직임을 추적하여 활동성을 추정하는 작업 등에 응용

 

군사 분야

- 군사용 로봇 : 빅독(Big Dog) – 150kg의 짐을 지고 시속 6.5km로 달릴 수 있는 스테레오 비전 기능

 

과학 분야

- 화성 탐사선, 제대로 돌아다니면서 탐사를 제대로 하기.

 

농업 분야

- 사과나 딸기 같은 농산품 분류, 농산물이 자라는 환경 감시

 

모바일 분야

- 증강현실: 관광 안내용, 교육용

 

포토신스 : 파노라마 영상 생성

리프스냅 : 나뭇잎을 찍으면 어떤 식물인지 인식해준다.

 

 

생각보다 알게 모르게 수많은 분야에 컴퓨터 비전이 이미 녹아 들어있다. 무의식적으로 당연하게 생각하는 것들도 영상 처리 기술이 사용되는 것을 보고 놀라웠다. 앞으로의 수업이 기대가 된다.