누구나 한번쯤은 모두들 들어봤을 법한 적외선 카메라(Infrared Camera). 적외선 카메라는 일반적으로 두 가지 용도로 사용중입니다. Night Vision과 Thermal Imaging이 그 두가지 인데요.. 영화에서 군인들이 Night Vision 고글을 쓰고 적군을 찾는다거나 하는 장면은 너무나도 익숙할 것 입니다. Thermal Image역시 영화에서 많이 사용됩니다. 하지만 그 둘은 태생적인 차이가 있으니 혼동하지 말라고 하는데[1] .. 무슨 차이가 있는지 잘 모르겠어서 한번 찾아봤습니다.

Figure. 1. Two American Soldiers pictured during the 2003 Iraq War seen through an image intensifier[2]

 

반면 Thermal Imaging의 경우 적외선 카메라의 화상이 Figure 1과는 달리 Figure 2처럼 표현되죠.. (speech의 spectrogram처럼, thermogram으로 표현됩니다.)

Figure 2. Thermogram of a lion[3]

 

여기에 대한 차이점이 Morovision의 "How Thermal Imaging Works" 라는 기술설명 페이지에 잘 나와 있습니다 [4]. 빛은 크게 세가지 영역으로 나뉘게 될텐데요, 적외선(infrared), 가시광선(visible light), 자외선(ultraviolet) 이렇게 말이지요. 그런데 그 중에서 우리가 관심있어하는 infrared는 다시 또 세 부분으로 나뉘게 됩니다.

  1. Near-infrared (near-IR) : 이것은 적외선 중에 가시광선에 제일 가까운 녀석들로, 0.7 – 1.3 정도의 파장을 가진다고 합니다.  리모콘의 적외선 다이오드가 대충 이정도 영역인듯 하네요.
  2. Mid-infrared (mid-IR) : 이것은 , 1.3 – 3 정도의 파장을 가진다고 합니다.
  3. Thermal-infrared (thermal-IR) : 이것은 3 – 14 정도의 파장을 가지는 녀석으로, 대부분의 적외선 영역을 차지한다고 하네요. 위의 (1), (2) 와 다른 점은 (1), (2)는 reflection에 의한 적외선이 나오는 반면, (3)의 경우 열에 의해 적외선이 방출(emit)되는 점이 다른 점이라 하겠습니다.

     

그렇다면 답은 간단히 나오죠. 3 이하의 파장을 detect하는 카메라를 이용하면 Night Vision을 만들 수 있고, 3 이상의 파장을 detect하는 카메라를 이용하면 Thermal Imaging이 가능해집니다. (1),(2)의 영역을 이용하면 Microsoft Surface[5]등으로 요즘 화두가 되고 있는 vision-based multi touch system을 만들 수 있을 테구요 [6], [7].

 

 

Reference


[1] http://www.video-surveillance-guide.com/how-does-thermal-imaging-work.htm

[2] http://en.wikipedia.org/wiki/Night_vision

[3] http://en.wikipedia.org/wiki/Thermography

[4] http://www.morovision.com/how_thermal_imaging_works.htm

[5] http://www.microsoft.com/surface/en/us/default.aspx

[6] http://t9t9.tistory.com/360

[7] http://scripter.egloos.com/1695125

신고
크리에이티브 커먼즈 라이선스
Creative Commons License
예전 LG재직시절 우리 팀에서 만들었던 DSE.R(Dual Speech Enhancement for Recording) 기술 시연 동영상입니다.
수출향 아레나폰(KM900)에 올려졌던 것으로,
두개의 마이크를 이용하여 구현되었으며 
특정방향의 소리를 키워주고 나머지 방향의 소리를 제거하여 
깨끗하게 비디오 레코딩을 할 수 있게 하는 기술입니다.




신고
크리에이티브 커먼즈 라이선스
Creative Commons License

Independent Vector Analysis(IVA) 대해서 세미나를 해야할 일이 생겨서 IVA 공부를 하는 김에 복잡한 수식을 다시 유도하고 싶지 않아 여기에 깔끔하게 정리해보고자 합니다. 수식 인덱스가 아주 환장하게 복잡하네요 ㅎㅎ(이걸 유도한 저자분은 참 대단 ㄷㄷ).

일단 IVA?
Taesu Kim 님
 만든 알고리즘으로서, 주파수 축상에서 주파수 bin별로 따로 ICA 돌리던 것을 한꺼번에 고려해서 돌려주겠다는 내용의 알고리즘입니다. (IVA 개념에 대해서는 나중에 다시 다뤄야겠네요. 여기서는 단순히 수식 유도만 다룰 것입니다. ^^ 지금 급한게 수식 유도라.. ^^) 언제 시간나면 ICA 이론에 대해서 총체적으로 다루겠지만, 현재로서는 정리해 파일은 없고 ICA 기본적으로 알고 있다고 가정하고 유도합니다. 그리고 아마 Matrix Vector간의 변환에 대해서도 봐두시면(링크참조) 도움이 되실 것입니다.

그럼 시작해보겠습니다.

널리 알려진 바와 같이 ICA Unmixing matrix Update식은
(
1)
와 같이 표현이 됩니다. [1]
IVA 경우 ICA Frequency Domain Version + Independent Constraint 모든 Frequency Bin 연결해서 생각해주자는 것입니다. 이럴경우 IVA Update 수식은
(2)
됩니다. 수식 (1) (2) 차이점을 살펴볼까요? 세가지가 바뀐 것을 확인하실 있으실텐데요.. 일단 transpose 연산자가 Hermitian으로 바뀌었습니다. ICA real-value 가정하였지만, IVA Frequency-Domain 생각해주었으므로, 기본적으로 Complex-Value에서 생각하게 됩니다. 따라서 TèH 바뀐것이구요, 모든 variable (k)라는 새로운 index 생겼습니다. 이것은 k-th frequency bin 해당된다는 뜻입니다. 마지막으로 g()라는 nonlinear function 안에 K개의 변수가 들어있습니다. Nonlinear Function g() pdf 구성되는 함수로서 내부 변수가 여러 개가 콤마(,) 연결되어 있다는 것은 pdf joint pdf 바뀌었다는 뜻입니다.
제가 설명하고도 말을 하는 건지 ㅋㅋ (아무래도 IVA 개념에 대해서 빨리 글을 작성해야겠네요..) 여튼 이정도로 설명하고 넘어가도록 합니다.

그런데 IVA관련 논문들을 보시면 아시겠지만, 이렇게 Matrix(or Vector) Form으로 표현이 되어 있질 않습니다. 예를 들면
(3)
같은 식이죠.[2]
결국 (2)에서 (3) 유도할 알면 되겠죠? ^^

(3)식은 논문에 있는 수식을 그대로 가져와서 (2)랑은 Notation 다릅니다. (2) ICA 제가 이해한 방식의 Notation이라 Notation 일단 맞춰야 겠죠? W=G, g()=-phi(), y=s, 정도로 보시면 크게 무리가 없을 것으로 보입니다. 일단 (2)로부터

될테구요,
이것의 Natural Gradient 형태
,
를 양변에 곱한 형태는 다음과 같이 주어지게 될 것입니다.

이것이 Natural Gradient 적용한 IVA Update 식이 됩니다. 이것을 Element형식으로 표현을 해볼까요?

됩니다. 얼추 (3) 비슷해졌나요? 차이점이 있다면 Identity Matrix summation 안에 들어갔냐 아니냐의 차이인데, 저는 아무리 유도해도 summation안에 l(소문자L) index 가지고 들어가게끔 유도가 안됩니다. ( 나중에 Constraint 바꿔쓰면 사용하지 않을 Factor이기는 하지만 그래도 찜찜은 하네요. 저자에게 질문을 한번 해야 합니다.)

이로써 IVA Update 유도 완성! 헉헉.. 역시 빡셉니다 ^^

 

Reference

[1] A. Hyvarinen, J. karhunen and E. Oja, Independent Component Analysis, John Wiley & Sons, 2001.
[2] T. Kim, H.T. Attias, S. Lee, T. Lee, "Blind Source Separation Exploiting Higher-Order Frequency Dependencies, IEEE Trans. On. ASLP, pp.70-79, vol. 15, No. 1, Jan 2007.


신고
크리에이티브 커먼즈 라이선스
Creative Commons License

+ Recent posts