글자 인식

오랜만에 올려봅니다. ㅇㅂㅇ

컴퓨터가 발전하게 되고, 컴퓨터로 할 수 있는 일들이 많이 생기기 시작하면서 예전에 작성된 서류 혹은 설계 도면 등을 컴퓨터에 자동으로 입력할 수 있는 기술이 매우 필요하게 되었고, 문자 인식은 “입력의 자동화” 요구에 부응하는 기술로서 발달하여 왔습니다. 글자 인식 기술을 장치화한 제품이 바로 OCR(Optical Character Recognition)로서 흔히 광학 문자 판독기라 불립니다.

오늘날 문자 인식 기술은 우편물 자동 분류를 위한 우편 번호 인식, 산업 현장에서의 제품 검사나 분류, 문서 인식, 도면 인식, 팩시밀리를 통해 전달받은 영상에서의 문자 인식, 워드 프로세서 OCR, 금융 기관에서의 전표 또는 수표의 자동 입력 등 여러 분야에 걸쳐 실용화되어 실생활에 효과적으로 사용되고 있습니다. 이것은 문자인식의 종류 중 오프라인 문자인식에 속하며, 인쇄체와 필기체를 다룹니다. 인쇄체의 경우에는 상당히 인식률이 좋지만 필기체의 경우에는 필기하는 사람마다의 글씨체의 차이가 있는지라 아직도 좀 불안정한 부분이죠,

또한 최근들어 펜과 터치스크린을 이용한 HPC나 PDA, 스마트폰이 등장하면서 입력의 수단이 키보드에서 펜(손글씨)으로 변경되어가고 있습니다. 이에 펜은 PC의 마우스같은 단순한 역할이 아닌 일상 생활에서와의 동일한 수단으로 사용하기 위하여 문자인식이라는 기술을 사용하고 있습니다. 즉 일반 펜으로 노트에 글을 쓰듯이 PDA나 펜인터페이스를 가지고 있는 PC상에서 손쉽게 글이나 도형 기타 제스처등 을 입력할 수 있게 해주는 기술로써 더 이상 키보드의 어려운 자판을 암기할 필요가 없게 된 것이죠. 이러한 것을 온라인 문자인식이라 하며, 주로 필기체를 다룹니다.

근데 이것도 좀 애매한 것이… 요즘은 소프트 키보드의 발달로 인하여 키보드를 쓰던 사람들이 계속 키보드를 사용할 수 있게 해줌으로써 여러모로 말이 많은 상황이긴 합니다.

문자인식단계는 다음과 같습니다.

  1. 패턴입력: 사용자가 입력한 패턴(문자 또는 제스처등)
  2. 전처리부
  • 거리 필터링(Distance filtering)-불필요한 점 제거, 필요한 점 생성
  • 각 필터링(Angular filtering) – 16방향, 32방향, 360방향
  • 디후킹(Dehooking) – 갈고리 모양 제거
  • 정규화(Normalization) – 크기, 기울어짐
  • 방향 Encoding
  1. 인식부
  • HMM(Hidden Markov Model) : 두 패턴의 유사도를 측정하기 위해 사용: 두 패턴의 특징 벡터의 개수가 다를 때 비교하기 위한 방법으로써 간단하면서도 효과적인 방법
  • Dynamic Programming(DTW, Dynamic Time Warping)
  • Parmetic Approach
  • Neural Network
  • 한글인식 : 초성, 중성, 종성의 인식과 각 자소의 위치 관계를 이용한 조합
  1. 후처리부
  • Dictionary Search
  • Natural Language Processing
  1. 결과출력
  • 최종 일치문자 출력
  • 패턴(인식대상) – 문자, 숫자, 기호, 제스춰, 도형, 도표등

문자인식에 있어서 핵심기능은 다음과 같습니다.

  1. 빠른 인식 속도
  2. 그림/메모/도형 인식 기능
  3. 서명인식 기능
  4. 제스쳐 인식 기능
  5. 자유 입력방식 및 박스입력 방식 지원
  6. 자동 띄워쓰기 가능
  7. 소프트 키보드 지원
  8. 인식 가능 문자 지정
  9. 후보문자 선택 기능
  10. 오인식 또는 미인식 문자 정정 기능
  11. 인식 결과 출력 기능 등

문자인식의 활용 분야는 다음과 같습니다.

  1. PDA, Hendheld PC, WebPAD, Tablet PC, Pen Computer, DeskTop PC (Pen digitizer, Touch panel, electronic Pen, Pen mouse 등)
  2. NOD(News on Demand)에서 뉴스 아이콘 자막과 내용 자막 추출 및 인식 시스템에 활용
  3. 공장 자동화 및 사무 자동화에서 문자 인식 시스템에 활용
  4. 차량 번호판 인식 시스템에 활용
  5. 사용자 확인을 위한 서명인식 등

음… 오랜만에 글 편집헤서 쓰려고 하니 힘드네요…ㅇㅂㅇ;

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다