한국어OCR 작업 가이드

한국어OCR 작업 가이드입니다!

작업 기준관련 공지사항

  • 191125 – 컴퓨터 화면내 끄기(x)버튼은 특수문자 입력기를 통하여 x로 입력해주세요!
  • 1910 – 좌측 상단부터 순차적으로 작업해주세요!
  • 바운딩 박스는 띄어쓰기 단위로 해주세요!
  • 해상도만으로 단어 중간에 돈케어 처리하지 않습니다!
  • 배경이 문자로 이루어진 경우 작업불가 처리해주세요!
  • 본 프로젝트는 임시 저장이 되지 않습니다. 작업화면을 나가면 작업내역이 사라지니 작업에 주의해주세요!
  • KC마크는 돈케어 처리해주세요!

 

작업화면

예시는_중국어OCR_이미지

① OCR작업대상 이미지 – 바운딩 및 텍스트 작업을 해야하는 대상

② 이미지 음영반전 및 밝기 조정 버튼 – 바운딩 영역의 확인이나 이미지의 판별을 도와주는 기능

③ 작업내역 썸네일 버튼 – 바운딩 및 텍스트 작업한 내역을 확인 할 수 있는 기능

④ 저장하고 다음으로 – 작업을 완료하고 제출하는 버튼

⑤ 작업불가 – 이미지 자체의 작업이 불가능한 경우 넘김 버튼(작업 불가능한 문자가 있는 경우, 이미지 자체에 문제가 있는 경우)

⑥ 이미지의 확대/축소

윈도우 – ctrl(컨트롤키) + ↑(방향키)

MAC OS – commmand(커맨드키) + ↑(방향키)

① 미리보기 – 영역을 확대하여 미리볼 수 있는 영역

② 입력 버튼 – 바운딩 영역의 문자를 입력하기 위한 버튼 (입력 버튼을 누른 후 ④번 칸에 입력)

③ 돈케어 버튼 – 입력 가능한 문자가 아니거나 돈케어 기준에 해당하는경우 선택

④ 입력란 – 문자를 입력하는 칸

⑤ 특수문자 입력기 – 이미지내 키보드로 입력 불가능한 특수문자가 있는 경우 입력기에 찾아 입력 가능

⑥ 확인/취소 – 확인 버튼을 통하여 작업내용을 저장하거나 취소 버튼으로 리셋하는 기능

 

작업기준

작업가능 문자

  1. 한국어
  2. 영어
  3. 숫자
  4. 키보드상 입력가능한 특수문자
  5. 화면의 입력기내 특수문자

입력기내 특수문자

  • 이외 문자(중국어, 일본어등)가 이미지내 10%이상 있는 경우 작업불가
    • 10%미만인 경우 돈케어 후 작업

 

바운딩의 기준

  • 바운딩 박스는 띄어쓰기 단위로 나눈다
  • 문자의 좌측 상단을 기준으로 시계방향으로 진행
  • 최대한 글자에 여백이 없도록 함

글자 좌측 상단부터 빨강점 시작

  • 바운딩의 시작점인 빨강점과 주황점은 문자와 평행해야함.

  • 여백을 줄이고자 하는 경우 바운딩 점을 더 찍을 수 있지만 과도하게 찍을 수 없음

잘못된 예시)

잘된 예시)

  • 글자의 절반보다 여백이 넓은 경우 바운딩을 나눠서 작업함. (애매한 경우 나누어서 바운딩 한다.)

  • 폰트의 차이가 2배 이상 나는 경우 바운딩을 나눔 (ex. 50 / %)
  • 행(줄)이 다른 경우 바운딩을 나눔 (ex. 50 / OFF)

  • 겹치는 문자는 앞의 문자를 바운딩 후 입력함.
    • 잘린 부분은 돈케어 처리함.

  • 글자에 테두리가 있는 경우 테두리를 포함하여 바운딩함.

 

돈케어 기준

  • 돈케어 박스는 돈케어 대상을 70%이상 포함하여야 함.
    • 편의를 위해 돈케어 바운딩 박스를 과도하게 넓게 설정할 수 없음
  • 판별이 불가능한 문자는 돈케어 처리함.

  • 이미지 끝부분에 잘리거나 사물에 가려져 잘린 글자는 돈케어 처리함.(문자의 형태가 가려지거나 잘린 경우)

  • 문자의 전체 형태가 나타날때 중간에 판별 불가능한 문자가 있으면 바운딩 단위로 전체를 돈케어함.

    • 유추가 가능한 경우에는 포함하여 작업 후 입력함. (아래와 같은 경우 모두 입력가능!)

  • 뒷면에 비치는 글자는 돈케어 처리함.

  • 의미없는 구분선의 경우 입력하지 않고 돈케어 처리함.

  • 핸드폰 상단 표시줄에 불필요한 와이파이, 배터리, 신호세기등은 무시.(돈케어도 하지 않음)
    • 화살표등 무시함.

    • 하단의 버튼모양은 돈케어 처리함.

 

  • 불필요한 밑줄은 무시함.

 

 

추가 기준

  • 문자가 그림의 형태인 경우 동일한 기준으로 작업함.

  • 수식이나 입력이 불가능한 문자로 이루어진 경우 작업불가 처리함.

Updated on 2020년 3월 27일

Was this article helpful?