의미로 구분하는 글자 바운딩

주의 사항

  • 본 프로젝트의 데이터는 인공지능 학습용으로 사용됩니다.
  • 본 프로젝트는 아래 가이드 숙지 후에 작업이 가능합니다.
  • 반려된 건에 대해 수정하지 않고 다시 제출하는 경우, 3 이상 반려를 당할 경우 작업 불가 대상이 될 수 있습니다.
  • 데이터 할당을 받기 위하여 대충 작업하고 반려받아 재작업하는 행위는 엄격히 금지됩니다. 발견 시 작업금지 회원이 될 수 있습니다.
  • 반려된 건에 대해 26시간 이내 재작업하지 않으면 작업물이 삭제됩니다.

프로젝트 소개

띄어쓰기 및 가로 세로로 나누어져 있는사진 내의 글자를 바운딩하고 속성을 태깅하는 프로젝트 입니다.

    1. 글자 의미와 맞춤법에 따라 바운딩
    2. 글자 방향, 글자 읽는 방향, 입력 대상 속성 태깅
    3. 입력 대상 글자는 입력

이 프로젝트는 글자 인식 소프트웨어를 고도화하는 데에 활용됩니다.

 

작업 방법

1. 바운딩 규칙

작업

기준

  • 단어 단위
  • 단어 주변에 타이트하게 바운딩
  • 한글/영어/숫자/(키보드에 있는)특수문자 만 바운딩박스
속성
  • 글자 방향
    • 가로: 가로 방향 글자
    • 세로: 세로 방향 글자
  • 단어 읽는 방향
    • → : 좌에서 우로 읽는 단어 (일반적인 단어)
    • ↗ : 좌에서 우상단으로 읽는 단어
    • ↑ : 아래에서 위로 읽는 단어
    • ↖ : 우에서 좌상단으로 읽는 단어
    • ← : 우에서 좌로 읽는 단어
    • ↙ : 우에서 좌하단으로 읽는 단어
    • ↓ : 위에서 아래로 읽는 단어
    • ↘ : 좌에서 우하단으로 읽는 단어
  • 의미론적 구분 대상

1) 기계 입장에서 가로 혹은 세로로 모두 읽을 수 있으나, 의미적으로 읽을 수 있는 방향이 정해져 있는 글자

예시)
위 이미지의 “이마트 편의점”은 
위 이미지처럼 “이편”, “마의”, “트점”으로 읽을 수 있으나, 의미상으로


위 이미지처럼 “이마트”, “편의점”으로 읽는 것이 맞습니다.
>> 위 처럼 의미적으로 읽어야 맞는 글자를 의미론적 구분 대상으로 간주합니다.

 

2) 띄어쓰기가 되어있지 않아, 다양하게 해석될 수 있는 단어나 문장
예시)
위 이미지처럼 “부엌가구전시장”은 띄어쓰기가 되어있지 않아,
“부엌가구”,  “전시장” 혹은 “부엌가구전”, “시장” 등으로 다양하게 해석될 수 있으나, 의미 상으로 “부엌”, “가구”, ‘전시장” 으로 읽는 것이 맞습니다.
>> 위 처럼 의미적으로 읽어야 맞는 글자를 의미론적 구분 대상으로 간주합니다.

    • 의미 단위로 바운딩합니다.
    • 아래 예시에서 ‘부엌’ ‘가구’ ‘전시장’ 외에는 모두 의미론적 구분 대상이 아닙니다.

작업 화면과 조작 방식

1. 작업화면

2. 조작 방식

  • 마우스 휠: 이미지 확대/축소
  • 마우스 오른쪽 클릭 후 이동: 이미지 이동
  • 마우스 왼쪽 클릭: 바운딩 박스 점 찍기
  • 마우스 왼쪽 더블 클릭: 바운딩 박스 마무리
Updated on 2020년 11월 26일

Was this article helpful?