게임 스크린샷 OCR

 


※필독※

#11/30 가이드 수정 내용#

– 텍스트로 인식되는 모든 것들은 바운딩 후 전사해주세요. (추측 X)
– 텍스트의 정의는 아래와 같습니다.

1. 한글 (로고, 이미지내 텍스트 포함)
2. 영어 (로고, 이미지내 텍스트 포함)
3. 숫자 (로고, 이미지내 숫자 포함)
4. 문장부호 16가지 (로고,이미지내 문장부호 포함)
(문장부호 16가지와 생김이 같은 이미지도 텍스트로 보고 그대로 전사 해주세요)
5. 문장부호 16가지를 제외한 특수문자는 바운딩 후 *로 전사해주세요. (이미지내 특수문자 포함)

 ※그대로 전사해야하는 문장부호※

1. 마침표( . )
2. 물음표(?)
3. 느낌표(!)
4. 쉼표( , )
5. 콜론( : )
6. 세미콜론( ; )
7. 슬래시 ( / )
8. 큰따옴표(“ “)
9. 작은따옴표(‘ ‘)
10. 소괄호(( ))
11. 중괄호({ })
13. 대괄호([ ])
14. 하이픈 (-)
15. 언더스코어(_)
16. 물결표(~)

-기존처럼 블러/어둡게/흐리게 표현되어있는 부분은 기존처럼 바운딩 대상이 아닙니다.
-다른 기준들은 기존과 같습니다.


##11/26 가이드 수정 내용##

– 활성화된 화면의 기준은 팝업이 아닌, 회색/블러처리/어둡게 처리하지 않은 화면 입니다. 회색/블러처리/어둡게 처리 되어있는 화면은 바운딩 하지 않습니다.

– 화면 상단의 휴대폰 기본 상태(시간,베터리,퍼센트)는 바운딩 하지 않습니다.  (11/30 가이드 수정)


##11/25 가이드 수정 내용##

  • 키보드 이미지 위의 자음,모음 숫자 등은 바운딩하지 않습니다.

##11/23 가이드 수정 내용 ##

1. 아래 문장부호는 띄어쓰기 기준으로 바운딩 후 그대로 전사 합니다.
(단독으로 쓰여도 그대로 바운딩 후 전사합니다.)

 ※그대로 전사해야하는 문장부호※

1. 마침표( . )
2. 물음표(?)
3. 느낌표(!)
4. 쉼표( , )
5. 콜론( : )
6. 세미콜론( ; )
7. 슬래시 ( / )
8. 큰따옴표(“ “)
9. 작은따옴표(‘ ‘)
10. 소괄호(( ))
11. 중괄호({ })
13. 대괄호([ ])
14. 하이픈 (-)
15. 언더스코어(_)
16. 물결표(~)

2. 1의 문장 부호를 제외한 특수문자들은 바운딩 하여  *로 전사합니다.
3. 한국어, 영어는 바운딩 후 그대로 전사 합니다.
4. 숫자도 문자로 보고 문자와 같이 전사합니다.
5. 한국어, 영어를 제외한 ‘기타 외국어’ 는 * 로 전사합니다.
6. 명백한 텍스트만 바운딩 대상입니다. (11/24 추가)(11/30 삭제)

 


주의 사항

  • 본 프로젝트의 데이터는 인공지능 학습용으로 사용됩니다.
  • 본 프로젝트는 아래 가이드 숙지 후에 작업이 가능합니다.
  • 반려된 건에 대해 수정하지 않고 다시 제출하는 경우, 3 이상 반려를 당할 경우 작업 불가 대상이 될 수 있습니다.
  • 데이터 할당을 받기 위하여 대충 작업하고 반려받아 재작업하는 행위는 엄격히 금지됩니다. 발견 시 작업금지 회원이 될 수 있습니다.
  • 반려된 건에 대해 26시간 이내 재작업하지 않으면 작업물이 삭제됩니다.

 

프로젝트 소개

게임 스크린샷 이미지 중 조건에 맞는 텍스트를 바운딩하여 전사하는 프로젝트 입니다.

 

  • 이미지 내의 활성화 되어있는 모든 텍스트를 바운딩 하여 전사 합니다.
    (블러처리/어둡게처리/흐리게처리 되어있는 것만 비활성화 입니다.)

    (팝업 창이 뜨더라도, 뒤 화면이 앞과 같이 선명하게 잘 보이면 바운딩 대상입니다.)
  • 띄어 쓰기 기준으로 바운딩 하여 전사 합니다.
  • 키보드로 입력 가능한 텍스트만 바운딩 하여 전사 합니다. 
  • 텍스트의 색상이 바뀌어도, 띄어쓰기상 붙어있으면 하나로 바운딩 하여 전사 합니다.
  • 폰트의 종류가 바뀌어도, 띄어쓰기상 붙어있으면 하나로 바운딩 하여 전사 합니다.
  • 폰트의 크기가 바뀌어도, 띄어쓰기상 붙어있으면 하나로 바운딩 하여 전사합니다.
  • 텍스트가 겹칠때
     – 이미지 + 텍스트 : 시각적으로 글자의 인식이 가능하다면 바운딩 하여 전사 합니다.
     – 텍스트 + 텍스트 : 바운딩 하지 않습니다. 
  • 텍스트가 잘려있을 때 
     – 잘려있는 텍스트는 제외하고 온전한 텍스트만 바운딩 하여 전사 합니다.
  • 텍스트가 세로형 일때
     – 가로와 똑같이 세로로 바운딩 하여 전사 합니다.
  • 텍스트에 장식되어있는 디자인
     – 텍스트 부분만 바운딩 하여 전사합니다.
  • !, ?, #, @ 등 키보드로 입력 가능한 특수문자가 단독으로 있는 경우는 바운딩 합니다.>  > 문장부호인 마침표( . ), 물음표(?) 느낌표(!) 쉼표( , ) 콜론( : ) 세미콜론( ; ) 슬래시 ( / ) 큰따옴표(“ “) 작은따옴표(‘ ‘) 소괄호(( )) 중괄호({ }) 대괄호([ ]) 하이픈 (-) 언더스코어(_) 물결표(~) 는 띄어쓰기 기준으로 바운딩 후 그대로 전사 합니다.
  • 위의 문장부호를 제외한 나머지 특수문자는 바운딩 후 * 로 전사합니다. (11/23추가)
  • 한국어, 영어, 숫자는 그대로 바운딩 후 전사합니다. (11/23 추가)
  • 한국어, 영어, 숫자를 제외한 기타 언어는 바운딩 후 모두 * 로 전사합니다. (11/23 추가)
  • 키보드 이미지 내의 자음, 모음, 숫자 등은 바운딩 하지 않습니다. (11/25추가)

 

작업 방법

1. 작업 기준

작업

기준

  • 기본적으로 바운딩은 최대한 타이트하게 이루어져야 합니다.
  • 활성화 되어있는 부분의 텍스트만 바운딩 합니다.
  • 명백하게 텍스트인 부분만 바운딩 합니다.(11/24 추가)(11/30삭제)
    > 텍스트로 인식되는 모든 것들은 바운딩 후 전사해주세요.(11/30추가)
  • 바운딩 박스 및 텍스트가 겹치는 부분은 무관합니다.
  • 텍스트여도 눈으로 식별이 되지 않으면 바운딩 하지 않습니다.
    (추측하지 않고 보이는 대로 판단합니다)
  • 세로 텍스트는 세로로 바운딩합니다.
  • 텍스트와 연결되거나 겹쳐있는 장식은 바운딩하지 않습니다.
  • 텍스트의 색이나, 종류, 기가 달라도 띄어쓰기가 없다면 하나의 바운딩으로 처리합니다.
  • 글자 외곽선이 다중이거나 입체 효과 처리가 되어있는 경우, 명확한 외곽선 기준으로 바운딩합니다.
  • 한글/영어 이외의 언어는 모두 바운딩 하지 않습니다.
    > 한글/영어/숫자 이외의 언어는 바운딩하여 *로 전사합니다. (11/23추가)
  • 영문은 대,소문자 구별해야 합니다.
  • 키보드로 입력 가능한 특수문자가 단독으로 있는 경우도 바운딩 하여 *로 전사 합니다.
  • 단어 수평이 안 맞음
    • 수평이 맞지 않는 경우에도 단어 단위로 바운딩하는 것이 원칙입니다.

**상세 내용은 가이드 하단의 [작업 예시] 부분 확인 부탁드립니다.

작업불가
  • 이미지에 바운딩 할 것이 하나도 없을 때

2. 바운딩 기준 (11/23 수정)

바운딩 O 바운딩 X 
활성화 되어있는 부분의 텍스트 비활성화 되어 블러 처리되어 있거나 어두운 부분의 텍스트
잘린 텍스트의 온전한 부분 잘린 텍스트의 잘려있는 부분
텍스트의 색상,종류,크기가 달라도 띄어쓰기가 붙어있는 경우 텍스트 + 텍스트가 겹쳐있는 경우
텍스트+사진이 겹쳐있지만 인식 가능한 텍스트 텍스트+사진이 겹쳐있지만 인식 불가능한 텍스트
마침표( . ), 물음표(?) 느낌표(!) 쉼표( , ) 콜론( : ) 세미콜론( ; ) 슬래시 ( / ) 큰따옴표(“ “) 작은따옴표(‘ ‘) 소괄호(( )) 중괄호({ }) 대괄호([ ]) 하이픈 (-) 언더스코어(_) 물결표(~) 는 문자처럼 바운딩 후 보이는 대로 전사합니다. (11/23추가) 키보드 자판에 적힌 자음,모음, 숫자 특수문자 등의 텍스트 (11/23 삭제)
위의 문장부호를 제외한 모든 기호는 특수문자로, 바운딩하여 *로 전사합니다. 디자인 툴로 작업한 UI 아이콘  텍스트 (11/24추가)(11/30삭제)
한글,영어, 숫자를 제외한 기타 언어는 바운딩 하여 *로 전사합니다. 블러처리/어둡게처리/흐리게 처리 된 화면의 텍스트는 바운딩 하지 않습니다. (11/26수정)
팝업이 되어있지 않지만, 선명하게 잘 보이는 뒷 화면도 바운딩 하여 전사합니다. (11/26추가) 키보드 위의 자음,모음,숫자 등은 OCR하지 않습니다. (11/25수정)
디자인 UI 아이콘, 로고, 회사명, 버튼 등 에서 텍스트로 인식할 수 있는 모든 것은 바운딩 후 전사합니다.(11/30추가)  

작업 화면과 조작 방식

 

1. 작업화면

  • 바운딩 후 해당 텍스트 입력 가능
  • 스크린샷 이미지에 바운딩 할 수 있는것이 하나도 없다면 > 작업불가
  • 바운딩 가능한 텍스트를 모두 바운딩 해주세요.

2. 조작 방식

 

① 바운딩 박스를 만들거나 움직입니다.

② 사진의 크기를 조절합니다.

③ 사진을 움직입니다.

마우스 왼쪽 버튼 클릭: 바운딩 박스 점 클릭, 점 3개 클릭 후 더블클릭하면 사각형 박스 생성

 

작업 예시

[단어 단위 바운딩]
좋은 예 나쁜 예

단어 단위로 바운딩 (1)

글자의 색이나 크기가 달라도 하나의 바운딩으로 처리해야 합니다.

단어 단위로 바운딩 (2)

띄어쓰기 단위로 바운딩해야 합니다.

[활성화 부분만 바운딩] 단, 팝업 뒤쪽이 앞쪽처럼 어둡게처리/블러/흐리게 보이지 않고 선명하게 보인다면 바운딩 대상입니다. (11/26 추가)
바운딩 범위

[작업 예시]

CASE 1. 겹치는 TEXT

– 바운딩 박스 및 텍스트가 겹치는 부분은 무관합니다.

 

CASE 2. 세로 TEXT

– 세로 텍스트는 세로로 바운딩합니다.

 

CASE 3. TEXT 장식 불필요

– 텍스트와 연결되거나 겹쳐있는 장식은 바운딩하지 않습니다.

 

CASE 4. TEXT 색구분 불필요

– 한 단어지만 글자의 색이나 크기가 달라도 하나의 바운딩으로 처리합니다.

 

CASE 5. WORD 수평이 안 맞을 경우

– 상기 ①과 같이, 수평이 맞지 않는 경우에도 단어 단위로 바운딩하는 것이 원칙입니다.

– 상기 ②와 같이, 글자 별 수평이 심하게 안 맞는 경우에 한해, 단어를 쪼개 바운딩합니다.

 

CASE 6. 제목 바운딩 박스에 다른 문자 등이 어쩔 수 없이 들어가는 경우

– 별 모양의 TEXT 장식과 ‘TM’ 글자는 제목으로 보지 않지만, 이 글자를 제외하고 바운딩 하는 것은 사실상 불가능하므로 같이 바운딩 합니다.

 

CASE 7. 글자가 잘린 경우

– 잘린 부분을 제외하고 바운딩 처리해주시면 됩니다. (예: ‘단장’ 만 바운딩)

 

CASE8. 키보드 이미지 바운딩

 

 

CASE 9. 글자+글자 겹칠 때

 

CASE 10. 텍스트처럼 보이는 그림

Updated on 2020년 11월 30일

Was this article helpful?