라이브 커머스 음성 받아쓰기 프로젝트

주의사항

  • 본 프로젝트의 데이터는 인공지능 학습용으로 사용됩니다.
  • 본 프로젝트는 아래 가이드 숙지 후에 작업이 가능합니다.
  • 반려된 건에 대해 수정하지 않고 다시 제출하는 경우, 3회 이상 반려를 당할 경우 작업 불가 대상이 될 수 있습니다.
  • 데이터 할당을 받기 위하여 대충 작업하고 반려받아 재작업하는 행위는 엄격히 금지됩니다. 발견 시 작업금지 회원이 될 수 있습니다.
  • 반려된 건에 대해 26시간 이내 재작업하지 않으면 작업물이 삭제됩니다.

프로젝트 소개

음성 파일을 들으며 규칙에 맞게 받아쓰는 프로젝트입니다. 받아쓰기(전사) 규칙을 반드시 확인하시고 프로젝트를 진행해 주세요.

이 프로젝트는  AI 소프트웨어를 개발하는 데에 활용됩니다.

[모니터링 게시판 운영 안내]

  • 본 프로젝트는 모든 작업자를 대상으로 daily 모니터링 중 입니다.
  • 불량률 10%
    • 주의 조치
    • 주의 조치 사유 안내
  • 불량률 20% ~ 30% 미만 / 또는 주의 조치 2회 이상
    • 해당 프로젝트 참여 제한 조치
    • 참여 제한 조치 사유 안내
    • 1일 불량률 40% 이상일 경우 주의 조치 없이 바로 참여 제한 조치 적용
  • 게시글 내에 각 조치가 시행된 일자와 사유를 안내 드립니다.
  • 매일 오후 3시에 업데이트 된 내용을 확인 후 작업에 바로 적용 부탁 드립니다.

가이드 수정 사항

변경 일자 변경 된 내용
21.11.19
  • 이중 전사 규칙 및 주 반려 사유 내용이 수정/추가 되었습니다.
  • 가이드 변경 시점 이후 검수된 건은 변경된 가이드를 기준으로 검수 됩니다.
  • 반려된 작업은 가이드를 확인하시고 재작업 해주세요.
21.11.15
  • 가이드의 주요 규칙이 대다수 변경되었으니 다시 한번 확인 부탁드립니다. 변경된 시점 이후 이전 가이드 기준으로 작업한 경우 반려 대상이 될 수 있으며, 반려 작업이 반복될 경우 작업에서 제외될 수 있습니다. 반드시 유의해주세요.
21.11.03
  • 가이드 내 [주 반려 사유]가 추가 되었습니다.
  • 전사 규칙 중 1번, 5번, 7번, 9번의 예시가 변경 되었습니다. (기본 규칙, 받아쓰기 대상, 이중 전사 대상 등에 대한 내용으로 반드시 변경 된 가이드를 숙지하고 작업해 주세요.)
  • 기존 전사 규칙 중 2번, 11번이 삭제 되었습니다.
  • 작업 불가 예시가 변경 되었습니다.

주 반려 사유

  1. 문장 끝에 마침표를 사용하면 안됩니다.
  2. 금액을 적을 때 “원”자는 괄호 밖에 작성해 주세요. 이중전사 대상만 괄호 안에 작성합니다.
    • (200-이백원) 할인 (X)
    • (200-이백) 원 할인 (O) / (200-이백)원 할인 (O)
  3. 말하는 사람이 달라지더라도 구분 없이 들리는 대로 모두 한 줄에 작성해 주세요.
    1. 그리고 시작이라고 (넹) 하는 순간 들어가셔서 구매하시면 됩니다 (오케이) (X)그리고 시작이라고 넹 하는 순간 들어가셔서 구매하시면 됩니다 오케이 (O)
    2. A: 무려 (7-일곱) 개에요 /B: 어머 /A: 이렇게 (X)무려 (7-일곱) 개에요 어머 이렇게 (O)
  4. 목소리가 겹쳤을 때
    1. 말(어/아/음/응/네 추임새)과 말이 한순간이라도 겹치면 작업불가 입니다.
    2. 말이 아닌 것(웃음소리, 기침, 웅성웅성하는 소리, 가사 없는 배경음악)과 말이 겹치면 작업가능합니다.
    3. Tip 겹쳤는지 아닌지 확인할 수 있는 방법
      • 일시정지(단축키: 스페이스바)하시고 아래쪽 동그라미를 움직여서 그 부분부터 들어보세요. 빠른 판단에 도움이 됩니다.
  5. 정확하게 알아들을 수 없을 때
    1. 말하는 사람이 정확히 말했는데, 상품명/성분명/주식/금융 관련 용어라서 아무리 들어도 잘 모르겠다면 인터넷에 검색 후 정확하게 작성해 주세요.
    2. 말하는 사람이 얼버무리거나 혀가 꼬였을 경우에는 정답이 있는 것은 아니니 최대한 음성과 가깝게 받아쓰기 해주세요.
  6. 빠진 말이 있거나 안 들리는 데 추측해서 넣은 말이 있을 경우 반려 대상입니다.
    1. 음성과 대충 비슷하게 받아쓴 경우 반려대상입니다.
    2. 음성과 일대일로 매칭되도록 받아쓴 경우에만 검수 통과입니다.

작업방법

  • 검수가 지연되고 있습니다. 검수자를 지속적으로 추가 중이고, 검수자 분들이 순차적으로 열심히 검수 중이니 조금만 기다려주시면 검수됩니다. 검수 지연에 불편 드려 죄송합니다.

1. 전사 규칙

[전사 대상]

  1. 기본적으로 맞춤법에 따라 전사합니다.
    • 맞춤법에 맞지 않지만 아래의 경우는 들리는 대로 전사합니다.

      1. 사투리(느그 얼라 그랬니껴 밥 묵었노)

      2. 요즘말((1-일)도 모르겠죵 빡친다 )

      3. 요렇게/요거/이것/이거 모두 들리는 대로 받아쓰기 합니다.
      4. 맞춤법에 맞지 않지만 일상적으로 쓰여 맞춤법에 맞게 고치면 원 발음과 전사 텍스트가 너무 멀어지는 구어체

        1. 맞춤법에는 맞지 않지만 일상적으로 쓰이는 단어: 쓰레빠, 랍스터, 구좌, 이쁘다, 드럽다, 같애요, 하구요, 쪼끔 (O)

        2. 맞춤법에 맞게 고치지 마세요: 슬리퍼, 로브스터, 계좌, 예쁘다, 더럽다 (X)

  2. 내용을 임의로 고치지 말고 들리는 대로 전사합니다.
  3. 맞춤법에 맞지 않는 어법의 경우 들리는 것을 우선하여 적습니다.
  4. 들리는 대로 전사하되, 조사가 단어를 훼손시키는 경우에는 풀어서 작성합니다.
    • [예시]
      1. 계좐데요 (X)계좌인데요 (O)
      2. 카든데요 (X)카드인데요 (O)
      3. 고객센텁니다 (X)고객센터입니다 (O)
      4. ‘계좐’, ‘카든’ 이라는 단어는 존재하지 않기 때문에 조사가 단어를 훼손시키지 않도록 전사해야 합니다.
  5. 들리는 내용을 빠짐없이 전사하되 임의로 내용을 추가하거나 빼면 안됩니다. 음성이 잘려서 편집된 파일은 들리는 부분부터 전사합니다.
  6. 겹치지 않는 추임새(네네, 아 등)는 모두 전사해주세요. (아/어, 예/에/네 구분 정확히 해주셔야 검수 완료됩니다.)
  7. 모든 내용은 한글로 들리는 대로 전사합니다. (알파벳, 기호 사용 금지)
    • [예시]

      1. 1+1 혜택 드립니다 (X)(1-원) 플러스 (1-원) 혜택 드립니다 (O)
      2. 비타민C 성분들을 더 많이 넣어놧습니다 (X)비타민씨 성분들을 더 많이 넣어놨습니다 (O)
  8. 모든 기호는 ! ? ‘ “ , . + @ # $ % & * 는 사용하지 않습니다.

  9. 숫자는 한글과 한글 독음을 이중전사 합니다. 괄호 안에 로마숫자-한글독음 형식으로 전사해 주세요. 품사 (관형사, 수사, 명사)와 관계 없이 로마자(1,2,3)로 바꿔 적을 수 있는 단어는 모두 이중전사 대상입니다.

    1. 작업과 검수의 편의성을 위해 큰 숫자일 경우 이중전사 규칙을 변경하였습니다.
    2. 기본 원칙 (숫자-한글로만 된 숫자 표현)
    3. [예시]

      1. (3000-삼천) 달러
      2. (1000-일천) 명
      3. (5-다섯) 마리
      4. (4-사)인 이상 집합금지
    4. [앞에 오는 숫자가 10,000 이상일 때 : 숫자에 [만/억/조]를 사용하여 표기]
      1. (5000만-오천만) 국민 (O) / (500000000-오천만) 국민 (X)
      2. (100억-백억) 투자 (O) / (10000000000-백억) 투자 (X)
      3. (2조-이조)원 규모 (O) / (2000000000000-이조)원 규모 (X)
      4. (1-일)억 원 (X) / (100000000-일억) 원 (X) / (1억-100,000,000)원 (X) (1억-일억)원 (O)
      5. (9-구)만 (9-구) 천 원(X) / (99000-구만구천) 원 (X) (9만9000-구만구천)원 (O)
    5. [앞에 오는 숫자가 10,000보다 작은 숫자일 때]
      1. 53마리 (X) / 오십삼마리 (X)(53-오십삼)마리 (O) / (53-쉰세)마리 (O)
      2. 한 마리 (X) / (1-한) 마리 (O)
      3. (1-하나) (2-둘) (3-셋) (O)
      4. 두 번째 (X)(2-두) 번째 (O)
    6. [앞에 오는 숫자가 10,000보다 작은 영어 숫자일 때]
      1. (1-원) (2-투) (3-쓰리) (O)
      2. (2-투) 플러스 (1-원) 혜택 드립니다 (O)
    7. [소수점 표기]
      1. ‘쩜’이 아니라 ‘점’이라고 전사해야 통과됩니다. 
      2. 앞에 오는 숫자는 0.00의 형태로 적으시고, 뒤에 한글로 읽는 방식은 “몇 점 몇몇” 으로 적으시면 됩니다.
      3. (0.35-영쩜삼오) 퍼센트 (X)(0-영) 점 (35-삼오) 퍼센트 (X) (0-영) 점 (3-삼) (5-오) 퍼센트 (X) / (0.35-영점삼오) 퍼센트 (O) / (0.35-영 점 삼오) 퍼센트 (O)
    8. [기타]
      • 유월, 시월이라고 발음했을 경우
        • (6-육)월 (X) – (10-십)월 (X) / (6-유)월 (O) – (10-시)월 (O)
    9. [녹음 대본] 3시 31분에 31명이 관악로31에 있는 베스킨라빈스31에 갔다
      1. (3-세) 시 (31-삼십일) 분에 (31-서른한) 명이 관악로 (31-삼일)에 있는 베스킨라빈스 (31-서티원)에 갔다
      2. 세/삼십/서른/삼일/서티원 모두 로마자 3 또는 31을 적을 수 있으므로 모두 이중 전사합니다.
  10. 사투리는 표준어로 고치지 않고 들리는 그대로 전사합니다.
  11. 들리는 대로 모두 적는 것이 아니라 반드시 문맥에 맞게 전사해야 합니다.
    • [예시]
      1. 정수기 띄어가세요 (X) – 정수기 떼어가세요 (O)
      2. 카드결재 (X) – 카드결제 (O)

[전사 제외 대상]

  1. 웃음소리나 기침 등과 같이 말이 아닌 것은 전사하지 않습니다.
  2. 중간에 말을 끊고 다른 말을 하는 경우에는 중간의 내용을 임의로 채워서 작성하면 안됩니다.
    • [예시] 아 진짜 같이 가면 좋겠 아 정말
  3. 말이 확실하게 끝나지 않은 경우라도 내용을 임의로 채워서 작성하면 안됩니다.
  4. 말하는 사람이 분명하게 말하지 않아서 알아듣기 힘들거나 혀가 꼬인 채로 말하고 있는 음성은 작업 대상에서 제외합니다. (작업 불가)
  5. 마침표는 사용하지 않습니다.
    • [예시]
      1. S&P 500지수가 또 1p 상승했다. (X)
      2. 에스엔피오백지수가 또 일포인트 상승했다 (X)
      3. 에스엔피(500-오백) 지수가 (1-일)포인트 상승했다 (O)
  6. 배경 음악으로 나오는 노래의 가사는 전사 대상이 아닙니다.

2. 작업 불가

작업 불가 해당 작업 불가 비해당
  • 추임새 (아/네/어 등)와 겹친 경우
  • 가사 있는 노래가 배경 음악으로 깔리고 음성과 겹친 경우
  • 말이 한 순간이라도 겹친 경우
  • 영어 외 다른 외국어로 된 문장의 경우
  • 혀가 꼬인 경우 (알아 듣지 못할 정도)
  • 배경 음악으로 나오는 노래의 가사만 나오는 경우
  • 말이 아닌 것 (웃음소리, 기침 등)과 겹친 경우

작업예시

 

작업화면과 조작방식

1. 작업 화면

2. 조작 방식

3. 크롬 자동 번역 OFF

① 크롬 우측 상단에서 [ 크롬 맞춤 설정 및 제어 ]로 진입합니다.

[ 설정 ]을 클릭해 주세요.

③ 좌측 메뉴에서 [ 고급 ]을 클릭해 주세요.

좌측 메뉴에서 [ 언어 ]를 클릭해 주세요.

[ 언어 ] 탭을 클릭해주세요. 숨겨진 창이 보입니다.

⑥ 언어 설정 중 [ 이 언어로 된 페이지에 대한 번역 옵션 제공 ]을 이미지와 같이 비활성화 해주셔야 합니다.

  • 위 기능을 설정하지 않을 경우, 반려 메시지가 자동 번역되어 정확한 안내를 받지 못하게 되니 꼭 설정 부탁드립니다.
Updated on 2021년 11월 23일