SNS 대화 주제 태깅

프로젝트 소개

SNS 대화 속에서 나타나는 주제를 작업 기준에 맞게 분류하는 프로젝트입니다.

  1. 작업화면 내 SNS 대화 내용을 확인합니다.
  2. 주제분류표를 필수로 확인하고, 대화 내용에 알맞는 주제와 세부 주제를 선택합니다.
    • 대화를 읽고 1~3개의 주제를 선택합니다.
    • 첫 줄, 한 두개의 단어만 읽지 않고, 전체 대화를 끝까지 읽습니다.

이 프로젝트는 SNS 대화를 이용한 AI 모델 고도화에 활용됩니다.

  • 본 가이드에는 순화되지 않은 불쾌한 표현이 다수 작성되어 있습니다.
    작업 기준에 대한 이해를 돕기 위함이므로, 양해 부탁드립니다.

작업방법

작업페이지

이 프로젝트는 기존 크라우드웍스 작업페이지가 아닌 다음 링크로 접속해 주세요.

주제분류방법

주제 분류표 링크 : 클릭해 주세요!

  • 내용을 추측하지 않고, 화면에 보이는 대화만으로 분류합니다.
  • 대화 속 주제를 적게는 1개 많게는 3개까지 선택합니다.
  • 같은 주제에 대한 대화는 하나로 묶어 주제에서 상세주제 순서로 분류합니다.
    • 주제 : 대화의 전체적인 내용을 보고 주제를 선택합니다.
    • 상세주제 : 주제분류표 분류기준 설명을 보고, 적합한 상세주제를 선택합니다.

작업예시

주제분류표를 꼼꼼하게 읽은 후 다음 예시를 확인해주세요.

예시 1)

 

예시 2)

주제분류기준

하나의 주제로 2턴 이상 대화를 진행한 경우만 주제로 분류합니다.

1턴 인정 기준

  • 대화 상대의 말에 대한 리액션 ⇒ 1턴으로 인정
  • 대화 중에 확실한 다른 주제에 대한 말로 답변 ⇒ 1턴으로 인정
  • 문장으로 답변 ⇒ 1턴으로 인정
  • 의미를 알 수 있는 모음으로 답변 ⇒ 1턴으로 인정
    예시) ‘ㄳ = 감사, ‘ㅇㅇ = 응응’, ‘ㄱㄱ = 하자, 가자’, ‘ㅈㅅ = 죄송’, ‘ㅈㅈ =  포기한다’, ‘ㅊㅋ = 축하’ 등

자주 틀리는 내용

  • 코로나 확진자에 대한 수치와 동선, 방역수칙, 예방책, 백신 접정 정보는 [건강/미용_건강정보공유]로 분류합니다.

 

작업불가

작업불가에 해당하는 대화는 [작업불가] 버튼을 누르고, 정확한 이유를 작성해 제출합니다.

  • 작업불가 예시 : 클릭해 주세요!
  • 비식별화된 내용은 작업 대상입니다.
    • 비식별화 : 기존 글자의 성격을 유지하되 정보는 보호하는 정보처리 방법
      예시) #@계정#, #@번호#, #@주소#, #@이름# 등
  • 대화하고 있는 사람의 정보 혹은 소속을 추측할 수 있는 경우
  • 개인정보를 언급한 경우
    • 아이디, 이메일 주소, 개인 SNS 주소 등
    • 상세 주소 또는 거주 건물 등
    • 실명, 별명, 대화명, 소속된 단체명 등
  • 개인 식별 정보를 언급한 경우
    • 개인 식별 정보 : 주민등록번호, 학번, 전화번호, 계좌번호, 카드번호, 비밀번호, 의료기록번호, 건강보험번호 등
  • 희귀 병명을 언급한 경우
    • 직장, 학술, 공부/시험 주제가 아닌 대화에서 흔히 접할 수 없는 희귀 병명을 언급한 경우
      예시) 알라질 증후군, 코핀-시리스 증후군, 항트롬빈결핍, 할택뇌증 등
  • 한 사람으로 유추 가능한 직업을 언급한 경우
    • 예시) 대통령, 국무총리, 20XX년 아시안게임 단거리 남자 육상 금메달 등
  • 사회적으로 민감한 이슈를 언급한 경우
    • 정치적 견해, 특정 인물을 향한 비하, 성적 표현 등
    • 대화 속 2턴 이상 & 6발화 이상 해당 대화를 진행하는 경우
  • 작업화면 오류
    • 데이터 로딩이 되지 않는 경우
  • 대화 내 욕설, 은어 등을 포함한 경우

비속어 / 은어 기준

  • 비속어 제외 단어 검색 시트
    • 해당 시트에 없는 단어는 모두 작업불가 대상입니다.
    • 기존 예외 기준 삭제되어 새끼, 미쳤다, 도랐다 등 모두 작업불가 처리합니다.
  • 비속어 기준
    • 비방의 목적을 가지는 경우 / 대상 비하, 비방 목적이 명백한 대화인 경우 작업불가 대상입니다.
  •  ~빠, 빠순이, 빠돌이 / ~충으로 끝나는 말
    • 이와 유사한 단어는 비하의 뜻이 담겨있으므로 작업불가 대상입니다.
  • 웅앵웅, 웅앵
    • 남혐과 관련하여 논란의 여지가 있으므로 작업불가 대상입니다.
  • 접두어 ‘개’의 기준
    • 작업불가 : 욕설로 사용하는 경우만 작업불가 대상입니다.
    • 작업대상 : 개웃겨, 개극혐, 개노맛 등과 유사한 의미로 쓰인 경우

작업화면

PC

  1. SNS 대화 내용을 확인합니다.
  2. 대화에 알맞은 대화 속 주제&세부주제가 체크되어 있는지 확인합니다.
    • 잘못된 주제가 체크된 경우 반드시 수정합니다.
    • 주제분류표를 반드시 참고해주세요.
    • 최대 3개까지 주제 선택 가능합니다.
  3.  [저장]버튼을 눌러 작업 내용을 저장합니다.
  4. 작업 제출 버튼을 클릭합니다.

모바일

 

  1. SNS 대화 내용을 확인합니다.
  2. 대화에 알맞은 대화 속 주제&세부주제가 체크되어 있는지 확인합니다.
    • 잘못된 주제가 체크된 경우 반드시 수정합니다.
    • 주제분류표를 반드시 참고해주세요.
    • 최대 3개까지 주제 선택 가능합니다.
  3.  [저장]버튼을 눌러 작업 내용을 저장합니다.
  4. 작업 제출 버튼을 클릭합니다.

크롬 자동 번역 OFF

  • 위 기능을 설정하지 않을 경우, 반려 메시지가 자동 번역되어 정확한 안내를 받지 못하게 되니 꼭 설정 부탁드립니다.
주의사항

  • 성실한 작업자를 보호하고 우대하기 위해 불성실하게 작업에 참여하거나 프로젝트 선발 후 미참여 시 제재가 진행되며 이후 3개월간 크라우드웍스 내 모든 프로젝트 참여가 제한됩니다.

Updated on 2022년 12월 9일