금융 상담 챗봇 대화문 키워드 태깅하기 2

프로젝트 소개

금융 상담 대화문에서 주요 내용을 태깅하는 프로젝트입니다.

  1. 사용자가 챗봇에게 금융 상담을 하는 대화문이 주어집니다.
    • 각 대화문에는 상담 주제와 상담 목적이 있습니다.
  2. 대화 문장에서 다음 내용이 담겨 있는 표현을 드래그하고 태깅합니다.
    • 사용자 정보
    • 호출 키워드
    • 주요 키워드
  3. 주요 키워드 중 다수의 대상이 나올 경우 식별값을 태깅합니다.
  4. 대화 문장이 다음 정보를 포함하고 있을 경우 박스를 체크해서 태깅합니다.
    • 외부 지식

이 프로젝트는  AI 소프트웨어를 개발하는 데에 활용됩니다.

작업 화면

  1. 기본 정보
    1. 프로젝트 제목과 상담 대화문의 주제가 나타납니다.
    2. 상담 주제에 맞는 상담 목적을 확인합니다.
      • 단일 주제 프로젝트의 경우 상담 목적을 한 개 표시합니다.
      • 복합 주제 프로젝트의 경우 상담 목적을 두 개 표시합니다.
    3. 대화문에서 상담을 요청한 사용자의 이름입니다.
  2. 대화 문장
    1. 아래 대화 문장이 사용자/챗봇 중 누구의 말인지 나타냅니다.
    2. 대화 문장이 표시됩니다.
    3. 대화 문장에서 글자를 드래그하면 오브젝트가 생성됩니다.
      • 드래그를 했을 경우 위 예시 이미지의 마침표처럼 해당 범위가 파란 색으로 표시됩니다.
      • 작업을 저장하기 전이라면 다시 드래그해서 범위를 수정할 수 있습니다.
    4. 대화 문장에서 드래그한 부분을 표시합니다.
    5. 알맞은 태깅 정보를 선택해서 태깅합니다.
    6. 작업을 삭제하거나 저장할 수 있습니다.
      • 대화 문장 하나에서 여러 개를 드래그할 경우, 작업을 저장한 뒤 다시 대화 문장에서 드래그합니다.

드래그하기

  • 주요 내용이 담긴 부분을 드래그합니다.
  • 주요 내용이 명사로 표현되는 경우 명사 부분만 드래그합니다.
    • ‘~하다’ 부분이 생략 가능한 경우입니다.
    • 예시
  • 주요 내용이 동사로 표현되는 경우 실질적 의미를 담고 있는 부분을 드래그합니다.
    • 단어가 동사로 사용되며 형태가 변경된 경우입니다.
    • ‘~습니다.’, ‘~을게요.’, ‘~요.’ 등의 끝말은 제외합니다.
    • 예시
  • 드래그 할 때 앞뒤 불필요한 조사나 공백을 제외합니다.
  • 주요 내용 사이에 다른 단어가 들어갈 수 있습니다.
    • 위 예시에서 주요 내용은 각각 ‘용용카드 발급’과 ‘예금 계좌 조회’입니다.

태깅하기

  • 사용자 정보/호출 키워드/주요 키워드는 각각 하나씩만 태깅할 수 있습니다.
    • 한 문장에 키워드가 여러 개일 경우, 하나씩 태깅해 각각 저장합니다.
    • 태깅 범위가 겹치는 경우에도 하나씩 태깅해 각각 저장합니다.

사용자 정보

  • 사용자(현재 챗봇에게 금융 상담을 하고있는 사람)의 개인 정보를 뜻합니다.
    • 대화문에서 드러나는 개인 정보는 이름과 생년월일입니다.
  • 대화 문장에 사용자의 개인 정보가 있을 경우, 드래그하고 박스에 체크합니다.
  • 개인 정보 태깅은 사용자 본인 정보에 한합니다.
    • 타인의 개인 정보는 태깅하지 않습니다.
  • 이름과 생년월일 외 개인 정보가 드러났을 경우, 주요 키워드에서 공통 키워드로 태깅합니다.
    • 팩스 번호, 주소, 이메일 주소, 전화 번호

호출 키워드 (사용자)

[기능 호출]

  • 상담 목적이 드러나는 표현입니다.
    • 예시: 새 계좌를 만들고 싶어요. / 펀드를 해지하고 싶은데요.
    • 드래그 범위를 빨간색으로 표시하였습니다.
  • 해당 상담 목적을 처음으로 나타낸 표현에 태깅합니다.
  • 기능 호출은 상담 목적의 개수만큼 태깅합니다.
    • 상담 목적 1개 – 기능 호출 1개
    • 상담 목적 2개 – 기능 호출 2개

[취소]

  • 대화 중 사용자가 특정 기능 수행을 취소하는 경우 태깅합니다.
    • 취소를 고민하는 것이 아닌, 취소를 확정하는 대화 문장에서 태깅합니다.
  • 대화 문장에서 ‘취소’라는 단어만 드래그합니다.

호출키워드 (챗봇)

[외부 지식]

  • 외부 지식은 금융 관련 보편적 지식부터 상품 설명서나 은행 매뉴얼에 있는 정보를 말합니다.
    • 상품: 계좌, 카드, 대출 상품, 금융 상품
  • 사용자가 문의한 내용에 대한 답변이나 안내에만 태깅합니다.
    • 챗봇이 기능 수행을 위해 정보를 요청하는 경우는 해당하지 않습니다.
  • 해당 정보가 주요 키워드가 아닐 때만 태깅합니다. 
  • 예시 1
    • 사용자: 해지한 후에 계좌를 다시 부활시킬 수 있을까요?
    • 챗봇: 네, 당일에 한해 해지 취소 처리가 가능합니다. (외부 지식) 
  • 예시 2
    • 사용자: 연체 상태인 카드를 해지하려면 어떻게 하나요?
    • 챗봇: 연체금을 전부 납부하시면 해지가 가능합니다. (외부 지식)
  • 챗봇의 대화 문장에 외부 지식이 있을 경우, 마지막 문장 부호를 드래그한 뒤 외부 지식 박스를 체크합니다.
    • 외부 지식이 포함된 문장의 마지막 문장 부호가 아닌, 해당 대화의 마지막 문장 부호를 드래그합니다.

주요 키워드

  • 상담 목적에 따른 주요 키워드 목록은 다음 링크에서 확인할 수 있습니다.
  • 작업 시 주요 키워드 목록을 함께 띄워 놓고 작업하기를 권장합니다.
  • 주요 키워드 설명을 꼼꼼히 확인하고 대화문에 해당하는 내용이 있다면 태깅합니다.
    • 모든 키워드를 태깅해야하는 것이 아니라, 대화문에 있는 키워드만 태깅합니다.
  • 태깅시 대화 흐름에 맞는 상담 목적을 먼저 선택한 후 주요 키워드를 선택합니다.
  • 대화문에 해당하는 상담 목적의 주요 키워드만 사용해야 합니다. 
주요 키워드 사용 예시

  • 위 예시 대화의 상담 목적은 카드 해지이기 때문에 카드 해지의 주요 키워드만 사용 가능합니다.
  • 카드를 해지하기 전 사용 내역을 조회하지만 카드 해지의 주요 키워드 목록에는 조회와 관련된 키워드가 없으므로 태깅하지 않습니다.
  • 대화문에서 한 가지 주요 키워드가 여러 번 나온다면 가장 처음 나온 대화 문장에서 태깅합니다.
최초 등장 태깅 예시

  • ‘제로카드’를 처음 나온 대화 문장에서 태깅합니다.
    • 예외) 동일한 단어라도 대화문 흐름에 따라 다르게 태깅할 수 있습니다.
동일 표현 / 다른 키워드 예시

  • ‘박하준’을 앞서 사용자 정보로 태깅했지만 대화 내용에 따라 계좌 예금주명으로도 한 번 더 태깅합니다.
  • 위 예시처럼 대화 내용을 기준으로 판단해서 태깅합니다.
    • 예외) 키워드의 범위가 구체화되거나 단위가 달라진 경우에는 둘 다 태깅합니다.
      • 단, 동일한 키워드를 가리키는 다른 표현의 경우 태깅하지 않습니다.
구체화/다른 단위 태깅 예시 (1)

  • 조회 일시로 ‘지난주’를 태깅했지만, 카드 내역을 조회하며 정확한 날짜 ’23일 수요일’이 나왔으므로 한 번 더 태깅합니다.
구체화/다른 단위 태깅 예시 (2)

  • 결제 금액으로 ‘500달러’를 태깅했지만, 원화로 환산된 값 ’65만원’도 함께 태깅합니다.
  • 주요 키워드에 해당하는 값이 ‘없다’는 표현도 태깅합니다.
    • 다른 태깅과 달리 ‘없어요’, ‘없습니다’의 끝말까지 포함합니다.
    • 태깅이 끝말까지 포함될 경우 문장 부호는 제외합니다.
값이 없는 표현 태깅 예시 (1)

  • 중도상환수수료는 없으므로 ‘없는’을 중도상환수수료로 태깅합니다.
값이 없는 표현 태깅 예시 (2)

  • 계좌의 잔액이 없으므로 ‘없습니다’를 계좌잔고로 태깅합니다.
  • 문장 부호는 제외하고 태깅합니다.
값이 없는 표현 태깅 예시 (3)

  • ‘발생하지 않’는다는 표현으로 값이 없는 것을 드러냈기 때문에 해당 부분을 태깅합니다.

식별값

  • 주요 키워드에서 태깅할 수 있습니다.
  • 각각의 상품과 상품 정보를 연결하기 위해 태깅합니다.
    • 상품과 그 상품에 대한 정보는 반드시 동일한 식별값을 가집니다.
식별값 태깅 예시

  • ‘마일리지 플래티넘 카드’와 ‘스페셜 마일리지 카드’와 같이 두 가지 상품이 나왔으므로 순서대로 식별값을 태깅합니다.
  • ‘마일리지 플래티넘 카드’는 식별값 1로 태깅했으므로 이 카드의 연회비와 혜택을 동일하게 식별값 1로 태깅합니다.
  • ‘스페셜 마일리지 카드’는 식별값 2로 태깅했으므로 이 카드의 연회비와 혜택을 동일하게 식별값 2로 태깅합니다.
  • 공통적으로 해당하는 키워드가 있다면 중복 태깅합니다.
    • 단, 여러 상품이 먼저 등장했거나 여러 상품과 동시에 등장할 때만 가능합니다.
중복 태깅 예시 (1)

  • ‘희망적금’과 ‘사랑적금’이 등장했으므로 식별값 1, 2로 각각 태깅합니다.
  • ‘정기 적금’은 ‘희망적금’과 ‘사랑적금’에 공통적으로 해당하는 키워드고, 두 가지 상품이 이전 대화 문장에 먼저 등장했으므로 식별값 1, 2로 각각 두 번 태깅합니다.
중복 태깅 예시 (2)

  • ‘뿅뿅카드’와 ‘송송카드’가 등장했으므로 식별값 1, 2로 각각 태깅합니다.
  • ‘신용카드’는 ‘뿅뿅카드’, ‘송송카드’에 공통적으로 해당하는 키워드고, 두 가지 상품과 같은 대화 문장에서 동시에 등장했으므로 식별값 1, 2로 각각 두 번 태깅합니다.
    • 공통적으로 해당하는 키워드라도 대화에 여러 상품이 등장하기 전이라면 식별값을 태깅하지 않습니다. 
중복 태깅 X 예시 (상품 등장 전)

  • ‘안전하고 수익률 좋은 상품’은 금융 상품 선택 조건이므로 금융상품종류에 태깅합니다.
    • 이때, 여러 상품이 먼저 등장하지 않았으므로 식별값을 태깅하지 않습니다.
  • ‘채권증권투자신탁’과 ‘국공채증권투자신탁’ 두 가지 상품이 등장했으므로 식별값 1, 2로 각각 태깅합니다.
  • 이자율은 ‘채권증권투자신탁’과 ‘국공채증권투자신탁’에 공통적으로 해당하는 키워드고, 앞서 두 가지 상품이 등장했으므로 식별값 1, 2로 각각 태깅합니다.
  • 상담 목적 하나에서 상품이 한 가지만 등장할 경우 식별값을 태깅하지 않습니다.
상담 목적 하나에 상품 한 가지 등장 예시

  • 위 예시에서 상담 목적 [카드 해지]와 [계좌 삭제]에 대한 대화가 이루어집니다.
  • 상담 목적 [카드 해지]에 관한 대화에서 ‘한마음카드’와 ‘한사랑카드’ 두 가지 상품이 등장했으므로 식별값 1, 2로 각각 태깅합니다.
  • 상담 목적 [계좌 삭제]에 관한 대화에서 ‘적금 계좌’ 한 가지 상품만 등장했으므로 식별값을 태깅하지 않습니다.
  • 상품 종류가 여러 개 나왔지만 한 가지 종류의 상품명만 등장할 경우 상품명에 기준을 두고 태깅합니다.
여러 상품 종류 중 한 가지만 다룰 경우

  • ‘자유 적금’과 ‘정기 적금’이 등장했지만, 이후 대화는 정기 적금 상품명만 등장합니다.
  • ‘정기 적금’만 상품 종류로 태깅합니다.
  • ‘아리랑정기적금’과 ‘하나통일정기적금’이 등장했으므로 각각 식별값 1, 2로 태깅합니다.
  • 이자율도 각각 해당하는 상품과 동일한 식별값으로 태깅합니다.
  • 주요 키워드 중 개인 정보에 해당하는 공통 키워드는 식별값 ‘없음’을 태깅합니다.
    • 팩스 번호, 주소, 이메일 주소, 전화 번호

태깅할 내용이 없을 경우

  • 대화 문장에 태깅할 키워드가 없는 경우
    • 대화 문장의 마지막 문장 부호(마침표 혹은 물음표)를 드래그하고 저장합니다.
    • 대화문이 문장 부호로 끝나지 않을 경우 마지막 글자를 드래그합니다.
  • 대화 문장이 None으로 표시되는 경우
    • None의 마지막 글자 e를 드래그하고 저장합니다.

작업 불가

  • 다음 중 하나라도 해당한다면 작업 불가입니다.
    • 6개 이상의 상품이 등장해 식별값을 전부 태깅할 수 없을 경우
    • 대화 문장과 말하는 사람이 다를 경우
      • 예: 챗봇 차례에 사용자의 문장이 있음
    • 상담 목적과 다른 내용의 대화가 진행될 경우
      • 예: 계좌 삭제 목적에서 계좌 내역 삭제를 문의

작업 예시

크롬 자동 번역 OFF

  • 위 기능을 설정하지 않을 경우, 반려 메시지가 자동 번역되어 정확한 안내를 받지 못하게 되니 꼭 설정 부탁드립니다.
주의사항

  • 성실한 작업자를 보호하고 우대하기 위해 불성실하게 작업에 참여하거나 프로젝트 선발 후 미참여 시 제재가 진행되며 이후 3개월간 크라우드웍스 내 모든 프로젝트 참여가 제한됩니다. 크라우드웍스는 작업자님들께 더욱 나은 작업 환경을 제공하기 위해 노력 중으로 너그러운 양해와 정직한 작업 부탁드립니다.

Updated on 2023년 3월 14일