과제
반려동물의 포즈와 행동을 인식하기 위해 먼저 CCTV 각도가 고정된 반려동물의 영상 데이터(raw data)가 필요했습니다. 수집된 영상 데이터는 음성 및 이미지 데이터로 전처리하는 과정을 필요했으며, 고객사는 데이터 수집부터 가공까지의 전 과정을 틱택코리아에 의뢰하였습니다.
고객사 소개
AI 기반 펫 CCTV 앱을 만들어 반려동물 토탈서비스를 제공하는 고객사는 Vision AI 기반의 반려동물의 포즈 인식(Pose Estimation)과 행동 인식(Action Recognition) 기술로 반려동물 문제를 해결하고자 합니다. 해당 솔루션은 동물이 주로 행동 언어로 의사 표현을 한다는 점에 착안한 기술로, 펫 CCTV 앱을 통해 구현되었습니다. 이 앱은 반려동물의 움직임이 감지될 때 자동으로 녹화된 AI 행동 분석 정보를 사용자에게 제공합니다.
틱택코리아 작업 내용
테블릿 PC 또는 핸드폰으로 반려동물이 있는 크라우드소싱 작업자들이 가정 내에서 CCTV와 유사한 각도로 촬영한 영상을 수집하였습니다. 수집된 영상에서는 두 가지 작업이 이루어졌습니다.
음성 데이터 라벨링:
음성 인식을 위해 영상의 raw data를 기반으로 음원을 추출한 후, 11개의 라벨(강아지가 내는 소리, 강아지가 발생시킬 수 있는 소리, 기타 소음 등)을 구분하여 음성 데이터를 라벨링하였습니다.
객체 인식 작업 (이미지 데이터 라벨링):
영상의 raw data에서 0.1fps로 추출한 이미지를 기반으로 3개의 라벨(사람, 강아지, 물그릇)에 맞춰 바운딩박스 작업을 진행했습니다. 영상 파일당 6~7개의 이미지를 추출하여 전처리 작업을 수행하였습니다.
최종 단계에서는 각각의 작업이 유기적으로 연결되어 csv 포맷의 파일로 meta 정보를 생성하여 고객사에 전달하였습니다.
솔루션: 작업 결과
이번 프로젝트에서 틱택코리아는 단기간에 데이터 수집, 음성 인식, 객체 인식 작업을 수행하며 전 단계에 걸친 서비스를 제공하였습니다. 데이터셋은 고객사의 요구 사항에 맞춰 정확하게 처리되었으며, 작업 중 지속적인 모니터링을 통해 작업 품질을 유지했습니다. (CCTV 각도가 고정된 영상 수집, 11개 라벨 기반의 음성 라벨링, 3개의 라벨 기반 객체 바운딩박스 작업)
틱택코리아는 프로젝트 전반을 정확히 파악하여 중간 점검 및 검수를 진행했으며, 작업 속도 유지를 위해 지속적인 모니터링과 백업 인력 배치를 완료하였습니다.
틱택코리아는 약 2만 명의 글로벌 크라우드워커를 보유하고 있어 CCTV 각도가 고정된 카메라를 통한 영상 수집, 다양한 실내 환경에서의 객체 수집 등 어려운 작업도 효율적으로 처리할 수 있으며, 합리적인 가격과 빠른 시일 내에 고객사의 니즈에 맞춘 데이터를 제공합니다.
Commentaires