top of page

데이터바우처 2025

수요기업 신청하러 가기

데이터바우처 2025 수요기업 모집

세상을 바꾸는 데이터,
틱택에서 시작하세요!

일반데이터부터 특수데이터까지,
수집 및 가공부터 맞춤형 AI 솔루션까지,
틱택과 함께라면 이제 모든 것이 쉬워집니다.

한국어 음성 데이터 전사 프로젝트

  • 작성자 사진: Korea Tictag
    Korea Tictag
  • 4월 10일
  • 2분 분량

한국어 음성 데이터 전사


고객사 소개


고객사는 인공지능으로 더 나은 세상을 만든다"는 비전을 가지고, 차세대 음성인식 AI 기술의 미래를 제시하는 지능형 음성 합성 솔루션 기업입니다. 1990년대 후반 설립 이후, 기계가 듣고 말하고 이해하고 생각할 수 있도록 하는 기술 개발에 집중해왔으며, 아시아 태평양 지역에서 가장 잘 알려진 AI 전문 기업 중 하나입니다.


고객사는 교육, 의료, 도시, 법률, 자동차 등 다양한 분야에 AI 기술을 적용하며 끊임없는 기술 혁신을 이어가고 있으며, 한국 지사를 설립하여 국내 AI 시장에서도 영향력을 확대하고 있습니다.



 

과제


고객사는 한국어 음성 인식 AI의 정확도를 높이기 위해, 자연스러운 발화 기반의 고품질 음성 데이터를 텍스트로 정확히 전사하는 것이 핵심 목표였습니다. 특히, 실제 발음과 문장 구조가 불일치하는 경우가 많기 때문에, 문법보다는 발음을 기준으로 한 전사 원칙을 적용하여 실사용 환경에서도 높은 인식률을 확보할 수 있도록 전사 품질을 정밀하게 관리하였습니다.



 

틱택코리아 작업 내용


틱택코리아는 고객사와 협업하여 고품질 한국어 음성 데이터 전사 프로젝트를 두 차례 성공적으로 수행하였습니다. 프로젝트는 고객사의 자체 플랫폼에서 진행되었으며, 정확도 96~97% 이상의 전사 품질을 달성하여 고객사로부터 큰 신뢰를 얻었습니다.

[1차 프로젝트]

  • 진행 기간: 한 달

  • 데이터 규모: 약 200시간 분량의 한국어 음성 데이터

  • 작업 방식: 고객사 자체 플랫폼에서 직접 전사 수행 (Transcription)

  • 정확도: 97% 이상

  • 성과: 전사 품질과 대응 속도 모두 고객사로부터 높은 평가를 받음


[2차 프로젝트]

  • 진행 기간: 한 달

  • 데이터 규모: 약 50시간 분량의 한국어 음성 데이터

  • 작업 방식: 고객사 자체 플랫폼에서 동일 방식으로 전사 수행

  • 정확도: 96% 이상

  • 성과: 1차 프로젝트의 성공적인 수행을 바탕으로 추가 발주로 이어짐

 


데이터 라벨링 상세 과정


틱택코리아는 다음과 같은 세부 전사 지침을 철저히 준수하여 작업을 진행하였습니다:


[정확한 라벨링을 위한 가이드라인 적용]

  • 발음 기반 전사 원칙 준수: 문법보다 실제 음성을 기준으로 텍스트화

  • 맞춤법 정확성 확보: 네이버 맞춤법 검사기 사용 권장

  • 화자 분리, 특수기호 변환 등 상세 규칙 반영

  • 고객사의 검수 기준에 따른 다중 품질 점검 및 제출 절차 수행


 


솔루션: 작업 결과

한국어 음성 데이터 전사 프로젝트


틱택코리아는 고객사의 전사 지침을 충실히 반영하여, 품질과 효율을 모두 만족하는 결과를 도출하였습니다. 프로젝트 전 과정에서 지속적인 품질 점검과 협업을 통해 고객 요구에 부합하는 전사 데이터를 안정적으로 제공하였습니다.


[주요 성과]

  • 고객사의 높은 품질 기준을 충족하며 정확도 96~97% 달성

  • 플랫폼에 대한 이해도와 언어 전문성을 바탕으로 신속한 전사 대응

  • 성공적인 수행을 바탕으로 프로젝트 재계약으로 이어진 신뢰 기반 협력


 

맞춤형 AI 솔루션은 전문가에게

틱택코리아 글로벌 커넥션

​데이터 수집부터 가공, AI 모델링까지 일련의 맞춤형 AI 솔루션이 필요하신가요?


틱택은 AI가 활용되는 프로젝트에 정확성을 기반으로 신속하고 경제적으로 데이터 수집부터 가공, AI 모델링까지 고객의 니즈에 부합하는 AI 솔루션을 제공합니다.


프로젝트 사례 관련하여 문의사항 있으시면 아래 버튼을 클릭해 주세요!


틱택코리아 CTA

Comments


Commenting on this post isn't available anymore. Contact the site owner for more info.
bottom of page