외로운 Nova의 작업실

NCP AI 공부 - CLOVA Speech 본문

Cloud/ncp

NCP AI 공부 - CLOVA Speech

Nova_ 2024. 1. 28. 17:25

- 서비스 소개

음성을 텍스트로 바꿔주며 음성 메모, 자막, 비서, 챗봇 등 다양한 음성 인식 서비스에 활용할 수 있습니다.

 

- 서비스 활용

 

 

- 상세 기능

  • 문장 자동 분리 및 타임스탬프 지원 : 타임스탬프 기능을 제공하여 음성을 텍스트로 변환하는 과정에서 적절한 길이로 문장을 분리하고 시간을 표시합니다. 또한 문장의 시작과 끝을 시각적으로 표시해 주어 자막을 생성하는 등 다양한 방식으로 활용할 수 있습니다. 장문인식에서 제공하는 기능입니다.
  • 키워드 부스팅 및 인식 후 보정 : 고유 명사(이름, 제품 등) 등 특정 단어에 대한 인식률을 높이거나, 음원 인식 후 더 적합한 단어로 보정할 수 있습니다.
  • 인식 결과 수정 에디터 제공 : CLOVA Speech 를 통해 인식된 데이터를 손쉽게 수정, 편집하여 재가공할 수 있습니다.
    편집하고자하는 파일을 재생하며 인식된 데이터를 바로바로 수정할 수 있으며, 적절한 길이로 문장을 분리하여 타임 스탬프 정보를 표시해줍니다. 자막은 물론 다양한 파일 포맷으로 추출하여 다양한 고객 서비스에 활용할 수 있습니다.
  • 실시간 음성 인식 : CLOVA Speech API를 통해 실시간으로 음성을 인식하고, 음성 인식 결과를 텍스트로 반환할 수 있습니다. 장문인식에서 제공하는 기능입니다.
  • API 기반 인식 제공 : CLOVA Speech의 API를 이용하여 음원 인식 결과를 텍스트로 반환합니다. REST API는 Client ID와 Client Secret을 이용하여 인증합니다. 인증부터 API 이용까지 데이터 전송 구간은 모두 암호화를 적용할 수 있습니다. gRPC는 사용자의 음원을 실시간으로 인식하여 음원 인식 결과를 반환합니다.

 

- 요금

 

 

- 사용 flow

1. 사용 권한 설정 : CLOVA Speech를 사용하기 위한 사용 권한을 설정합니다. CLOVA Speech 사용 권한은 네이버 클라우드 플랫폼의 Sub Account에서 발급한 '서브 계정'에 '역할'을 매핑하여 정의합니다. 따라서 우선 Sub Account를 통해 사용자 메인 계정 외에 서브 계정을 생성해야 합니다.

2. 도메인 생성 : 네이버 클라우드 플랫폼 콘솔에서 도메인을 생성합니다. 도메인별로 음성 인식 대상 파일 및 결과 파일의 저장 경로를 지정할 수 있습니다. 참조할 수 있는 사용 가이드는 다음과 같습니다.

3. 인식 작업 등록 : 인식 작업을 등록합니다. 빌더를 통해 인식 작업을 요청하거나, 배치를 생성하여 다수의 미디어 파일의 인식 작업을 일괄 처리할 수 있습니다. 참조할 수 있는 사용 가이드는 다음과 같습니다.

4. 인식 결과 및 편집 : 인식 결과를 확인 및 편집한 후, 원하는 형식으로 내보낼 수 있습니다. 참조할 수 있는 사용 가이드는 다음과 같습니다.

 

- Preview

 

 

- API 호출 방법

 

- 용어

Batch : 배치를 생성하여 다수의 음성 인식 작업을 일괄 처리할 수 있습니다. 배치는 생성 후 일정 시간이 지나면 자동으로 작동하여, 지정 경로에 있는 미디어 파일의 음성을 인식하고 인식 결과 파일과 실행 결과 파일을 생성합니다.

'Cloud > ncp' 카테고리의 다른 글

NCP AI 공부 - CLOVA Speech Recognition(CSR)  (0) 2024.01.29
NCP AI 공부 - AiCall  (0) 2024.01.26
NCP AI 공부 - AiTEMS  (0) 2024.01.25
NCP AI 공부 - Papago Translation  (1) 2024.01.23
NCP AI - Tensorflow Server  (0) 2024.01.22
Comments