외로운 Nova의 작업실
NCP AI 공부 - Clova Voice 본문
- Clova Voice
음색 종류 : PRO(고은, 아라, 유나, 혜리), 고은, 기서, 나래 등등 26가지 음색이 있음. PRO는 4개, 일반은 22개
API : POST https://naveropenapi.apigw.ntruss.com/tts-premium/v1/tts, 파일 확장자: *.mp3(기본값), *.wav
언어 제공 종류 : 한국어, 영어, 중국어, 일본어, 대만어, 스페인어, 영어+한국
- 요금
- 요청 헤더
헤더명설명
X-NCP-APIGW-API-KEY-ID | 앱 등록 시 발급받은 Client ID X-NCP-APIGW-API-KEY-ID:{Client ID} |
X-NCP-APIGW-API-KEY | 앱 등록 시 발급 받은 Client Secret X-NCP-APIGW-API-KEY:{Client Secret} |
Content-Type | application/x-www-form-urlencoded로 고정 Content-Type: application/x-www-form-urlencoded |
- Parameter
speaker | string | 음성 합성에 사용할 목소리 종류
|
없음 | Y |
text | string | - 음성 합성할 문장 - UTF-8 인코딩된 텍스트만 지원 - 최대 2,000자까지 음성 합성 - 기호나 괄호 안의 텍스트는 읽지 않음 |
없음 | Y |
volume | integer | - 음성 볼륨 - (-)5에서 5 사이의 정수 값 - (-)5이면 0.5배 낮은 볼륨, 5이면 1.5배 더 큰 볼륨, 0이면 정상 볼륨로 음성 합성 |
0 | N |
speed | integer | - 음성 속도 - (-)5에서 5 사이의 정수 값 - (-)5이면 2배 빠른 속도, 5이면 0.5배 더 느린 속도, 0이면 정상 속도로 음성 합성 |
0 | N |
pitch | integer | - 음성 피치 - (-)5에서 5 사이의 정수 값 - (-)5이면 1.2배 높은 피치, 5이면 0.8배 더 낮은 피치, 0이면 정상 피치로 음성 합성 |
0 | N |
emotion | integer | - 음성 감정 - 0에서 3 사이의 정수 값 - 지원 speaker : nara, vara, vmikyung, vdain, vyuna(단, nara 는 3: 분노 미지원)
|
0 | N |
emotion-strength | integer | - 감정의 강도 - 지원 speaker : vara, vmikyung, vdain, vyuna(nara 미지원)
|
1 | N |
format | string | - 음성 포맷 - mp3 또는 wav |
mp3 | N |
sampling-rate | integer | - 샘플링 레이트 - wav 포맷일 때만 지원하며, mp3 포맷은 24000에서 변경 불가 단, mijin은 16000만 지원
|
24000 | N |
alpha | integer | - 음색 - (-)5에서 5 사이의 정수값 - 0보다 크면 높은 음색, 0보다 작으면 낮은 음색 |
0 | N |
end-pitch | integer | - 끝음 처리 - (-)5에서 5 사이의 정수값 0보다 크면 문장 끝을 올리고, 0보다 작으면 문장 끝을 내림 - 지원 speaker : 'd'로 시작하는 speaker(ex.dara, danna..)와 clara, matt, meimei, liangliang, chiahua, kuanlin, carmen, jose |
0 | N |
'Cloud > ncp' 카테고리의 다른 글
NCP AI 공부 - CLOVA OCR (0) | 2024.01.20 |
---|---|
NCP AI 공부 - CLOVA dubbing (0) | 2024.01.19 |
NCP AI 자격증 공부 - 서비스 종류 (0) | 2024.01.19 |
NCP Associate 시험 후기 (0) | 2024.01.17 |
NCP Associate - 암기 정리 (2) | 2024.01.03 |
Comments