외로운 Nova의 작업실

NCP AI 공부 - Clova Voice 본문

Cloud/ncp

NCP AI 공부 - Clova Voice

Nova_ 2024. 1. 19. 14:51

- Clova Voice

음색 종류 : PRO(고은, 아라, 유나, 혜리), 고은, 기서, 나래 등등 26가지 음색이 있음. PRO는 4개, 일반은 22개

API : POST https://naveropenapi.apigw.ntruss.com/tts-premium/v1/tts, 파일 확장자: *.mp3(기본값), *.wav

언어 제공 종류 : 한국어, 영어, 중국어, 일본어, 대만어, 스페인어, 영어+한국

 

- 요금

 

- 요청 헤더

헤더명설명

X-NCP-APIGW-API-KEY-ID 앱 등록 시 발급받은 Client ID
X-NCP-APIGW-API-KEY-ID:{Client ID}
X-NCP-APIGW-API-KEY 앱 등록 시 발급 받은 Client Secret
X-NCP-APIGW-API-KEY:{Client Secret}
Content-Type application/x-www-form-urlencoded로 고정
Content-Type: application/x-www-form-urlencoded

 

- Parameter

speaker string 음성 합성에 사용할 목소리 종류
  • nara : 아라: 한국어, 여성 음색
  • nara_call : 아라(상담원): 한국어, 여성 음색
  • nminyoung : 민영: 한국어, 여성 음색
  • nyejin : 예진: 한국어, 여성 음색
  • mijin : 미진: 한국어, 여성 음색
  • jinho : 진호: 한국어, 남성 음색
  • clara : 클라라: 영어, 여성 음색
  • matt : 매트: 영어, 남성 음색
  • shinji : 신지: 일본어, 남성 음색
  • meimei : 메이메이: 중국어, 여성 음색
  • liangliang : 량량: 중국어, 남성 음색
  • jose : 호세: 스페인어, 남성 음색
  • carmen : 카르멘: 스페인어, 여성 음색
  • nminsang : 민상: 한국어, 남성 음색
  • nsinu : 신우: 한국어, 남성 음색
  • nhajun : 하준: 한국어, 아동 음색 (남)
  • ndain : 다인: 한국어, 아동 음색 (여)
  • njiyun : 지윤: 한국어, 여성 음색
  • nsujin : 수진: 한국어, 여성 음색
  • njinho : 진호: 한국어, 남성 음색
  • njihun : 지훈: 한국어, 남성 음색
  • njooahn : 주안: 한국어, 남성 음색
  • nseonghoon : 성훈: 한국어, 남성 음색
  • njihwan : 지환: 한국어, 남성 음색
  • nsiyoon : 시윤: 한국어, 남성 음색
  • ngaram : 가람: 한국어, 아동 음색 (여)
  • ntomoko : 토모코: 일본어, 여성 음색
  • nnaomi : 나오미: 일본어, 여성 음색
  • dnaomi_joyful : 나오미(기쁨): 일본어, 여성 음색
  • dnaomi_formal : 나오미(뉴스): 일본어, 여성 음색
  • driko : 리코: 일본어, 여성 음색
  • deriko : 에리코: 일본어, 여성 음색
  • nsayuri : 사유리: 일본어, 여성 음색
  • ngoeun : 고은: 한국어, 여성 음색
  • neunyoung : 은영: 한국어, 여성 음색
  • nsunkyung : 선경: 한국어, 여성 음색
  • nyujin : 유진: 한국어, 여성 음색
  • ntaejin : 태진: 한국어, 남성 음색
  • nyoungil : 영일: 한국어, 남성 음색
  • nseungpyo : 승표: 한국어, 남성 음색
  • nwontak : 원탁: 한국어, 남성 음색
  • dara_ang : 아라(화남):  한국어, 여성 음색
  • nsunhee : 선희:  한국어, 여성 음색
  • nminseo : 민서:  한국어, 여성 음색
  • njiwon : 지원:  한국어, 여성 음색
  • nbora : 보라:  한국어, 여성 음색
  • njonghyun: 종현:  한국어, 남성 음색
  • njoonyoung : 준영:  한국어, 남성 음색
  • njaewook: 재욱:  한국어, 남성 음색
  • danna: 안나: 영어, 여성 음색
  • djoey: 조이: 영어, 여성 음색
  • dhajime: 하지메: 일본어, 남성 음색
  • ddaiki: 다이키: 일본어, 남성 음색
  • dayumu: 아유무: 일본어, 남성 음색
  • dmio: 미오: 일어, 여성 음색
  • chiahua: 차화: 대만어, 여성 음색
  • kuanlin: 관린: 대만어, 남성 음색
  • nes_c_hyeri: 혜리: 한국어, 여성 음색
  • nes_c_sohyun: 소현: 한국어, 여성 음색
  • nes_c_mikyung: 미경: 한국어, 여성 음색
  • nes_c_kihyo: 기효: 한국어, 남성 음색
  • ntiffany: 기서: 한국어, 여성 음색
  • napple: 늘봄: 한국어, 여성 음색
  • njangj: 드림: 한국어, 여성 음색
  • noyj: 봄달: 한국어, 여성 음색
  • neunseo: 은서: 한국어, 여성 음색
  • nheera: 희라: 한국어, 여성 음색
  • nyoungmi: 영미: 한국어, 여성 음색
  • nnarae: 나래: 한국어, 여성 음색
  • nyeji: 예지: 한국어, 여성 음색
  • nyuna: 유나: 한국어, 여성 음색
  • nkyunglee: 경리: 한국어, 여성 음색
  • nminjeong: 민정: 한국어, 여성 음색
  • nihyun: 이현: 한국어, 여성 음색
  • nraewon: 래원: 한국어, 남성 음색
  • nkyuwon : 규원: 한국어, 남성 음색
  • nkitae: 기태: 한국어, 남성 음색
  • neunwoo: 은우: 한국어, 남성 음색
  • nkyungtae: 경태: 한국어, 남성 음색
  • nwoosik: 우식: 한국어, 남성 음색
  • vara: 아라(pro): 한국어, 여성 음색
  • vmikyung: 미경(pro): 한국어, 여성 음색
  • vdain: 다인(pro): 한국어, 여성 음색
  • vyuna: 유나(pro): 한국어, 여성 음색
  • vhyeri: 혜리(pro): 한국어, 여성 음색
  • dara-danna: 아라&안나: 한국어+영어(미국), 여성 음색
  • dsinu-matt: 신우&매트: 한국어+영어(미국), 남성 음색
  • nsabina : 마녀 사비나: 한국어, 여성 음색
  • nmammon : 악마 마몬: 한국어, 남성 음색
  • nmeow : 야옹이: 한국어, 아동 음색 (여)
  • nwoof : 멍멍이: 한국어, 아동 음색 (남)
  • nreview : 박리뷰: 한국어, 남성 음색
  • nyounghwa : 정영화: 한국어, 여성 음색
  • nmovie : 최무비: 한국어, 남성 음색
  • nsangdo : 상도: 한국어, 남성 음색
  • nshasha : 샤샤: 한국어, 여성 음색
  • nian : 이안: 한국어, 남성 음색
  • ndonghyun : 동현: 한국어, 남성 음색
  • vian : 이안(pro): 한국어, 남성 음색
  • vdonghyun : 동현(pro): 한국어, 남성 음색
  • dsayuri : 사유리: 일본어, 여성 음색
  • dtomoko : 토모코: 일본어, 여성 음색
  • dnaomi : 나오미: 일본어, 여성 음색
  • vgoeun : 고은(pro): 한국어, 여성 음색
  • vdaeseong : 대성(pro): 한국어, 남성 음색
  • ngyeongjun : 경준: 한국어, 남성 음색
  • ndaeseong : 대성: 한국어, 남성 음색
  • njonghyeok : 종혁: 한국어, 남성 음색
없음 Y
text string - 음성 합성할 문장
- UTF-8 인코딩된 텍스트만 지원
- 최대 2,000자까지 음성 합성
- 기호나 괄호 안의 텍스트는 읽지 않음
없음 Y
volume integer - 음성 볼륨
- (-)5에서 5 사이의 정수 값
- (-)5이면 0.5배 낮은 볼륨, 5이면 1.5배 더 큰 볼륨, 0이면 정상 볼륨로 음성 합성
0 N
speed integer - 음성 속도
- (-)5에서 5 사이의 정수 값
- (-)5이면 2배 빠른 속도, 5이면 0.5배 더 느린 속도, 0이면 정상 속도로 음성 합성
0 N
pitch integer - 음성 피치
- (-)5에서 5 사이의 정수 값
- (-)5이면 1.2배 높은 피치, 5이면 0.8배 더 낮은 피치, 0이면 정상 피치로 음성 합성
0 N
emotion integer - 음성 감정
- 0에서 3 사이의 정수 값
- 지원 speaker : nara, vara, vmikyung, vdain, vyuna(단, nara 는 3: 분노 미지원)
  • 0: 중립
  • 1: 슬픔
  • 2: 기쁨
  • 3: 분노
0 N
emotion-strength integer - 감정의 강도
- 지원 speaker : vara, vmikyung, vdain, vyuna(nara 미지원)
  • 0: 약함
  • 1: 보통
  • 2: 강함
1 N
format string - 음성 포맷
- mp3 또는 wav
mp3 N
sampling-rate integer - 샘플링 레이트
- wav 포맷일 때만 지원하며, mp3 포맷은 24000에서 변경 불가
단, mijin은 16000만 지원
  • 8000
  • 16000
  • 24000
  • 48000
24000 N
alpha integer - 음색
- (-)5에서 5 사이의 정수값
- 0보다 크면 높은 음색, 0보다 작으면 낮은 음색
0 N
end-pitch integer - 끝음 처리
- (-)5에서 5 사이의 정수값
0보다 크면 문장 끝을 올리고, 0보다 작으면 문장 끝을 내림
- 지원 speaker : 'd'로 시작하는 speaker(ex.dara, danna..)와 clara, matt, meimei, liangliang, chiahua, kuanlin, carmen, jose
0 N

'Cloud > ncp' 카테고리의 다른 글

NCP AI 공부 - CLOVA OCR  (0) 2024.01.20
NCP AI 공부 - CLOVA dubbing  (0) 2024.01.19
NCP AI 자격증 공부 - 서비스 종류  (0) 2024.01.19
NCP Associate 시험 후기  (0) 2024.01.17
NCP Associate - 암기 정리  (2) 2024.01.03
Comments