목록전체 글 (421)
외로운 Nova의 작업실

- OCR이란? OCR서비스는 문서를 인식하고 사용자가 지정한 영역의 텍스트와 데이터를 정확하게 추출할 수 있는 서비스입니다. 필기체도 인식이 가능합니다. - 세부 사항 지원 형식 : JPG, PNG, PDF, TIFF - OCR 서비스 종류 General OCR : 모든 부분에 사용가능한 OCR Templete OCR : 체크 박스 ,멀티박스가 있고 인식가능한 OCR Document OCR : 네이버 클라우드가 General OCR을 가지고 많이 사용하는 문서를 구현해놓은 서비스 - 추가 기능 Batch : 대용량의 많은 이미지에대한 일괄 처리 기능으로 Object Storage를 이용합니다. OCR Reader : OCR Reader에서는 비개발자도 손쉽게 이용할 수 있도록 CLOVA OCR에서 생성..

- 음성합성기술 원리 - 딥러닝 모델 - 더빙 사용법 - QnA - 지원 보이스 CLOVA Dubbing은 약 100여 개의 다양한 언어/성별/연령/스타일의 AI 보이스를 제공합니다. 또한 HDTS (Hybrid Dnn Text-to-Speech) 기술로 더욱 자연스러워진 클로바 보이스 Pro는 네이버 클라우드 플랫폼에서만 만나볼 수 있습니다. 언어 한국어, 영어, 일본어, 중국어(간체), 대만어, 스페인어 성별 남성, 여성 연령층 어린이, 청소년, 청년, 중년 이상 스타일 기본, 고객서비스, 구연동화, 내레이션, 뉴스/리포터, DJ, 쇼핑호스트, 애니/영화더빙, 일상대화, 광고/홍보, 사회자 - 서비스 지원 더빙 지원 다운로드 지원 동영 상 H.264 코덱의 MP4, MOV 형식을 지원하며 최대 20분..

- Clova Voice 음색 종류 : PRO(고은, 아라, 유나, 혜리), 고은, 기서, 나래 등등 26가지 음색이 있음. PRO는 4개, 일반은 22개 API : POST https://naveropenapi.apigw.ntruss.com/tts-premium/v1/tts, 파일 확장자: *.mp3(기본값), *.wav 언어 제공 종류 : 한국어, 영어, 중국어, 일본어, 대만어, 스페인어, 영어+한국 - 요금 - 요청 헤더 헤더명설명 X-NCP-APIGW-API-KEY-ID 앱 등록 시 발급받은 Client ID X-NCP-APIGW-API-KEY-ID:{Client ID} X-NCP-APIGW-API-KEY 앱 등록 시 발급 받은 Client Secret X-NCP-APIGW-API-KEY:{Cl..