외로운 Nova의 작업실

NCP AI 공부 - Papago Translation 본문

Cloud/ncp

NCP AI 공부 - Papago Translation

Nova_ 2024. 1. 23. 14:49

- Papago Translation API

Papago Text Translation : Papago Text Translation은 입력한 텍스트를 인공신경망 기반 번역 알고리즘을 통해 여러 나라의 언어로 번역하는 서비스를 제공합니다. 또한 용어집(Glossary), 높임말 번역(Honorific translation), 치환(Term replacement) 옵션을 활용해 번역 결과를 보완할 수 있습니다.
Papago Doc Translation : Papago Doc Translation은 문서 내 텍스트를 추출해 타깃 언어로 번역하는 서비스를 제공합니다. 
Papago Website Translation : Papago Website Translation은 웹페이지 내 HTML 문서 혹은 element를 자동으로 감지해 번역하는 서비스를 제공합니다.
Papago Language Detection : Papago Language Detection은 입력한 텍스트의 15개 언어를 자동으로 감지하는 서비스를 제공합니다. 자동 감지할 수 있는 언어는 다음과 같습니다. 한국어, 영어, 일본어, 중국어(간체, 번체), 베트남어, 태국어, 인도네시아어, 프랑스어, 스페인어, 러시아어, 독일어, 이탈리아어, 포르투갈어, 힌디어

 

- Papago Translation Glossary

Glossary 메뉴에서는 용어집을 등록하고 관리할 수 있습니다. 용어집은 Papago Text Translation 사용 시 번역의 일관성 유지에 도움을 주는 기능입니다. 용어집에 대한 설명은 다음과 같습니다.

- 용어집은 번역 시 고유 명사 사용, 전문 용어 사용, 원문 유지가 필요한 경우 활용할 수 있습니다.
- 명사/명사구와 같이 일정한 명칭을 가진 용어의 경우에도 용어집을 활용할 수 있습니다.
- 용어집에 등록한 용어가 번역할 원문에 포함되어 있고 정확히 일치할 경우 해당 용어를 적용한 번역 결과를 제공합니다.
- 일부 단어가 겹치는 용어가 용어집에 2개 이상 등록되어있는 경우 글자 수가 긴 용어가 번역 결과에 적용됩니다. <예시> Papago와 Papago Translation이 모두 용어집에 등록되어있는 경우 번역 시 Papago Translation 치환되어 적용
- 짧은 단어나 동음이의어가 용어집에 등록되어있는 경우 번역 전체에 영향을 줄 수 있으므로 용어집 사용에 유의해 주십시오. <예시> 밤: night 또는 chestnut

 

- Papago Text Translation API 설명

 

 

<파라미터타입>

source String Y 원본 언어(source language)의 언어 코드. auto로 설정 시, 자동으로 소스 언어를 감지
target String Y 목적 언어(target language)의 언어 코드
text String Y - 번역할 텍스트
- 1회 호출 시 최대 5,000자까지 번역 가능
glossaryKey String N - 클라우드 콘솔에서 용어집 기능을 사용하는 경우, 해당 용어집의 glossaryKey에 대응 (ex. 6ae8eba5-3154-4646-bc16-1c96532082e6)
- 용어집 데이터를 기반으로 치환 번역 적용
- 한⇔영/한⇔일/한⇔중(간/번체)/영⇔일/영⇔중(간/번체)/일⇔중(간/번체) 가능
- replaceInfo와 동시에 사용 시, replaceInfo의 우선 순위가 높음
- 용어집 등록 용어에는 honorific 적용되지 않음
replaceInfo String N - 치환 번역 지정(공백 포함)
- 지정된 index의 번역을 특정. str 미 설정 시, 원문을 그대로 제공
- 한⇔영/한⇔일/한⇔중(간/번체)/영⇔일/영⇔중(간/번체)/일⇔중(간/번체) 가능
honorific Boolean N - 높임말 여부(번역 기본값은 False)
영⇒한, 일⇒한, 중(간/번체)⇒한, 한⇒일, 영⇒일, 중(간/번체)⇒일 번역 방향만 가능

 

- Papago Doc Translation API 설명

파일 안에 소스 언어로 작성된 텍스트를 타겟 언어로 번역하는 API
비동기 형식의 API로 번역 요청(translate)/상태 확인(status)/다운로드(download) 3개의 API로 구성
번역 지원 언어쌍: 한국어↔영어, 한국어↔일본어, 한국어↔중국어(간체)
문서 1개 기준- 파일 용량 100 MB, 30만 글자 수 제한
지원 파일 포맷: MS Office (docx, pptx, xlsx), PDF, 한글(HWP)
HWP의 경우 한컴오피스2002부터 사용되는 HWP 5.0 이상의 버전만 지원

이미지로 된 텍스트는 번역되지 않습니다.
텍스트에 적용된 스타일은 일부 일치하지 않거나 누락될 수 있습니다.
텍스트에 적용된 링크 또는 액션은 일부 동작하지 않거나 누락될 수 있습니다.
암호가 설정된 파일은 지원하지 않습니다.
읽기 전용 파일은 지원하지 않습니다.
HWP의 경우
한컴오피스2002부터 사용되는 HWP 5.0 이상의 버전을 지원합니다.
배포용 파일은 지원하지 않습니다.
한컴오피스에서 생성되지 않은 HWP 파일은 지원하지 않습니다. (ex. 확장자만 변경한 파일)
번역으로 문장 길이가 길어지면서 텍스트 겹침 현상이 발생할 수 있습니다. 텍스트 영역을 늘려주면 정상적으로 확인 가능합니다.
PDF의 경우
PDF 파일의 레이아웃, 문단 간격, 디자인 서식, 사용자 지정 글꼴 및 이미지 크기 등이 품질에 영향을 미칠 수 있습니다. 가능하다면 시각적 요소가 적게 포함된 문서 사용을 권장합니다.
최적의 결과를 얻을 수 있도록 기본 PDF 파일 사용을 권장합니다. 스캔한 문서를 번역할 경우 스캔 품질이 번역 결과에 영향을 미칠 수 있으며 원본 문서의 방향대로 스캔이 되어야 합니다.
번역 파일의 용량이 원본 문서 대비 커질 수 있습니다.
PDF 파일에 비해 docx 및 pptx 파일의 문서 레이아웃 및 스타일 유지가 더 잘 됩니다. 더 나은 결과를 위해 변환 전 파일 형식으로 사용하는 것을 권장합니다.
2개 이상의 언어가 포함된 문서는 출발 언어 설정에 따라 번역 결과가 달라질 수 있습니다.

 

<translate(문서 번역 요청)>

 

<status(문서번역 진행 상태)>

 

<download(번역된 문서 다운로드)>

 

- Papago Website Translation API 

소스 언어로 작성된 html문서 혹은 element를 타겟 언어로 번역하는 API
번역 지원 언어쌍: 한국어↔영어, 한국어↔일본어, 한국어↔중국어(간체)

이미지로 된 텍스트는 번역되지 않습니다.
텍스트에 적용된 스타일은 일부 일치하지 않거나 누락될 수 있습니다.
텍스트에 적용된 링크 또는 액션은 일부 동작하지 않거나 누락될 수 있습니다.
html 파라미터는 크기 제한이 있습니다. (UTF-8 기준 태그, 공백 등 모든 캐릭터 포함 200,000bytes)
html 파라미터의 크기가 클수록 responseTime이 느려지기 때문에 번역할 영역의 element 요청을 권장합니다. (하단 번역 영역 추출 예제 참고)
1회당 권장 최대 글자: 60,000자
1분당 권장 최대 글자: 3,600,000자
과금: 태그 및 공백 포함 모든 캐릭터 수 카운팅

 

<translate(웹사이트 번역 요청)>

 

- Papago Language Detection API

 

<detect(언어 감지)>

 

 

 

 

- Papago NMT

 

 

- CLOVA 연

 

 

 

'Cloud > ncp' 카테고리의 다른 글

NCP AI 공부 - AiCall  (0) 2024.01.26
NCP AI 공부 - AiTEMS  (0) 2024.01.25
NCP AI - Tensorflow Server  (0) 2024.01.22
NCP AI 공부 - CLOVA Chatbot  (0) 2024.01.21
NCP AI 공부 - CLOVA OCR  (0) 2024.01.20
Comments