상세 컨텐츠

본문 제목

DeepL_파파고, 구글 번역 결과 비교 분석

생활정보

by 희라소니 2023. 2. 10. 16:30

본문

1월 말 오픈한 AI 번역기 DeepL에 대한 소개 및 감상을 찍어보고자 한다.

ChatGPT를 처음 접했을 때의 충격만큼이나 나에게는 정말 충격이었음.

앞으로 DeepL을 공부와 일에 반영할 생각에 정말 흥분이 된다.


DeepL 한국어 서비스 오픈

30개국의 언어를 서비스하는 번역 전문 AI

DeepL 로고. 영문으로 DeepL이라고 써 있고 그 위에 남색 말풍선이 그려져 있다. 말풍선 안에는 3개의 점이 선으로 이어져 있는데 약간 뇌의 신경망을 형상화 한 것 같다. 폰트와 그림은 모두 남색.
DeepL 로고

2008년 전직 구글 직원이었던 Geron Frahling, Leonard Fink가 링지(Linguee)라는 온라인 사전 도구를 개발했고, 이곳에서 얻은 경험과 데이터를 바탕으로 2017년 번역기인 DeepL을 탄생시켰다.

DeepL은 현재 약 30개국의 언어를 서비스하는데 한국어 서비스가 23년 1월 31일 런칭된 것.

 

강점

정말 인간처럼 말하는 번역기

파파고, 구글과 같은 기존 번역기의 한계는 문맥을 정확하게 잡아내지 못하고, 특유의 기계 번역체에서 벗어나지 못한다는 것이었다.

DeepL은 강점은 이러한 기존 번역기의 한계를 뛰어 넘어 정말 인간이 말하는 것처럼 번역해 준다는 것이다.

문맥과 행간을 파악하고, 어투도 정말 사람 같은 어투를 구사한다.

(곧 이어 나올 번역 비교에서 확인할 수 있음.)

 

제조사는 정기적으로 번역가들을 섭외하여 가장 우수한 번역을 고르게 하는 blind test  review를 시행한다고 한다.

그 결과 구글, 아마존, Bing과 같은 경쟁사와 비교했을 때 DeepL의 번역 정확성이 다음과 같이 더 높다고 밝혔다.

- 독일어/영어 번역 : 6배 정확

- 영어/중국어 : 5배 정확

- 영어/일본어 : 6배 정확

 

물론 제조사 자체적으로 실시한 테스트이기 때문에 공신력에는 논란이 있을 수 있겠지만 내가 직접 번역기를 돌려본 결과  저건 진짜 블러핑이 아니라는 생각이 들었다.

 

어떻게 이렇게까지 정확한 기술 구현이 가능할까? 싶었는데 

이러한 정확한 번역 기술 구현이 가능할 수 있었던 것은 기존 번역기의 인공 신경망이 데이터를 학습했던 방식을 많이 수정 보완한 덕분이라고 한다.

 

 

 

 

 

 

 

비교

그렇다면 본격적으로 기존 번역기들과의 비교를 시작해 보자.

 

원문

아래 영문 텍스트는 영미 유튜버 cari cakes의 vlog 영상에서 자막을 텍스트로 추출한 것이다.

일상생활에서 미국인이 두서없이 말하는 영어이기 때문에  like, so, just 같이 불필요한 부사들이 매우 많고, 정말 실생활의 정제되지 않은 구어체를 텍스트로 옮겨 놓은 것이다.

Hello. Welcome to another video! Hi! So this video is hopefully gonna be better than how my morning started. I'm not one who is normally discombobulated I guess, but this morning has just been a series of me being very spacey. Like it's just been so many things - I was washing the dishes this morning and I somehow managed to like get my head under the faucet? Like I was so into cleaning the bottom of this one glass that I like got my hair wet - it was just, like bizarre things that I've never done. And so hopefully this week only gets better.

< 포인트 >

1. being spacy를 문맥에 맞게 '정신없다, 멍하게 있다'라고 해석하는지

2. 구어체이다 보니 문장 중간중간에 'like'를 많이 사용하는데 이를 파악하는지

3. '아침에 병의 바닥을 닦기 위해 머리를 숙이다 머리카락이 젖었다'는 내용을 무리 없이 해석하는지.

4. 번역 결과가 구어체를 반영하는지

 

파파고

안녕하세요 그리고 다른 비디오에 오신 것을 환영합니다! 안녕! 그래서 나는 이 비디오가 내 아침의 시작보다 더 낫기를 바란다. 나는 일반적으로 혼란스러운 사람은 아닌 것 같지만, 오늘 아침 나는 매우 우주적인 일련의 것들이었다. 많은 일들이 있었던 것처럼 - 나는 오늘 아침 설거지를 하고 있었는데 왠지 수도꼭지 밑에 머리를 집어넣는 것을 좋아했다? 마치 내가 이 잔의 바닥을 청소하는 데 너무 몰두해서 머리를 적시는 것을 좋아하는 것처럼 - 그것은 내가 전에 해본 적이 없는 기이한 일이었다. 그래서 이번 주에는 좀 나아졌으면 좋겠어요.

1. being spacy를 '우주적인'이라고 오역.

2. 문장 중간 구어체 like를 머리를 적시는 것을 좋아한다고 표현.

3. '아침에 병의 바닥을 닦기 위해 머리를 숙이다 머리카락이 젖었다'라는 의미 파악 실패. 

4. 경어체가 아닌 문어체로 번역하다 갑자기 마지막에 경어체 사용.

 

 구글 

안녕하세요. 다른 비디오에 오신 것을 환영합니다! 안녕! 그래서 이 비디오가 제 아침이 어떻게 시작되었는지보다 더 나을 수 있기를 바랍니다. 나는 일반적으로 혼란스러운 사람이 아닌 것 같지만 오늘 아침은 내가 매우 우주적인 일련의 일이었습니다. 정말 많은 일이 있었던 것처럼 - 오늘 아침에 설거지를 하고 있었는데 어쩐지 수도꼭지 아래로 머리를 집어넣는 게 좋았나요? 이 잔의 바닥을 청소하는 데 너무 몰두해서 머리가 젖는 것을 좋아하는 것처럼 – 그것은 내가 한 번도 해본 적이 없는 기괴한 일이었습니다. 그래서 이번 주에 더 나아지기를 바랍니다.

1. 파파고와 동일하게 being spacy를 '우주적인'이라고 오역.

2. 구어체여서 문장 중간 like를 머리를 적시는 것을 좋아한다고 표현.

3. '아침에 병의 바닥을 닦기 위해 머리를 숙이다 머리카락이 젖었다'라는 의미 파악 실패. 파파고와 번역 결과 유사.

4. 구어체보다는 문어체에 가깝지만 경어체 계속 유지.

 

DeepL

안녕하세요. 다른 동영상에 오신 것을 환영합니다! 안녕하세요! 이번 영상은 제 아침이 어땠는지보다는 좀 더 나아졌으면 좋겠네요. 저는 원래 정신이 없는 편은 아닌데, 오늘 아침은 정말 정신이 없는 날이었어요. 오늘 아침에 설거지를 하다가 수도꼭지 밑으로 머리를 집어넣고 싶을 정도로 많은 일이 있었죠? 제가 좋아하는 유리잔 바닥을 닦다가 머리가 젖는 등 한 번도 해본 적 없는 기이한 일들이 벌어졌죠. 이번 주는 더 나아졌으면 좋겠어요.

1. being spacy를 '정신없는'이라고 제대로 번역.

2. 구어체여서 문장 중간 like를 '제가 좋아하는 유리잔'으로 오역. 파파고, 구글과는 다른 식의 오역을 함.

3. '아침에 병의 바닥을 닦기 위해 머리를 숙이다 머리카락이 젖었다'라는 의미 파악 실패. 그러나 번역 제일 자연스러움.

4. 일상생활에서 말하는 것 같은 경어체 완벽 구현. 

 

결과

일반인이 막 두서없이 말하는 유튜브 영상을 저 정도로 번역하는 것에 매우 놀랐다.

제조사에서 주장하는 것과 같이 구어체를 구현하는 데에 있어서는 파파고, 구글을 압도적으로 능가.

DeepL도 물론 오역하는 부분이 있었지만 경쟁사들에 비해 뉘앙스, 의미 파악도 정확하고 번역 결과가 훨씬 자연스럽다.

몇 가지 더 테스트를 해봤는데 정제된 문어체로 작성된 영어는 90% 정도 완벽하게 번역된다.

 

 

 

 

 

 

 

어떻게?

이러한 기술 구현이 어떻게 가능한지에 대해 DeepL 홈페이지에서 밝히고 있다.

요약하자면 경쟁사들이 사용하는 인공 신경망 방법론을 개선했기 때문에 가능했다고 함.

링크는 영문 원본이고 아래는 DeepL을 통해 한글로 번역한 결과이다.

How does DeepL work?

 

How does DeepL work?

translatorDescription_1

www.deepl.com

마치 처음부터 한글로 작성된 것처럼 자연스럽다.

관심 있으신 분들은 일독을 권합니다.

DeepL 번역기가 주요 기술 회사의 경쟁 시스템보다 더 잘 작동하는 이유를 자주 묻는 질문을 받습니다. 여기에는 몇 가지 이유가 있습니다. 대부분의 번역 시스템과 마찬가지로 DeepL 번역기는 인공 신경망을 사용하여 텍스트를 번역합니다. 이러한 네트워크는 수백만 개의 번역된 텍스트로 학습됩니다. 그러나 당사의 연구원들은 주로 네 가지 영역에서 전반적인 신경망 방법론에 많은 개선을 이룰 수 있었습니다.


네트워크 아키텍처
대부분의 공개적으로 사용 가능한 번역 시스템은 Transformer 아키텍처를 직접 수정한 것으로 잘 알려져 있습니다. 물론 DeepL의 신경망에도 주의 메커니즘과 같은 이 아키텍처의 일부가 포함되어 있습니다. 그러나 네트워크의 토폴로지에도 상당한 차이가 있으며, 이로 인해 번역 품질이 공개된 연구용 최신 기술에 비해 전반적으로 크게 향상되었습니다. 동일한 데이터에 대해 당사 아키텍처와 가장 잘 알려진 Transformer 아키텍처를 내부적으로 훈련하고 비교하면 이러한 네트워크 아키텍처 품질의 차이를 명확하게 확인할 수 있습니다.

 
학습 데이터
당사의 직접적인 경쟁사 대부분은 수년간 웹 크롤러를 개발해 온 주요 기술 기업들입니다. 따라서 이들은 사용 가능한 학습 데이터의 양에서 뚜렷한 이점을 가지고 있습니다. 반면에 당사는 네트워크가 더 높은 번역 품질을 달성하는 데 도움이 되는 특수한 학습 데이터의 목표 수집에 중점을 두고 있습니다. 이를 위해 무엇보다도 인터넷에서 번역을 자동으로 찾고 품질을 평가하는 특수 크롤러를 개발했습니다.


훈련 방법론
공공 연구에서 훈련 네트워크는 일반적으로 "지도 학습" 방법을 사용하여 훈련됩니다. 네트워크에는 여러 가지 예가 반복해서 표시됩니다. 네트워크는 자신의 번역과 학습 데이터의 번역을 반복적으로 비교합니다. 불일치가 있는 경우 그에 따라 네트워크의 가중치가 조정됩니다. 또한 신경망을 훈련할 때 다른 머신 러닝 분야의 다른 기법도 사용합니다. 이를 통해 상당한 개선을 달성할 수 있습니다.

 
네트워크 크기
한편, 당사는 (가장 큰 경쟁사와 마찬가지로) 수십억 개의 파라미터로 번역 네트워크를 학습시킵니다. 이러한 네트워크는 규모가 너무 커서 매우 큰 전용 컴퓨팅 클러스터에서 분산 방식으로만 훈련할 수 있습니다. 하지만 저희 연구에서는 네트워크의 매개변수가 매우 효율적으로 사용된다는 사실을 매우 중요하게 생각합니다. 이를 통해 더 작고 빠른 네트워크에서도 비슷한 번역 품질을 달성할 수 있었습니다. 따라서 무료 서비스 사용자들에게도 매우 높은 번역 품질을 제공할 수 있습니다.

 

 

 

 

 

 

 

사용

회원가입

외국 사이트답게 회원가입은 이메일과 비번만 입력하면 바로 가입하고 무료로 사용할 수 있다.

DeepL 윈도우 용 앱을 설치하고 실행하자 PRO 아이디로 로그인하라는 화면이 뜸.
window 용 app 로그인 화면

윈도우 용 free app이 있어서 설치했는데 결정적으로 로그인 화면에서 PRO ID 로그인을 요구...

그런데 또 나중에 보니 설치는 제대로 되어서 사용 중.

 

번역

DeepL 번역 화면. &#39;Tranlate text&#39; 버튼과 &#39;Translate files&#39; 버튼이 있다. Tranlate text 버튼을 선택했더니 화면 중앙에 2개의 칸이 나뉘어져 있고 왼쪽에 원문을 넣으면 오른 쪽에 번역 결과가 보여진다.
DeepL 번역 화면

사용은 파파고, 구글 같이 그냥 텍스트를 치면 됨.

파일 번역도 가능한데 free 버전에서는 한 달에 5MB 이하 파일 3개만 가능하다고 나와 있다.

 

DeepL PRO

DeepL Pro의 혜택에 대해서 영문으로 설명하는 메인 화면.
DeepL 프로 메인 화면
일본 DeepL PRO의 요금 설명 화면. Starter는 월 1&#44;000엔&#44; Advanced는 3.167엔&#44; Ultimate는 월 6&#44;250엔이다. Advanced에 Recommended 배너가 붙어 있다.
일보ㄴ DeepL 프로 요금 및 혜택

프로 버전은 현재 아시아에서 일본싱가폴에서만 서비스된다.

일본 프로 버전을 기준으로 요금에 따라 Starter, Advanced, Ultimate 3개의 grade가 있고 혜택이 다르다.

- 번역 텍스트 양

- 번역 가능한 파일의 개수 및 용량

- 팀원들과 사용할 수 있는 용어 사전 제공 여부

- SSO(single sign on)

 

DeepL에서 가장 권장하고 있는 'Advanced'의 경우 1개월 사용료 3,167엔으로 한화 31,000원 정도.

 

 

사용해 보실 분들은 아래 링크로!!

 

DeepL 번역: 세계에서 가장 정확한 번역기

텍스트 및 전체 문서 파일을 즉시 번역하세요. 개인과 팀을 위한 정확한 번역. 매일 수백만 명이 DeepL로 번역합니다.

www.DeepL.com

 

 

 

총평

  • 영문 자료, 원서 많이 보시는 분들, 특히 대학원생들은 DeepL로 구원을 받을지어다.
  • 앞으로 내 영어 선생님은 DeepL.

 

 

2023.05.18 - [생활정보] - 유글리쉬(YouGlish)_유트브 영어 공부 사이트

 

유글리쉬(YouGlish)_유트브 영어 공부 사이트

요즘은 챗GPT와 같은 AI 등장으로 학원이나 과외를 받지 않고도 외국어를 독학하는 게 정말 편리해진 시대다. 그중에서도 오늘 소개할 외국어 학습 사이트 유글리쉬(YouGlish)는 너무 유용한 사이트

heerasony.tistory.com

 

 

2023.02.28 - [생활정보] - 유튜브 해외 영상 실시간 번역 및 요약 가능한 Glasp 소개

 

유튜브 해외 영상 실시간 번역 및 요약 가능한 Glasp 소개

이제 한글 자막 없는 외국의 유튜브 영상들을 실시간으로 시청 가능한 시대가 도래했다. Glasp에서 만든 이 크롬 확장 프로그램은 ChatGPT와 연계되어 유튜브의 영상을 매우 쉽고 빠르게 번역 및 요

heerasony.tistory.com

 

관련글 더보기

댓글 영역