[태그:] wise

  • 동요 ‘핑크퐁 상어가족’ 빌보드 톱 30위권 진입! (feat. 동요계의 방탄소년단 BTS)

    동요 ‘핑크퐁 상어가족’ 빌보드 톱 30위권 진입! (feat. 동요계의 방탄소년단 BTS)

     

    안녕하세요 🙂 오늘은 조금은 독특한, 그렇지만 막강한 콘텐츠를 가져와 봤어요! 바로 핑크퐁 상어가족! 여러분은 핑크퐁을 아시나요? 아직 핑크퐁을 모르신다면 어린이들에게 사랑받지 못할 거예요. 어린이들의 왕, 동요계의 방탄소년단 BTS라 불리는 핑크퐁은 바로 대한민국 동요! 그 동요가 빌보드 차트 중 가장 핫한 차트이자 전 세계 최신 음악이 치열한 각축을 벌이는 싱크차트 핫100을 3주째 점령하고 있어요! K-POP도 아닌 동요라니! 심지어 기존의 K-POP도 상어가족 핑크퐁보다 높은 빌보드 차트를 기록한 곡(가요)은 단 4곡뿐! (방탄소년단 BTS의 DNA도 이겼어요!) 얼떨떨하지만, 우리나라를 넘어 전 세계 어린이들을 사로잡고 있는 핑크퐁 상어가족!

     

    babyshark_in_Korea 1

     

      유튜브의 유아교육 부문 핑크퐁 상어가족은 이미 우리나라에서는 뽀로로를 넘는 막강한 팬덤을 갖고 있어요. ‘뚜루루 뚜루~’로 시작하는 이 중독성 강한 동요는 2015년 우리나라 스타트업 스마트스터디가 내놓은 동요예요. 상어가족은 국악 버전, 합창 버전, 크리스마스 버전부터 뮤지컬 공연까지 OSMU(One Source Multi Use)의 거대한 실타래를 감아가고 있어요. 우리나라 동요가 단순히 우리나라만이 아니라 전 세계 아이들의 사랑을 받을 수 있었던 것은 바로 8개국 버전 컬래버레이션! 상어가족은 베이비샤크 Baby Shark라는 이름으로 영어, 중국어, 일본어, 러시아어, 스페인어 등 8개국 언어로 유튜브를 시청하는 전세계 어린이들을 매료시켰어요.

     

    babyshark_in_Korea 2

     

      해리포터만 OSMU(One Source Multi Use)로 활용될 수 있느냐. 그렇지 않아요! 2분 길이의 짧은 동요 역시 그 파급력만큼은 해리포터 못지않다는 것을 한국의 핑크퐁 상어가족으로 확인할 수 있었어요. 거기에는 세계 어린이들 귀를 동시에 자극한 후렴구에 귀여운 영상은 물론, 폭넓은 언어로의 접근이 큰 역할을 했다고 할 수 있어요. 언어와 국경을 넘어 각종 SNS로 퍼진 이 짤막한 동요. 이제는 아기상어를 부르며 춤추는 영상은 베이비샤크 챌린지 Baby Shark Challenge란 이름으로 공유되고 있어요. 문화 콘텐츠의 시대, 무엇보다도 놀라운 상어가족의 힘은 우리나라 콘텐츠가 나아가야 할 방향성을 새롭게 제시하고 있다고도 볼 수 있어요. 우리나라 동요, 상어가족 핑크퐁은 과연 어디까지 그 힘을 보여줄까요? 흥미로운 문화의 힘을 다시 한번 확인할 수 있는 사건이네요!

     

     

     

     

    Click here > WiseTranslate.net ▼

     

    WiseTranslate

     

  • (특별연재) 인공지능 자동번역은 언어를 사람처럼 이해하는 건가요? _ 2

    (특별연재) 인공지능 자동번역은 언어를 사람처럼 이해하는 건가요? _ 2

     

    자동 번역의 혁신, 알파고 딥러닝, 스스로 학습하는 기계

    앞서 살펴본 것과 같이 변화무쌍한 언어 규칙을 찾거나 최적화된 통계 모델을 찾기 위한 컴퓨터 알고리즘을 만드는 작업은 수많은 언어공학박사들이 있어야 하고 어마어마한 노력이 필요합니다. 만약 학습데이터만 입력해주면 컴퓨터 “스스로” 번역하는 방법을 찾을 수 있다면 획기적이겠죠? 그렇습니다. 최신 자동 번역 기술은 알파고를 만들었던 인공지능 딥러닝 시스템으로 컴퓨터 스스로 학습데이터를 분석해서 번역하는 방법을 찾아냅니다.

    한 가지 흥미로운 사실은 이 기술의 선구자가 바로 한국인입니다. 조경훈 씨가 2014년에 발표한 논문에서 딥러닝 기법을 이용하여 획기적인 돌파구를 만들었습니다. 이 시스템은 병렬 코퍼스(원문과 번역문 쌍으로 된 학습데이터)를 이용해서 사람의 개입 없이 두 언어 간 번역하는 방법을 스스로 학습하도록 하였습니다.

    Recurrent Neural Network(순환신경명, 약자로 RNN)과 Encoding(인코딩)이라는 두 가지 컨셉을 영리하게 조합함으로써 스스로 학습하는 번역 시스템이 탄생하게 되었습니다.

     

     

    RNN (Recurrent Neural Network, 순환신경망)이 뭔가요?

    General Neural Network (기본신경망)

    일반적인 신경망 구조의 딥러닝은 일련의 숫자를 입력 데이터로 받아서 결과를 도출하는 기계 학습 알고리즘입니다. 신경망 딥러닝은 블랙박스 방식(개발자는 틀만 만들어 둔 것이며, 실제 어떤 내용이 들어가게 될지 모름)으로 다양한 문제에 대한 해법을 제시할 수 있습니다. 예를 들어, 렌터카 업체에서 지난 몇 년간 예약 데이터를 학습시켜서 미래 특정 날짜에 얼마나 많은 손님이 예약할지 예측해 볼 수 있습니다.

     

     

     

    Recurrent Neural Network (RNN)

    RNN은 기본신경망의 변형된 형태로 이전 결과값을 다시 Input으로 사용해서 다음 결과값을 얻습니다. 즉, 이전 결과값이 다음 결과값에 영향을 미치게 됩니다.

     

     

    RNN은 데이터 시퀀스 패턴을 학습하는 것인데요. 시간 흐름이나 연속된 값의 패턴을 찾는데 용이합니다. 렌터카 예약 예측 모델에서 환경 변수가 아니라 이어지는 추세 패턴이 더 적절한 것이라면 RNN 방식이 더 정확한 결과를 도출할 수 있습니다.

    RNN은 다음에 나올 값을 예측하는 것이므로, 예를 들어, 문장의 첫 단어를 제시하면 다음에 어떤 단어가 나오는 것이 가장 확률이 높은지 예측하는 모델을 만들 수 있습니다. 셰익스피어 문집을 몽땅 RNN으로 학습시켜 만든 신경망 모델에 아무 단어나 하나를 넣으면 셰익스피어 문체를 닮은 문장이 자동으로 만들어집니다.

    RNN을 이용하면 번역, 챗봇, 주가 예측 등 시퀀스 기반의 다양한 모델을 만들 수 있습니다. 예를 들어, RNN으로 사인(sine) 파동을 수학 모델 없이 정확하게 그릴(예측) 수 있습니다.

     

     

     

    Encoding(인코딩)

    인코딩은 쉽게 말해서 컴퓨터가 이해할 수 있는 값으로 변환하는 것을 의미합니다. 예를 들어, 사람 얼굴을 컴퓨터가 비교하려면 얼굴의 특성값을 수집해야 합니다. 미간의 넓이, 눈 크기, 눈썹 길이 등의 값을 측정하고 두 얼굴에서 이런 특성값을 비교합니다. 이와 같이 얼굴 사진을 특성값으로 변환하는 과정을 인코딩이라고 할 수 있습니다.

    딥러닝에서는 어떤 특성값을 찾아야 하는지 별도로 지정할 필요가 없습니다. 신경망을 이용하면 얼굴 사진 비교를 위한 특성값을 자동으로 추출할 수 있습니다.

     

     

    바로 이 과정이 인코딩입니다. 위 그림은 얼굴 사진을 128개의 특성값으로 인코딩한 것입니다. 사진마다 이렇게 128개 숫자로 인코딩하면, 숫자의 유사성을 비교해서 “같은 사람일 확률 92%” 이런 식으로 결과를 얻을 수 있죠.

    대충 감을 잡으셨겠지만, 언어 문장도 같은 방식으로 변환할 수 있습니다. 아래 그림과 같이 모든 문장을 각각 고유한 숫자 값으로 인코딩할 수 있습니다.

     

     

    RNN 모델에 한 번에 한 단어씩 넣어주고, 마지막 단어까지 처리되면 최종적으로 문장의 인코딩을 값을 얻을 수 있습니다.

     

    이런 방식으로 모든 문장을 숫자로 표현할 수 있게 되었습니다. 이들 숫자가 무엇을 의미하는지는 중요하지 않습니다. 문장을 고유한 값으로 식별하는 방법이 생긴 것입니다.

     

     

    RNN으로 번역하기

    RNN을 이용해서 문장을 고유한 값으로 인코딩하는 방법까지 알아봤습니다. 그렇다면, RNN을 두개 장착해서 첫 번째 RNN은 문장을 숫자로 인코딩하고, 두 번째 RNN은 다시 인코딩된 숫자를 문장으로 되돌려(디코딩) 놓을 수 있지 않을까요? 혁신적인 아이디어는 바로 이것입니다.

     

     

    물론, 원문으로 다시 되돌려 놓는 게 무슨 의미가 있겠습니까. 만약, 두 번째 RNN에서 문장을 영어 원문이 아닌 스페인어로 디코딩하도록 학습시킨다면? 확보해둔 병렬 코퍼스(원문과 번역문 쌍으로 된 학습데이터)를 이용해서 이 과정을 학습시킬 수 있습니다.

     

     

    바로 이것입니다. 영어 단어가 나열된 문장을 스페인어 문장으로 변환시킬 수 있는 모델이 탄생했습니다.

     

    획기적인 시스템인 이유:

    • 학습데이터와 컴퓨터 파워만 있으면 번역기를 만들 수 있음. 이 방식이 탄생한 지는 겨우 3년밖에 되지 않았으나 20년 넘게 개발했던 기존 번역기보다 월등한 성능을 보여주고 있음
    • 언어 규칙 알고리즘이 필요하지 않음. 딥러닝 신경망이 스스로 규칙을 찾아냄. 즉, 수많은 언어공학자가 필요하지 않음
    • 언어마다 다른 개발이 필요하지 않으며, 학습데이터만 충분히 준비하면 됨

     

    특별 연재 마지막 편에서는 “인공지능 자동번역이 휴먼번역을 대체할 수 있을 것인지”에 대해 얘기해 보겠습니다.

    -다음 특별편 이어서-

     

     

     

     

     

     

     

    Click here > WiseTranslate.net ▼

     

    WiseTranslate

     

     

  • 미세먼지, 전 세계가 함께 논의해야 할 문제

    미세먼지, 전 세계가 함께 논의해야 할 문제

      안녕하세요 🙂 요즘 대부분의 사람이 통감하는 문제가 아닐까 싶은 미세먼지에 대해 얘기해볼까 해요. 특히 이번 주 간은 최악의 미세먼지로 사람들을 위협했었는데요, 언제까지 이렇게 지내야 하는지 답답하신 분들이 많으실 거예요. 매일 날씨를 확인하거나 마스크로 답답한 것은 일차적인 문제이고, 눈 코 입 피부 할 것 없이 영향을 받고 있어요. 미세먼지로 인한 폐암 등의 발병률이 높아진 것도 문제이고요. 이 미세먼지를 해결하기 위해 우리나라 자체적인 노력도 노력이지만, 범국가적인 차원에서의 접근이 필요한 시점이에요.   global_challenge_fine_dust 1   우리나라를 괴롭히는 미세먼지가 100% 외부 요인만은 아닐 거예요. 우리나라도 도시국가니까요. 하지만 우리 내부의 문제보다 더 큰 영향을 외부에서 받고 있다는 점이에요. 이는 바람 방향이 바뀌는 것만으로도 우리 하늘이 맑았다, 어두워졌다 하는 데서 알 수 있어요. 미세먼지는 단순히 우리나라의 문제로만 국한해서 볼 문제도 아니에요. 태국 역시 한 달의 절반이 미세먼지로 ‘매우 나쁨’ 수준의 대기를 보여주고 있어요. 또 인도는 사망 원인 1위가 바로 ‘대기 오염’일 정도로 먼지 문제는 심각한 수준이에요.   global_challenge_fine_dust 2   이럴 때일수록 전 세계의 대화가 필요해요. 이번에 KT는 UN 환경계획(UNEP)과 손잡고 미세먼지 관리, 대응 및 환경 문제 개선을 위한 업무협약(MOU)을 체결했어요. 글로벌 IT 기업인 IBM은 중국 기업인 에너지블록체인랩과 함께 탄소배출을 관리하는 플랫폼을 만들었고요. 영국의 블로체인 프로젝트 에너지마인은 영국의 공유자전거 기업 넥스트바이크, 전기 스쿠터 제조기업 eGen, 영국 태양열 전기차 충전기업 ‘솔리스코’, 전기차 액세서리 기업 ‘심플리 EV’ 등과 제휴를 통해 에너지토큰 보상 플랫폼을 꾀하고 있어요. 단순히 네가 나빠! 식의 모습은 도움이 되지 않아요. 이렇게 전 세계가 다각적인 방법으로 미세먼지 해결에 대해 다가서는 모습이 필요해요. 전 세계인의 대화와 행동이 필요할 때예요.        

    Click here > WiseTranslate.net ▼

      WiseTranslate    
  • 영어문서번역 클릭 한 번으로 하는 방법은?

    영어문서번역 클릭 한 번으로 하는 방법은?

     

    안녕하세요 🙂 오늘은 영어문서번역을 복잡하지 않게, 클릭 한 번으로 하는 방법에 대해 알려드릴게요! 특히나 번역 견적 과정에서 어려움을 겪으시는 분들이 많은데, 그 번거로운 과정을 쉽게 해결하는 방법에 대해서도 알려드릴게요! 영어문서번역, 어렵고 복잡한 것으로 생각하시는 분들이 많은데, 절대 그렇지 않아요! 지금부터 제가 안내하는 대로만 따라 하시면 쉽고 편하게, 빠르지만 정확하게, 그러면서도 저렴한 진짜 전문가 번역을 받을 수 있답니다!

     

    just_one_click_to_translate 1

     

    전문 번역 사이트 WiseTranslate.net에 접속하시면 메인 화면에 바로 ‘번역 요청’ 버튼이 있어요. 요청 버튼을 누른 후, 어떤 번역을 진행할 건지 골라 주세요. 스피드가 장점인 기계번역, 섬세함과 정교함이 강점인 휴먼번역. 그 후 번역을 원하는 언어를 선택 후, 영어문서번역 파일을 통째로 사이트에 끌고 와서 놓아 주세요. (Drag & Drop) 혹은 문서 그대로 업로드를 해도 좋아요. 어떤 방법이든 ‘문서 그대로’ 업로드 할 수 있다는 것을 잊지 마세요. 복사, 붙여넣기를 하거나 다른 형식으로 바꿀 필요 없어요. 원문 파일 그대로!

     

    just_one_click_to_translate 2

     

    그 뒤로 가장 중요한 과정, 실시간 견적 확인! WiseTranslate가 자랑하는 기술 중 하나예요. 일반적인 번역 사이트(업체)는 번역 견적 확인하는 과정이 매우 복잡해요. 문서를 넘긴 후, 각 업체마다 기준에 따라 견적을 산출해요. 그렇기 때문에 산출에 걸리는 시간은 필수. WiseTranslate는 빠르고 편한 번역을 제공하기 위해 복잡한 이 과정을 30 초안에 진행할 수 있는 비법을 만들었어요. 그것이 바로 업로드와 동시에 제공되는 실시간 견적! 이제는 번역 견적을 위해 업체에 직접 전화하거나, 긴 시간 기다려 받은 견적서를 받고 생각보다 높은 비용에 번역을 철회하는 일은 그만! 업로드 후 바로 견적 확인하고, 바로 번역 진행 여부를 결정하세요. 여러분의 시간은 소중하니까요!

     

     

     

     

    Click here > WiseTranslate.net ▼

     

    WiseTranslate

     

  • 중국인 근로자가 자주 쓰는 중국어_일상 생활편 3

    중국인 근로자가 자주 쓰는 중국어_일상 생활편 3

     

    안녕하세요 🙂 중국인 근로자가 자주 쓰는 중국어_일상 생활편 1, 중국인 근로자가 자주 쓰는 중국어_일상 생활편 2편을 거쳐 3탄으로 돌아왔습니다! 이번 역시 일상생활에서도 활용도 높은 문장들을 알려드릴게요. 바로 날씨와 여가 생활에 관련된 표현! 주변 사람들과 어색한 분위기를 깨기 위한 대화 주제로 이것보다 더 좋은 것들이 있을까요? 경직된 분위기보다 자연스럽고 편안한 분위기에서 능률은 더 오른답니다! 서로 간의 대화 물꼬를 틀 좋은 문장들! 이제 알려드릴게요!

     

    daily_chinese_language_series_3 1

     

    어느 곳이든 날씨 얘기는 대화를 시작하기에 가장 좋은 주제예요! 특히 계절마다 특징이 뚜렷한 우리나라에서는 무엇보다 쉽게 건넬 수 있는 대화 주제이기도 해요. 특히 요즘같이 추울 때, 옷 따뜻하게 입으라는 말 한마디가 사람과 사람 사이의 관계도 따뜻하게 데워줄 수도 있어요.

    날씨가 많이 쌀쌀해 졌어요. 天气变冷了
    날씨가 좋네요 天气很好
    날씨가 추워요? 天气冷吗?
    동상에 걸리지 않도록 조심하세요 请注意预防冻伤
    두꺼운 옷이 필요합니까 ? 需要厚衣服吗?
    아침, 저녁으로 온도 차이가 많이 납니다. 早晚温差大
    옷을 따뜻하게 입으세요. 多穿一点
    환절기입니다. 现在是换季
    감기에 걸리지 않도록 유의하세요 请注意预防感冒

     

    daily_chinese_language_series_3 2

     

    점심시간. 동료들과 밥을 먹으러 가서 서로 입 꾹 다물고 밥만 드셨었나요? 이젠 가벼운 대화로 관계를 풀어보세요. 쉬는 날엔 무엇을 하시나요? 취미는 무엇인가요? 운동을 좋아하시나요? 처음이 어렵지 시작하고 나면 서로 편하게 대화할 수 있을 거예요. 서로를 잘 아는 것만큼 업무의 효율을 높이는 방법이 또 있을까요?

    쉬는 날에는 주로 뭐해요? 休息天都会做什么?
    쉬는 날에 무엇을 하고 싶나요? 休息天想做什么?
    이번 주말에는 쉬세요. 这个周末就休息吧
    일요일에는 일이 없습니다. 星期天没事做
    내일은 공휴일이니 기숙사에서 쉬도록 해요 明天是公休日,回去好好休息吧
    당신의 취미는 무엇입니까? 你的爱好是什么?
    운동을 좋아하십니까? 喜欢运动吗?
    이번 주말에 등산하는 건 어떻습니까? 这个周末去登山吧?

    외국인 동료들을 어려워하지 마세요. 서로 천천히 대화를 시작하는 것이 중요해요. 더 나은 업무환경을 위해 대화를 시작해 보세요!

     

     

     

     

    Click here > WiseTranslate.net ▼

     

    WiseTranslate

     

  • 진짜 전문 번역가에게 번역을 맡기는 가장 저렴한 방법은?

    진짜 전문 번역가에게 번역을 맡기는 가장 저렴한 방법은?

     

    안녕하세요 🙂 오늘은 번역, 그중에서도 전문 번역가에게 번역을 요청하는 “가장 저렴한” 방법에 대해 찾아볼까 해요. 번역 방법은 여러 가지가 있어요. 기계번역, 휴먼번역, 그 안에서도 전문가번역, 비전문가 번역, 간단한 문장 번역 등. 오늘은 휴먼번역 중 진짜 전문 번역가 번역에 대해 알려드릴게요. 전문 번역가를 찾기도 쉽지 않은데, 그 후로도 이것저것 재봐야 할 것들이 많이 있거든요. 저렴하지만 진짜 전문가 번역을 찾는 방법! 찾아볼까요?

     

    professional_translation_at_low_cost 1

     

    번역가의 번역 질을 확인하는 방법 중 가장 쉬운 것은 번역 이력을 확인하는 것이에요. 어떤 사람, 기업과 어떤 번역을 진행했는지 확인해보면 번역의 퀄리티를 짐작할 수 있어요. 무조건 전문가 번역이 필요한 것은 아니거든요. 내가 원하는 것은 첨가물 확인 정도의 번역인데 굳이 최고의 전문가를 이용할 필요가 없고, 반대로 내가 원하는 것이 학술지 이상의 전문 번역인데 학부생이 작업하는 번역 작업을 할 수는 없어요. 그렇기 때문에 나에게 맞는 번역가를 찾는 것도 매우 중요한 작업이에요. 하지만 중요한 것은 어떤 일이든 “전문 번역가” 작업은 매우 비싸다는 것!

     

    professional_translation_at_low_cost 2

     

    그럼 자금이 부족한 유저들은 전문 번역가 번역을 절대 받을 수 없는 것일까요? 지식 역시 빈익빈 부익부가 필연적일까요? 이러한 악순환의 고리를 끊어내기 위해 전문 번역회사 Wise SerTech이 앞장서서 나섰어요. WiseTranslate.net에서는 Apple, Google, Amazon 등의 번역을 진행하는 “진짜” 전문 번역사들을 중간 수수료 없이 다이렉트로 만날 수 있어요. 최고의 퀄리티를 최저의 번역비로! 어떤 분야든, 어떤 문서든, 어떤 언어든! 진짜 전문 번역가들로 저렴하지만 확실한 WiseTranslate 번역! 실시간 무료 견적 산출은 물론, 가입 시 제공하는 무료 포인트로 이 모든 혜택을 무료로 지금 만나보세요!

     

     

     

     

    Click here > WiseTranslate.net ▼

     

    WiseTranslate

     

     

  • 2019, 전 세계의 새로운 시작을 함께! WiseTranslate!

    2019, 전 세계의 새로운 시작을 함께! WiseTranslate!

     

    안녕하세요 🙂 황금돼지의 해, 2019년 기해년의 해가 밝았습니다! 여러분들의 새해는 어떻게 시작되셨나요? 새로운 한 해가 시작된 만큼 각자 다짐한 목표들이 있을 거예요. 이번에는 작심삼일이 되지 않게! 모두 원하는 바를 꼭 이루시길 바랄게요! 사소한 것부터 원대한 소망까지, 다들 이루어지는 행복한 한 해가 되기를! 특히 2019는 작게는 우리나라 안에서부터 크게는 전 세계 인들이 다 같이 즐기거나 해결해야 할 이슈가 많은 한해예요. 그래서 더더욱 올 한해가 기대되기도 해요!

     

    happy_new_year_2019 1

     

    2018에는 전 세계적인 이슈가 있었죠. 바로 영원한 평행선일 것 같았던 남한과 북한의 극적인 만남! 역사적 순간의 주인공이 ‘우리’라는 것이 정말 감격스러워요. 남북정상회담, 그 궁극의 끝은 언어의 만남 (언어 해석의 힘)에서도 말했듯 이 회담이 인상적이었던 것은 통역이 불필요한 유일한 정상회담이었다는 사실. 이 남북회담을 시작으로 북미회담이 진행되었고, 달리지 않을 것 같던 철마도 오랜 시간의 잠을 깨고 질주를 기다리고 있어요. 기해년에는 남과 북이 어떤 대화를 나눌지 우리는 물론, 전 세계의 이목이 쏠려 있어요. 새로운 남과 북의 대화, 우리에게 어떤 방향을 제시할까요?

     

    happy_new_year_2019 2

     

    세계의 시선은 남과 북, 한국만 보고 있는 것은 아니에요.최근 급부상하고 있는 난민 문제, 우리나라 사람들이 예민하게 집중하고 있는 미세먼지, 전 지구인의 숙원인 환경문제까지. 전 세계의 소통이 필요한 문제는 여전히 곳곳에 존재하고 있어요. 이런 문제는 결코 나 혼자만 잘해서는 해결할 수 없는 문제예요. 전 세계 사람들이, 지식인들이, 지도자들이 책임을 지고 이야기하고 풀어가야 할 문제들이죠. 문제들은 생각만한다고 저절로 해결되지 않아요. 서로의 생각과 마음을 나누면서 해결책을 찾아야 해요. 문제의 해결은 의외의 곳에서 나올 수도 있어요. 그렇기 때문에 더더욱 소통해야 해요. 언어를 넘어, 문화를 넘어. 올해에는 갈등을 넘어 평화를 틔울 수 있는 한 해가 되었으면 해요!

     

     

     

     

    Click here > WiseTranslate.net ▼

     

    WiseTranslate

     

     

  • (특별연재) 인공지능 자동번역은 언어를 사람처럼 이해하는 건가요? _ 1

    (특별연재) 인공지능 자동번역은 언어를 사람처럼 이해하는 건가요? _ 1

     

    이미 많은 분이 Google Translate파파고와 같은 번역기를 사용해 보았을 겁니다. 100여 개가 넘는 언어를 순식간에 번역할 수 있죠. 웹에서뿐만 아니라 스마트워치와 같은 모바일 기기에서도 손쉽게 사용할 수 있습니다. Google Translate에 사용된 기술을 Machine Translation(기계 번역 또는 자동 번역)이라고 부릅니다. 자동 번역기 덕분에 우리는 세계 여러 나라 사람들과 언어 소통의 장벽을 손쉽게 극복할 수 있게 되었습니다.

     

     

    초등학생도 다 알고 있는 Google Translate를 소개하려는 것은 아니고요. Machine Translation이 어떻게 언어를 이해하고 동작하는지 여러분과 살펴보려고 합니다.

    불과 몇 년 사이에 Machine Translation 기술이 비약적인 발전을 이루었습니다. 2016년 9월 Google은 Deep Learning 방식으로 개발한 완전히 새로운 자동 번역기를 발표하고, Google 블로그에 아래와 같은 글을 올렸습니다.

    Google’s AI translation system is approaching human-level accuracy (인간 번역 수준에 근접한 Google의 인공지능 번역기)

     

    위 그래프에서 “PBMT”는 예전 방식의 자동번역이고, “GNMT”가 새롭게 발표한 자동번역 기술입니다. 바로 이날을 기점으로 자동 번역 기술의 역사는 새롭게 시작됩니다. 흔히, 번역이 맘에 들지 않을 때 “Google 번역 같아요”라고 핀잔을 주곤 했었죠. 이젠 그렇게 말할 수 없습니다.  현재 Google 번역 수준을 한 번 보겠습니다.

     

    어떤가요? 거의 완벽하지 않나요? 2016년 9월 이전에는 “Google 번역 같아요”가 핀잔이었지만 지금은 칭찬이 될 수도 있습니다. 이러한 혁신적인 자동 번역은 어떻게 만들어졌을까요? 바로 이 궁금증에 대해 알아보겠습니다.

     

    자동 번역 기술의 시작

    컴퓨터가 어떻게 언어를 번역하는 걸까요? 가장 간단한 방식은 문장의 각 단어를 번역할 언어로 치환하는 것입니다. 영어를 한국어로 단어 단위로 순서대로 번역하면 이렇게 되겠죠.

     

    관사와 전치사는 지면 관계상 하나로 묶었습니다. 이렇게 번역하기 위해선 단어 사전만 있으면 되니 무척 간단합니다. 그러나, 언어 문법과 어순이 완전히 무시되어 번역이 엉망입니다.

    해당 언어의 규칙을 알고리즘으로 만들어 적용하면 더 나은 결과를 만들 수 있습니다. 예를 들어, 우리말 어순에 맞게 동사를 맨 뒤로 이동시키면 이런 모습이 되겠네요.

    이제 여기에 조사를 추가하고 문법과 각종 구문을 언어 규칙으로 만들어서 추가하면 어떤 문장이라도 번역할 수 있겠죠? 이런 방식을 “규칙 기반 자동 번역(Rule-based MT)”이라고 합니다.

    이런 식으로 컴퓨터 자동 번역기를 만들었던 것이 최초의 방식이었습니다. 언어 공학 박사들이 복잡한 규칙을 만들고 그러한 규칙을 프로그램으로 하나씩 코딩했었죠. 냉전 시기에 소련의 통신을 엿듣고 번역하려고 세계적인 언어 공학자들이 수년간 번역 시스템을 만들기도 했습니다.

    그러나, 이 방식은 초등학교 교과서 같이 쉽고 간단한 문장만 번역할 수 있었고 정작 일상에서 필요한 문서들은 제대로 번역하지 못했습니다.

    그렇습니다. 우리가 사용하는 언어는 정형화된 규칙을 항상 따르지는 않죠. 언어는 수많은 예외가 있고, 지역과 문화에 따라 변화무쌍하게 달라집니다. 시대에 세대에 따라 규칙은 계속 바뀝니다.

     

     

    더 나은 번역, 통계적으로 접근

    규칙 기반 자동 번역 시스템의 실패 후 시작된 새로운 시도는 문법 대신 확률과 통계 기반 모델을 만드는 것이었습니다.

    통계 기반 번역 시스템을 구축하려면 엄청난 양의 학습 데이터가 필요하며, 학습 데이터는 언어쌍으로 있어야 합니다. 이러한 언어 쌍 데이터를 전문 용어로 “병렬 코퍼스(parallel corpora)”라고 합니다. 17세기에 이집트 상형문자를 판독하기 위해 과학자들이 로제타스톤을 사용했던 것처럼 병렬 코퍼스를 사용해서 언어 번역을 어떻게 해야 할지 컴퓨터 프로그램으로 추론할 수 있습니다.

    학습 데이터를 구하는 것이 관건인데, 유럽의회로부터 21개 언어로 된 번역 데이터를 손쉽게 구할 수 있었습니다. 유럽의뢰는 모든 의사 진행 자료를 21개 언어로 번역해서 보관하고 있었습니다. 이 자료는 누구나 접근할 수 있습니다.

     

     

    확률적 접근법

    통계 기반 번역 시스템의 가장 근본적인 차이는 한 가지 동일한 번역을 도출하지 않고 수천 가지 가능한 번역을 만든 다음 각각 정확도 순위를 매깁니다. 정확도 순위는 학습 데이터와 비교한 근사치를 기준으로 판단합니다. 어떻게 동작하는 것인지 좀 더 자세히 살펴보겠습니다.

     

    1 단계: 문장을 작은 단위로 쪼개기

    쉽게 번역할 수 있는 작은 단위로 쪼갭니다.

     

    2 단계: 조각별로 적용할 수 있는 모든 번역 찾기

    조각별로 학습 데이터를 뒤져서 기존 번역을 모두 찾습니다. 사전을 찾는 것이 아니라 실제 사람이 번역했던 데이터를 찾는 것입니다. 즉, 각기 다른 문맥에 사용되었던 다양한 표현을 가져올 수 있죠.

    여러 표현 중 학습 데이터에 사용되었던 빈도가 높은 순으로 순위를 매깁니다.

     

    3 단계: 조합 가능한 모든 번역을 나열하고 가장 근접한 번역 찾기

    이번에는 각 조각을 모아서 조합 가능한 모든 번역을 만듭니다. 위 2단계에 나열한 번역을 모두 조합해 보면 672가지 번역을 만들 수 있죠. 어순, 조사, 어미 등 문법적 요소까지 정리된 것을 전제로 몇 가지 나열해 보겠습니다.

     

    나는 / 6시에 / 약속을 / 갖고 있다

    나는 / 6시에 / 약속이 / 있다

    나는 / 6시에 / 약속을 / 소유한다

    나는 / 6시에 / 약속을 / 먹다

     

    이렇게 나열한 뒤에는 가장 “인간다운” 번역을 찾아야 하는데, 이를 위해 각 조합 문장을 다시 책이나 뉴스 기사 등 학습 데이터에 실제 사용되었던 수백만 개의 문장과 비교해서 가장 유사한 (높은 확률) 형태를 보이는 조합을 찾습니다.

     

     

    통계 기반 자동 번역, 새로운 지평 그러나 한계점 드러남

    학습 데이터가 충분하다면 통계 기반 번역 시스템은 규칙 기반보다 훨씬 뛰어난 결과를 보여줍니다. 2000년 초반 Google Translate의 탄생 배경이기도 하며, 자동 번역 시스템이 비로소 대중에게 많이 알려지게 되었습니다.

    자동 번역 품질이 분명히 향상되었으나 개발과 유지가 매우 복잡하고 힘들었습니다. 새로운 언어쌍을 개발할 때마다 언어전문가가 필요했고 여러 단계를 거쳐야 하는 번역 프로세스를 계속 뜯어고쳐야 했습니다.

    이러한 복잡성으로 인해 편법(?)이 자행됩니다. 예를 들어, 조지아어(Georgian)에서 텔루구어(Telugu)로 번역해야 한다면, 내부적으로 영어(English)로 먼저 번역한 후 영어에서 텔루구어로 번역하는 방식을 선택할 수밖에 없습니다. 왜냐하면 조지아어에서 텔루그어로 번역된 학습 데이터를 충분히 확보하기 어렵고, 이 둘 언어의 언어 공학 연구도 쉽지 않기 때문입니다.

    언어학 박사 공학 박사 없이 컴퓨터가 이런 복잡성을 모두 해결해 줄 수 있다면 어떨까요?
    다음 편에 이 내용을 살펴보겠습니다.

    -이어서-

     

     

     

     

     

     

     

    Click here > WiseTranslate.net ▼

     

    WiseTranslate

     

     

  • 번역 비용이란? 번역 비용 관련 A-Z!

    번역 비용이란? 번역 비용 관련 A-Z!

     

    안녕하세요 🙂 오늘은 번역 ‘비용’에 대해 알려드릴게요. 번역을 진행하고 싶은데, 처음에 탁! 막히는 벽이 바로 비용 관련된 문제가 아닐까해요. 왜냐하면 번역 비용은 보통 꼭꼭 숨겨져 있기 마련이거든요. 뭐 잘못된 거 아니야? 라고 생각하실 수 있겠지만 이건 잘못된 게 아니에요. 일반적인 번역 비용 산출과정이 절대 쉽지 않기 때문이에요. 그렇다면 번역을 맡기기 전까지 얼마가 드는지 전혀 모른 채 번역을 맡겨야 할까요? 절대 그렇지 않아요! 지금부터 번역 비용 A-Z를 알려드릴게요. 저렴하고 확실하게 번역을 진행하도록 해요!

     

    translation_cost_details 1

     

    일반적인 번역 사이트에서 번역 비용을 산출하는 데 오래 걸린다고 앞에서 말씀드렸어요. 왜냐하면 업체마다 번역 비용을 정하는 기준이 다르고, 책정하기 위한 내부 과정을 진행하기 때문이에요. 그래서 보통 번역을 원하는 파일을 먼저 전송한 후, 업체에서 번역 비용을 산정하면 그 이후에 작업을 진행할 것인지 아닌지 결정하게 돼요. 이때 걸리는 시간은 거의 필수적이라고 할 수 있어요. 그래서 업체들은 이 시간을 줄이기 위해 노력하고 있어요. 하지만 유저들은 이런 일련의 번역 비용 정책에 대해 잘 모를 수밖에 없고, 비용 산출 후 작업 진행을 결정해야 하므로 시간이 오래 걸릴 수밖에 없어요.

     

    translation_cost_details 2

     

    그래서 20년 경력의 전문 번역 회사인 Wise SerTech은 다른 어떤 곳보다도 획기적으로 번역 비용 산출 시간을 줄일 방법에 대해 연구했어요. 그리고 탄생한 WiseTranslate.net ‘실시간’으로 번역 비용 산출이 가능한 초특급 번역 사이트에요. WiseTranslate는 내부 알고리즘에 따라 파일 업로드와 동시에 번역 비용이 책정할 수 있는 기능을 만들었어요. 사이트에 들어가 파일을 업로드만 해주세요. 그러면 동시에 비용을 확인할 수 있어요! 이제 더는 비용 산출 시간을 기다릴 필요가 없게 되었어요. 그뿐만 아니라 페이지당 약 10포인트(500원)라는 아주아주 저렴한 비용까지! 비용도 시간도 절감한 최고의 사이트, WiseTranslate! 지금 바로 가입 시 제공하는 무료포인트로 최고의 번역을 만나보세요!

     

     

     

     

    Click here > WiseTranslate.net ▼

     

    WiseTranslate

     

     

  • 크리스마스 인사말, 행복을 나누는 즐거운 시간!

    크리스마스 인사말, 행복을 나누는 즐거운 시간!

     

    안녕하세요 🙂 드디어 2018년의 크리스마스가 다가왔어요! 여러분들의 크리스마스는 어떠한가요? 그리고 또 2018 한해는 어떠했나요? 이제 올해를 마무리하고 새로운 해를 준비해야 할 시간이 정말 다가왔어요. 여러분들 모두 행복한 2018년이 되었었나요? 그동안 연락하지 못했던 지인들에게도 소소한 인사를 전해보세요. 모두에게 훈훈한 연말이 될 거에요. 오늘은 지인들에게 가볍게 안부를 전하는 인사말을 알려드릴게요.
    여러분들도 주변 사람들에게 따뜻한 말 한마디로 추위를 녹이는 연말이 되기를 바랄게요!

     

    xmas_greetings_happy_holidays 1

     

    크리스마스와 연말에 쓸 수 있는 표현들을 모아봤어요. e-mail과 편지 처음과 끝에 이 문구들을 이용해보세요. 경쾌하고 따듯한 편지가 될 거에요!

    Merry Christmas!
    Have a merry Christmas filled with happiness, love and thanks! 행복과 사랑, 감사로 가득한 크리스마스 보내세요!
    I hope that you have had a great year this year. 멋진 한 해를 보냈기를 바라요.
    It’s already the end of the year! 벌써 연말이네요!
    Have a good time at the end of the year! 연말 잘 보내요!
    Thank you for your hard work this past year. 한 해 동안 고생 많았어요.
    I sincerely thank you for supporting and helping us this year. 올해 많이 도와주고 힘이 되어줘서 진심으로 고마워요.
    My 2018 was happy and meaningful because of you. 당신 덕분에 저의 2018년이 행복하고 의미 있는 한 해가 되었어요.

     

    xmas_greetings_happy_holidays 2

     

    이번에는 새로운 해를 기다리면서 희망으로 가득 찬 문구를 알려드릴게요. 2019를 기다리며 늘 설레는 하루하루가 되길 바랄게요!

    Season’s greetings!
    I hope all your goals and dreams will be fulfilled in the new year. 새해에는 바라는 모든 일이 이뤄지길 바랄게요!
    Have a warm and happy holidays and a hopeful new year. 따뜻한 연말 보내시고 희망찬 새해 맞이하세요.
    There will be more reasons to smile this new year. 새해에는 웃을 일이 더 많아질 거예요.
    2019 will be your year! 2019년은 당신의 해가 될 거예요!
    I wish you can achieve all of your wishes in new year of 2019, and your family and workplace be always full of happiness and health. 다가오는 2019년 새해에는 하고자 하는 모든 일 모두 이루길 바라며, 가정과 직장에 행복과 건강이 항상 가득하길 바랄게요.
    I sure that you will be more happy than before. 당신이 전보다 더 행복할 거라 믿어요!
    I wish you good luck and much happiness in the following year. 내년에는 행운과 행복이 깃들기를!

    즐거운 크리스마스, 행복한 연말연시 되세요!

     

     

     

     

    Click here > WiseTranslate.net ▼

     

    WiseTranslate