Google은 오늘 공식적으로 "번역 분야를 여는 중요한 단계"라고 불리는 최신 오픈 소스 가중치 모델 Gemma 3을 기반으로 하는 새로운 오픈 소스 번역 모델 제품군인 TranslateGemma를 출시했습니다. 첫 번째 배치는 스페인어, 프랑스어, 중국어, 힌디어 등 주류 언어를 포함하여 최대 55개 언어를 지원합니다.

이 릴리스의 시기는 경쟁사의 역학을 밀접하게 따릅니다. 불과 몇 시간 전에 OpenAI는 어조와 상황 제어에 초점을 맞춘 ChatGPT 번역 도구를 막 출시했습니다. 이중 열 인터페이스와 자동 언어 인식을 통해 사용자 경험과 문맥 이해 측면에서 Google 번역과 같은 기존 번역 서비스에 도전하려고 시도합니다. 이와 대조적으로 TranslateGemma는 여러 벤치마크에서 개방형 모델 기능과 전반적인 번역 품질에 더 중점을 둡니다.

TranslateGemma 제품군은 현재 40억, 120억, 270억 매개변수의 세 가지 크기로 제공됩니다. Google이 제공한 평가 결과에 따르면 WMT24++ 벤치마크에서 TranslateGemma 12B는 Gemma 3 27B의 기본 버전보다 성능이 뛰어났습니다. 즉, 절반 미만의 매개변수를 사용하여 더 높은 처리량과 더 낮은 대기 시간을 달성하는 동시에 번역 정확도를 유지하거나 개선할 수 있으며, 이는 컴퓨팅 성능이 제한된 환경에서 고품질 번역 모델을 배포하는 개발자에게 도움이 됩니다.

배포 시나리오 측면에서 Google은 4B 모델이 모바일 추론에 최적화되어 있으며 휴대폰과 같은 단말 장치에서 로컬로 실행하는 데 적합하다고 밝혔습니다. 12B 모델은 소비자 노트북과 같은 로컬 컴퓨팅 성능 시나리오를 지향합니다. 27B 모델에는 클라우드 단일 카드 NVIDIA H100 및 기타 구성과 같은 강력한 컴퓨팅 성능 지원이 필요합니다. Vistra 이미지 번역 벤치마크에서 TranslateGemma는 이 시나리오에 대해 구체적으로 미세 조정되지 않았음에도 불구하고 이미지 내 텍스트 번역 작업에서 더 나은 결과를 달성하여 다중 모달 텍스트 이해에 대한 모델의 잠재력을 보여주었습니다.

Google은 TranslateGemma의 성능 향상이 2단계 교육 과정을 통해 이루어졌다고 밝혔습니다. 첫 번째 단계는 감독된 미세 조정입니다. 연구팀은 Gemma 3 기본 모델 위에 대량의 인간 번역 코퍼스를 도입하고 이를 Gemini 모델에서 생성된 고품질 합성 데이터와 결합하여 훈련했습니다. 두 번째 단계에서는 강화 학습을 사용하여 MetricX-QE, AutoMQM 및 기타 고급 지표를 포함한 일련의 보상 모델을 통해 번역 품질 최적화를 안내하여 모델을 번역 출력에 더 자연스럽고 상황에 맞게 적합하게 만듭니다.

현재 연구원과 개발자가 자유롭게 실험하고 개발할 수 있도록 Kaggle 및 Hugging Face 플랫폼에서 TranslateGemma 모델 전체를 다운로드할 수 있습니다. OpenAI가 채팅 기반 프런트엔드 제품에 번역을 추가로 통합하는 동안 Google은 고성능 기본 모델을 개방하여 타사 애플리케이션 구축을 위한 더 많은 기술 옵션을 제공합니다. 이는 또한 기계 번역 트랙이 개방형 모델과 서비스 지향 도구의 두 가지 수준에서 경쟁을 심화할 것임을 나타냅니다.

관련 기사:

ChatGPT 번역이 온라인에 있습니다. OpenAI가 Google 번역에 대한 새로운 도전을 시작합니다.