08/07/2024

번역 엔진 벤치마킹: 성능과 품질의 비교 연구

많은 번역 엔진은 다양한 수준의 성능과 품질을 제공합니다. 하지만 어느 것을 선택해야 할까요?

MachineTranslation.com은 AI 기반 번역 수집기에서 사용할 수 있는 다양한 최고의 기계 번역기를 연구했습니다. 우리는 속도와 정확성 사이에서 최상의 균형을 찾기 위해 주요 지표를 기반으로 주요 엔진을 분석했습니다.

우리가 검토한 최고의 기계 번역 엔진은 DeepL, Google, Chat GPT, Microsoft, Lingvanex, Modern MT, Royalflush, Niutrans 및 Groq입니다.

상위 번역 엔진의 상세 비교

우리의 AI 기반기계 번역 수집기사용자 번역 및 상호 작용을 통해 광범위한 데이터를 수집했습니다. 이 데이터를 사용하여 평균 번역 점수와 처리 시간이라는 두 가지 주요 지표를 분석했습니다.

번역 엔진의 평균 점수

평균 점수는 각 엔진이 생산하는 번역 품질을 나타내는 주요 지표입니다. 점수는 번역된 텍스트에 대한 피드백을 바탕으로 명확성, 일관성, 필요한 편집 범위를 기준으로 평가됩니다. 이 문서에 제시된 결과는 다양할 수 있으며 지속적인 피드백과 연구에 따라 변경될 수 있습니다.

주요 번역 엔진의 평균 점수는 다음과 같습니다.

  • DeepL: 8.38

  • Google: 7.90

  • GPT 채팅 : 7.82

  • Microsoft: 7.77

  • 링바넥스 : 7.49

  • 현대MT : 7.48

  • 로얄 플러쉬 : 6.54

  • 니우트랜스 : 6.65

  • 그로크 : 6.66


번역 엔진의 평균 점수

이 차트는 각 엔진의 평균 점수를 보여줍니다.

위의 차트를 토대로, DeepL평균 점수가 가장 높아 11명의 기계 번역기 중 우수한 번역 품질을 보여줍니다. Google과 Chat GPT도 좋은 성능을 보이고 있으며 Microsoft가 그 뒤를 바짝 쫓고 있습니다.

Lingvanex와 Modern MT는 중간 수준의 성능을 제공하며 만족스러운 품질을 제공하지만 최고 수준의 성능을 제공하지는 않습니다. Royalflush, Niutrans 및 Groq는 평균 점수가 가장 낮으므로 번역에 더 많은 수정이 필요한 경우가 많습니다.

더 읽어보세요: 많이 사용하는 기계 번역 엔진이 지원하는 언어

다양한 엔진의 처리 시간

처리 시간은 번역 엔진의 효율성을 반영하는 중요한 지표입니다. 실시간 번역에는 더 빠른 처리 시간이 필수적입니다. 각 엔진의 평균 처리 시간은 다음과 같습니다.

  • Google: 0.22초

  • Microsoft: 0.26초

  • 아마존 : 0.33초

  • 현대MT : 0.36초

  • 링바넥스 : 0.45초

  • DeepL: 0.51초

  • GPT 채팅 : 1.12초

  • 니우트랜스 : 1.47초

  • 로얄 플러쉬 : 1.83초

다양한 엔진의 처리 시간


이 차트는 각 기계 번역 엔진의 평균 처리 시간을 보여줍니다.


위 차트에서 볼 때 Google, Microsoft, Amazon이 가장 빠르므로 빠른 번역에 이상적입니다. 최신 MT, Lingvanex 및 DeepL은 적당한 속도를 제공합니다.


ChatGPT, Niutrans 및 Royalflush는 가장 느리므로 시간에 민감한 상황에서는 단점이 될 수 있습니다.

처리 시간과 점수의 상관관계

히트맵 매트릭스


이 차트는 번역 속도와 품질 사이에 상관관계가 없음을 보여줍니다.

처리 시간과 처리 시간 사이에 관계가 있는지 확인하려면번역 품질 , 우리는 이 두 측정항목 간의 상관관계를 분석했습니다. 위 차트를 보면 상관계수는 약 -0.093으로 매우 약한 음의 상관관계를 나타냅니다. 이는 더 빠른 번역 시간이 반드시 품질에 영향을 미치는 것은 아니며 두 측정항목은 대부분 독립적이라는 것을 의미합니다.

피드백 분석에 대한 통찰력

피드백은 번역 품질에 대한 귀중한 통찰력을 제공합니다. MachineTranslation.com 수집자의 가장 일반적인 피드백 유형과 빈도는 다음과 같습니다.

  1. 구름 조금: 약간의 수정만 필요했습니다 . 인스턴스 76,877개

  2. 거의 매끄러움: 선택적 조정이 필요합니다 - 인스턴스 64,001개

  3. 매우 세련된: 가벼운 편집으로 이점을 얻을 수 있습니다 - 인스턴스 55,030개

  4. 매우 불일치함: 상당한 수정이 필요함 - 인스턴스 32,301개

  5. 철저한 편집이 필요합니다: 철저한 편집이 필요합니다 - 인스턴스 27,697개

언급된 일반적인 피드백 유형 외에도 아래 차트에 표시된 것처럼 AI 기반 수집기의 번역 품질을 보다 정확하게 표현하기 위해 추가 분석을 수행했습니다.

피드백 분석에 대한 통찰력


당사의 AI 기반 번역 수집기는 내부 피드백 분석을 기반으로 "대부분 명확한" 출력을 생성합니다.

위 차트는 번역된 콘텐츠에 대한 AI 기반 수집기의 내부 피드백 분석을 표시합니다. 가장 높은 평균 점수는 "매우 깨끗함", "거의 매끄러움" 및 "매우 세련됨"입니다.


"뛰어나게 명확함"은 평균 점수가 가장 높으며, 이는 편집이 최소한으로 필요함을 나타냅니다. "거의 매끄러움"과 "매우 세련됨"의 평균 점수는 약 7.5~8로 유사하며 약간의 개선이 필요하지만 품질이 양호함을 나타냅니다. 


한편, 가장 낮은 점수는 "일관성이 매우 낮음" 및 "철저한 편집 필요"에 대한 것으로 평균 점수가 5 미만으로 심각한 번역 문제를 나타냅니다.


더 읽어보세요: 언어 쌍에 대한 최고의 기계 번역 엔진

결론

우리의 연구는 다양한 번역 엔진의 강점과 약점을 식별합니다. 이 기사의 기계 번역기에 대한 결과는 우리가 AI 기반 수집기를 계속 연구하고 개발함에 따라 변경될 수 있습니다.


이러한 조사 결과는 기업과 개인이 속도, 품질 또는 둘 모두의 균형을 중시하든 특정 요구 사항에 따라 최고의 번역 엔진을 선택하는 데 도움이 될 수 있습니다. 이 기사에 언급된 기계 번역 엔진을 사용해 보려면 당사 홈페이지를 방문하세요. 당신은 또한 우리의에 가입할 수 있습니다무료 구독 계획 , 더 많은 액세스를 위해 매달 1500크레딧을 제공합니다.