08/07/2024

Порівняльний аналіз механізмів перекладу: Порівняльне дослідження продуктивності та якості

Багато систем перекладу пропонують різні рівні продуктивності та якості. Але який вибрати?

MachineTranslation.com вивчив різні найкращі машинні перекладачі, доступні на нашому агрегаторі перекладів на основі штучного інтелекту. Ми проаналізували провідні двигуни на основі ключових показників, щоб знайти найкращий баланс швидкості та точності.

Найпопулярнішими системами машинного перекладу, які ми перевірили, є DeepL, Google, Chat GPT, Microsoft, Lingvanex, Modern MT, Royalflush, Niutrans і Groq.

Детальне порівняння найкращих систем перекладу

Наш штучний інтелект агрегатор машинного перекладу зібрав велику кількість даних про переклади та взаємодії користувачів. За допомогою цих даних ми проаналізували два ключові показники: середні оцінки перекладу та час обробки.

Середні бали систем перекладу

Середня оцінка є ключовим показником якості перекладу, створеного кожною системою. Оцінки нараховуються на основі відгуків про перекладені тексти, оцінюються за ясністю, зв’язністю та обсягом необхідних редагувань. Результати, представлені в цій статті, можуть відрізнятися та змінюватися на основі поточних відгуків і досліджень.

Ось середні оцінки провідних систем перекладу:

  • DeepL: 8.38

  • Google: 7.90

  • GPT чату : 7.82

  • Microsoft: 7.77

  • Лінгванекс : 7.49

  • Сучасний МП : 7.48

  • Royalflush : 6.54

  • Ніутранс : 6.65

  • Groq : 6.66


Середні бали систем перекладу

Ця діаграма ілюструє середні бали для кожного двигуна.

На основі діаграми вище, DeepL має найвищий середній бал, демонструючи високу якість перекладу серед одинадцяти машинних перекладачів. Google і Chat GPT також показують хороші результати, за ними слідує Microsoft.

Lingvanex і Modern MT мають середню продуктивність, задовільну якість, але не таку високу, як найкращі. Royalflush, Niutrans і Groq мають найнижчі середні бали, тобто їхні переклади часто потребують більше редагувань.

Читати далі: Мови, які підтримують популярні системи машинного перекладу

Час обробки різних двигунів

Час обробки є ключовим показником ефективності системи перекладу. Швидший час обробки є важливим для перекладу в реальному часі. Ось середній час обробки для кожного двигуна:

  • Google: 0,22 секунди

  • Microsoft: 0,26 секунди

  • Amazon : 0,33 секунди

  • Сучасний МП : 0,36 секунди

  • Лінгванекс : 0,45 секунди

  • DeepL: 0,51 секунди

  • GPT чату : 1,12 секунди

  • Ніутранс : 1,47 секунди

  • Royalflush : 1,83 секунди

Час обробки різних двигунів



Ця діаграма демонструє середній час обробки кожної системи машинного перекладу.


З таблиці вище Google, Microsoft і Amazon є найшвидшими, що робить їх ідеальними для швидкого перекладу. Сучасні MT, Lingvanex і DeepL мають помірну швидкість.


ChatGPT, Niutrans і Royalflush є найповільнішими, що може бути недоліком у чутливих до часу ситуаціях.

Кореляція між часом процесу та оцінкою

Матриця теплової карти


Ця діаграма не показує кореляції між швидкістю перекладу та якістю.

Щоб перевірити, чи існує зв’язок між часом обробки та якість перекладу , ми проаналізували кореляцію між цими двома показниками. На діаграмі вище показано коефіцієнт кореляції приблизно -0,093, що вказує на дуже слабку негативну кореляцію. Це означає, що швидший час перекладу не обов’язково впливає на якість, і ці два показники здебільшого незалежні.

Статті про аналіз зворотного зв’язку

Зворотній зв’язок пропонує цінну інформацію про якість перекладу. Ось найпоширеніші типи відгуків від агрегатора MachineTranslation.com і їх частота:

  1. Переважно ясно: Він потребував лише деяких змін - 76 877 примірників

  2. Майже гладкий: Потрібні додаткові налаштування - 64 001 екземпляр

  3. Досить вишуканий: Легкі зміни можуть бути корисними - 55 030 примірників

  4. Дуже суперечливий: Вимагає суттєвих змін - 32301 примірник

  5. Вимагає ретельного редагування: Він потребує ретельного редагування - 27 697 примірників

Окрім згаданих загальних типів відгуків, ми додатково проаналізували, щоб запропонувати точніше представлення якості перекладу від нашого агрегатора на основі ШІ, як показано на діаграмі нижче.

Статті про аналіз зворотного зв’язку


Наш агрегатор перекладу на основі штучного інтелекту створює «переважно чіткий» результат на основі внутрішнього аналізу відгуків.

На діаграмі вище показано внутрішній аналіз зворотного зв’язку перекладеного вмісту нашим агрегатором на основі ШІ. Найвищі середні бали для «Надзвичайно чітких», «Майже гладких» і «Досить витончених».


«Надзвичайно чітко» має найвищий середній бал, що вказує на мінімальну потребу в редагуванні. «Майже гладкий» і «Досить вишуканий» мають подібний середній бал близько 7,5-8, що свідчить про хорошу якість із незначними потребами в покращенні. 


Між тим, найнижчі бали для «Дуже неузгодженого» та «Потребує ретельного редагування», із середніми балами нижче 5, що вказує на значні проблеми з перекладом.


Читати далі: Найкращі системи машинного перекладу для кожної мовної пари

Висновок

Наше дослідження визначає сильні та слабкі сторони різних механізмів перекладу. Висновки щодо машинних перекладачів у цій статті можуть змінитися, оскільки ми продовжуємо досліджувати та розвивати наш агрегатор на основі ШІ.


Ці висновки можуть допомогти компаніям і окремим особам вибрати найкращу систему перекладу на основі їхніх конкретних потреб, наголошуючи на швидкості, якості чи балансі обох. Якщо ви хочете спробувати механізми машинного перекладу, згадані в цій статті, відвідайте нашу домашню сторінку. Ви також можете записатися на наш безкоштовний план підписки , що дає вам 1500 кредитів щомісяця для більшого доступу.