08/07/2024

Mga Benchmarking Translation Engine: Isang Paghahambing na Pag-aaral ng Pagganap at Kalidad

Maraming mga makina ng pagsasalin ang nag-aalok ng iba't ibang antas ng pagganap at kalidad. Ngunit alin ang dapat mong piliin?

Pinag-aralan ng MachineTranslation.com ang iba't ibang nangungunang tagasalin ng makina na available sa aming pinagsama-samang pagsasalin na pinapagana ng AI. Sinuri namin ang mga nangungunang engine batay sa mga pangunahing sukatan upang mahanap ang pinakamahusay na balanse ng bilis at katumpakan.

Ang nangungunang machine translation engine na sinuri namin ay ang DeepL, Google, Chat GPT, Microsoft, Lingvanex, Modern MT, Royalflush, Niutrans, at Groq.

Detalyadong Paghahambing ng Mga Nangungunang Translation Engine

Ang aming pinapagana ng AI machine translation aggregator nakolekta ang malawak na data mula sa mga pagsasalin at pakikipag-ugnayan ng user. Gamit ang data na ito, sinuri namin ang dalawang pangunahing sukatan: average na mga marka ng pagsasalin at mga oras ng pagproseso.

Average na Marka ng Mga Translation Engine

Ang average na marka ay isang pangunahing tagapagpahiwatig ng kalidad ng pagsasalin na ginawa ng bawat makina. Ang mga marka ay nagmumula sa feedback sa mga isinaling teksto, na-rate sa kalinawan, pagkakaugnay-ugnay, at ang lawak ng mga kinakailangang pag-edit. Ang mga resulta na ipinakita sa artikulong ito ay maaaring mag-iba at maaaring magbago batay sa patuloy na feedback at pananaliksik.

Narito ang mga average na marka para sa nangungunang mga makina ng pagsasalin:

  • DeepL: 8.38

  • Google: 7.90

  • Chat GPT : 7.82

  • Microsoft: 7.77

  • Lingvanex : 7.49

  • Modern MT : 7.48

  • Royalflush : 6.54

  • Niutrans : 6.65

  • Groq : 6.66

Average na Marka ng Mga Translation Engine

Inilalarawan ng chart na ito ang average na mga marka para sa bawat makina.

Batay sa tsart sa itaas, DeepL ay may pinakamataas na average na marka, na nagpapakita ng napakahusay na kalidad ng pagsasalin sa labing-isang machine translator. Mahusay din ang performance ng Google at Chat GPT, na sinusundan ng malapit ng Microsoft.

Ang Lingvanex at Modern MT ay mga moderate performer, na nagbibigay ng kasiya-siyang kalidad ngunit hindi kasing taas ng mga nangungunang performer. Ang Royalflush, Niutrans, at Groq ay may pinakamababang average na mga marka, ibig sabihin, ang kanilang mga pagsasalin ay madalas na nangangailangan ng higit pang mga pag-edit.

Magbasa pa: Mga Wikang Sinusuportahan ng Mga Sikat na Machine Translation Engine

Oras ng Pagproseso ng Iba't ibang Engine

Ang oras ng pagproseso ay isang mahalagang sukatan na sumasalamin sa kahusayan ng isang translation engine. Ang mas mabilis na mga oras ng pagproseso ay mahalaga para sa mga real-time na pagsasalin. Narito ang average na oras ng pagproseso para sa bawat makina:

  • Google: 0.22 segundo

  • Microsoft: 0.26 segundo

  • Amazon : 0.33 segundo

  • Modern MT : 0.36 segundo

  • Lingvanex : 0.45 segundo

  • DeepL: 0.51 segundo

  • Chat GPT : 1.12 segundo

  • Niutrans : 1.47 segundo

  • Royalflush : 1.83 segundo

Oras ng Pagproseso ng Iba't ibang Engine



Ipinapakita ng chart na ito ang average na oras ng pagproseso ng bawat machine translation engine.


Mula sa tsart sa itaas, ang Google, Microsoft, at Amazon ang pinakamabilis, na ginagawang perpekto ang mga ito para sa mabilis na pagsasalin. Ang modernong MT, Lingvanex, at DeepL ay may katamtamang bilis.


Ang ChatGPT, Niutrans, at Royalflush ay ang pinakamabagal, na maaaring maging isang disbentaha sa mga sitwasyong sensitibo sa oras.

Kaugnayan sa Pagitan ng Oras ng Proseso at Iskor

Matrix ng Heatmap


Ang tsart na ito ay nagpapakita ng walang ugnayan sa pagitan ng bilis at kalidad ng pagsasalin.

Upang makita kung may kaugnayan sa pagitan ng oras ng pagproseso at kalidad ng pagsasalin , sinuri namin ang ugnayan sa pagitan ng dalawang sukatan na ito. Ang tsart sa itaas ay nagpapakita ng koepisyent ng ugnayan na humigit-kumulang -0.093, na nagpapahiwatig ng napakahina na negatibong ugnayan. Nangangahulugan ito na ang mas mabilis na mga oras ng pagsasalin ay hindi kinakailangang makakaapekto sa kalidad, at ang dalawang sukatan ay halos independyente.

Mga Insight sa Feedback Analysis

Nag-aalok ang feedback ng mahahalagang insight sa kalidad ng pagsasalin. Narito ang mga pinakakaraniwang uri ng feedback mula sa aggregator ng MachineTranslation.com at ang dalas ng mga ito:

  1. Kadalasang Malinaw: Ito ay nangangailangan lamang ng ilang mga pagbabago - 76,877 na pagkakataon

  2. Halos makinis: Kinakailangan ang mga opsyonal na pag-aayos - 64,001 na pagkakataon

  3. Medyo Pino: Maaaring makinabang mula sa mga magaan na pag-edit - 55,030 na pagkakataon

  4. Lubos na hindi pare-pareho: Nangangailangan ng malaking pag-edit - 32,301 na pagkakataon

  5. Nangangailangan ng Masusing Pag-edit: Nangangailangan ito ng masusing pag-edit - 27,697 na pagkakataon

Bilang karagdagan sa mga karaniwang uri ng feedback na binanggit, sinuri pa namin upang mag-alok ng mas tumpak na representasyon ng kalidad ng pagsasalin mula sa aming aggregator na pinapagana ng AI, tulad ng ipinapakita sa chart sa ibaba.

Mga Insight sa Feedback Analysis


Ang aming pinagagana ng AI na translation aggregator ay gumagawa ng "halos malinaw" na output batay sa panloob na pagsusuri ng feedback nito.

Ipinapakita ng chart sa itaas ang panloob na pagsusuri ng feedback ng aming pinagagana ng AI para sa isinaling nilalaman. Ang pinakamataas na average na mga marka ay para sa "Outstandingly Clear", "Nearly Smooth", at "Quite Refined".


Ang "Outstandingly Clear" ay may pinakamataas na average na marka, na nagpapahiwatig ng kaunting pangangailangan para sa mga pag-edit. Ang "Nearly Smooth" at "Medyo Pino" ay may magkatulad na average na marka na humigit-kumulang 7.5-8, na nagmumungkahi ng magandang kalidad na may maliit na pagpapahusay na kailangan. 


Samantala, ang pinakamababang marka ay para sa "Lubos na Pabagu-bago" at "Nangangailangan ng Masusing Pag-edit", na may average na mga marka na mas mababa sa 5, na nagpapahiwatig ng mga makabuluhang isyu sa pagsasalin.

Magbasa pa: Pinakamahusay na Machine Translation Engine sa Bawat Language Pair

Konklusyon

Tinutukoy ng aming pag-aaral ang mga kalakasan at kahinaan ng iba't ibang makina ng pagsasalin. Maaaring magbago ang mga natuklasan sa mga machine translator sa artikulong ito habang patuloy kaming nagsasaliksik at nagde-develop ng aming AI-powered aggregator.


Makakatulong ang mga natuklasang ito sa mga negosyo at indibidwal na piliin ang pinakamahusay na makina ng pagsasalin batay sa kanilang mga partikular na pangangailangan, kung binibigyang-diin ang bilis, kalidad, o balanse ng pareho. Kung gusto mong subukan ang machine translation engine na binanggit sa artikulong ito, bisitahin ang aming homepage. Maaari ka ring mag-sign up para sa aming libreng subscription plan , na nagbibigay sa iyo ng 1500 credits buwan-buwan para sa higit pang access.