08/07/2024

Benchmarking van vertaalmachines: Een vergelijkende studie van prestaties en kwaliteit

Veel vertaalmachines bieden verschillende prestatie- en kwaliteitsniveaus. Maar welke moet je kiezen?

MachineTranslation.com heeft verschillende topmachinevertalers bestudeerd die beschikbaar zijn op onze AI-aangedreven vertaalaggregator. We hebben de toonaangevende motoren geanalyseerd op basis van belangrijke statistieken om de beste balans tussen snelheid en nauwkeurigheid te vinden.

De beste machinevertaalmachines die we hebben beoordeeld zijn DeepL, Google, Chat GPT, Microsoft, Lingvanex, Modern MT, Royalflush, Niutrans en Groq.

Gedetailleerde vergelijking van de beste vertaalmachines

Onze AI-aangedreven aggregator voor automatische vertalingen uitgebreide gegevens verzameld uit gebruikersvertalingen en interacties. Met deze gegevens hebben we twee belangrijke statistieken geanalyseerd: gemiddelde vertaalscores en verwerkingstijden.

Gemiddelde scores van vertaalmachines

De gemiddelde score is een belangrijke indicator voor de vertaalkwaliteit die door elke engine wordt geproduceerd. Scores zijn afkomstig van feedback op vertaalde teksten, beoordeeld op duidelijkheid, samenhang en de omvang van de vereiste bewerkingen. De resultaten in dit artikel kunnen variëren en zijn onderhevig aan verandering op basis van voortdurende feedback en onderzoek.

Hier zijn de gemiddelde scores voor de toonaangevende vertaalmachines:

  • DeepL: 8.38

  • Google: 7.90

  • Chat-GPT : 7.82

  • Microsoft: 7.77

  • Lingvanex : 7.49

  • Moderne MT : 7.48

  • Koninklijke flush : 6.54

  • Niutrans : 6.65

  • Groq : 6.66


Gemiddelde scores van vertaalmachines

Dit diagram illustreert de gemiddelde scores voor elke motor.

Op basis van het bovenstaande diagram, DiepL heeft de hoogste gemiddelde score en toont superieure vertaalkwaliteit onder de elf machinevertalers. Google en Chat GPT presteren ook goed, op de voet gevolgd door Microsoft.

Lingvanex en Modern MT presteren middelmatig en bieden een bevredigende kwaliteit, maar niet zo hoog als de toppresteerders. Royalflush, Niutrans en Groq hebben de laagste gemiddelde scores, wat betekent dat hun vertalingen vaak meer bewerkingen nodig hebben.

Lees meer: Talen ondersteund door populaire automatische vertaalmachines

Verwerkingstijd van verschillende motoren

Verwerkingstijd is een cruciale maatstaf die de efficiëntie van een vertaalmachine weerspiegelt. Snellere verwerkingstijden zijn essentieel voor realtime vertalingen. Hier zijn de gemiddelde verwerkingstijden voor elke engine:

  • Google: 0,22 seconden

  • Microsoft: 0,26 seconden

  • Amazone : 0,33 seconden

  • Moderne MT : 0,36 seconden

  • Lingvanex : 0,45 seconden

  • DeepL: 0,51 seconden

  • Chat-GPT : 1,12 seconden

  • Niutrans : 1,47 seconden

  • Koninklijke flush : 1,83 seconden

Verwerkingstijd van verschillende motoren



Dit diagram toont de gemiddelde verwerkingstijd van elke machinevertaalmachine.


Uit de bovenstaande grafiek blijkt dat Google, Microsoft en Amazon het snelst zijn, waardoor ze ideaal zijn voor snelle vertalingen. Moderne MT, Lingvanex en DeepL hebben gematigde snelheden.


ChatGPT, Niutrans en Royalflush zijn de langzaamste, wat een nadeel kan zijn in tijdgevoelige situaties.

Correlatie tussen procestijd en score

Warmtekaartmatrix


Dit diagram laat geen verband zien tussen vertaalsnelheid en kwaliteit.

Om te zien of er een relatie is tussen verwerkingstijd en vertaling kwaliteit analyseerden we de correlatie tussen deze twee statistieken. De grafiek hierboven toont een correlatiecoëfficiënt van ongeveer -0,093, wat wijst op een zeer zwakke negatieve correlatie. Dit betekent dat snellere vertaaltijden niet noodzakelijkerwijs invloed hebben op de kwaliteit, en dat de twee statistieken grotendeels onafhankelijk zijn.

Inzichten in feedbackanalyse

Feedback biedt waardevolle inzichten in de vertaalkwaliteit. Hier zijn de meest voorkomende feedbacktypen uit de aggregator van MachineTranslation.com en hun frequentie:

  1. Meestal helder: Er waren slechts enkele herzieningen nodig - 76.877 exemplaren

  2. Bijna glad: Optionele aanpassingen zijn vereist - 64.001 exemplaren

  3. Vrij verfijnd: Kan baat hebben bij lichte bewerkingen - 55.030 exemplaren

  4. Zeer inconsistent: Substantiële bewerkingen vereisen - 32.301 exemplaren

  5. Vereist een grondige bewerking: Het vereist een grondige redactie - 27.697 exemplaren

Naast de genoemde veelvoorkomende typen feedback hebben we verder geanalyseerd om een nauwkeuriger beeld te geven van de vertaalkwaliteit van onze AI-aangedreven aggregator, zoals weergegeven in het onderstaande diagram.

Inzichten in feedbackanalyse


Onze AI-aangedreven vertaalaggregator produceert "grotendeels duidelijke" output op basis van de interne feedbackanalyse.

Het diagram hierboven toont de interne feedbackanalyse van onze AI-aangedreven aggregator voor de vertaalde inhoud. De hoogste gemiddelde scores zijn voor "Uitstekend helder", "Bijna glad" en "Heel verfijnd".


'Uitstekend duidelijk' heeft de hoogste gemiddelde score, wat aangeeft dat er minimale bewerkingen nodig zijn. "Bijna Glad" en "Heel Verfijnd" hebben een vergelijkbare gemiddelde score van ongeveer 7,5-8, wat een goede kwaliteit suggereert met kleine verbeteringen die nodig zijn. 


Ondertussen zijn de laagste scores voor "Zeer inconsistent" en "Vereist grondige bewerking", met gemiddelde scores onder de 5, wat wijst op aanzienlijke vertaalproblemen.

Lees meer: Beste automatische vertaalmachines per talenpaar

Conclusie

Ons onderzoek identificeert de sterke en zwakke punten van verschillende vertaalmachines. De bevindingen over de machinevertalers in dit artikel kunnen veranderen naarmate we doorgaan met het onderzoeken en ontwikkelen van onze AI-aangedreven aggregator.


Deze bevindingen kunnen bedrijven en particulieren helpen bij het kiezen van de beste vertaalmachine op basis van hun specifieke behoeften, of het nu gaat om snelheid, kwaliteit of een balans tussen beide. Als u de in dit artikel genoemde machinevertaalmachines wilt uitproberen, bezoek dan onze startpagina. U kunt zich ook aanmelden voor onze gratis abonnement , waarmee u maandelijks 1500 credits krijgt voor meer toegang.