08/07/2024

Benchmarking oversættelsesmotorer: En sammenlignende undersøgelse af ydeevne og kvalitet

Mange oversættelsesmaskiner tilbyder forskellige niveauer af ydeevne og kvalitet. Men hvilken skal du vælge?

MachineTranslation.com undersøgte forskellige top maskinoversættere, der er tilgængelige på vores AI-drevne oversættelsesaggregator. Vi analyserede de førende motorer baseret på nøglemålinger for at finde den bedste balance mellem hastighed og nøjagtighed.

De bedste maskinoversættelsesmaskiner, vi har gennemgået, er DeepL, Google, Chat GPT, Microsoft, Lingvanex, Modern MT, Royalflush, Niutrans og Groq.

Detaljeret sammenligning af de bedste oversættelsesmotorer

Vores AI-drevne maskinoversættelsesaggregator indsamlet omfattende data fra brugeroversættelser og interaktioner. Med disse data analyserede vi to nøglemålinger: gennemsnitlige oversættelsesresultater og behandlingstider.

Gennemsnitlige resultater af oversættelsesmotorer

Den gennemsnitlige score er en nøgleindikator for den oversættelseskvalitet, der produceres af hver motor. Resultaterne kommer fra feedback på oversatte tekster, bedømt på klarhed, sammenhæng og omfanget af nødvendige redigeringer. Resultaterne i denne artikel kan variere og kan ændres baseret på løbende feedback og forskning.


 Her er de gennemsnitlige resultater for de førende oversættelsesmaskiner:

  • DeepL: 8.38

  • Google: 7.90

  • Chat GPT : 7.82

  • Microsoft: 7.77

  • Lingvanex : 7.49

  • Moderne MT : 7.48

  • Royal Flush : 6.54

  • Niutrans : 6.65

  • Groq : 6.66


Gennemsnitlige resultater af oversættelsesmotorer

Dette diagram illustrerer de gennemsnitlige scorer for hver motor.

Baseret på diagrammet ovenfor, DeepL har den højeste gennemsnitlige score, der viser overlegen oversættelseskvalitet blandt de elleve maskinoversættere. Google og Chat GPT klarer sig også godt, tæt fulgt af Microsoft.

Lingvanex og Modern MT er moderate præstationer, der giver tilfredsstillende kvalitet, men ikke så højt som de bedste. Royalflush, Niutrans og Groq har de laveste gennemsnitsscore, hvilket betyder, at deres oversættelser ofte har brug for flere redigeringer.

Læs mere: Sprog understøttet af populære maskinoversættelsesmotorer

Behandlingstid for forskellige motorer

Behandlingstid er en afgørende metrik, der afspejler en oversættelsesmotors effektivitet. Hurtigere behandlingstider er afgørende for realtidsoversættelser. Her er de gennemsnitlige behandlingstider for hver motor:

  • Google: 0,22 sekunder

  • Microsoft: 0,26 sekunder

  • Amazon : 0,33 sekunder

  • Moderne MT : 0,36 sekunder

  • Lingvanex : 0,45 sekunder

  • DeepL: 0,51 sekunder

  • Chat GPT : 1,12 sekunder

  • Niutrans : 1,47 sekunder

  • Royal Flush : 1,83 sekunder

Behandlingstid for forskellige motorer



Dette diagram viser den gennemsnitlige behandlingstid for hver maskinoversættelsesmaskine.


Fra skemaet ovenfor er Google, Microsoft og Amazon de hurtigste, hvilket gør dem ideelle til hurtige oversættelser. Moderne MT, Lingvanex og DeepL har moderate hastigheder.


ChatGPT, Niutrans og Royalflush er de langsomste, hvilket kan være en ulempe i tidsfølsomme situationer.

Korrelation mellem procestid og score

Heatmap Matrix


Dette diagram viser ingen sammenhæng mellem oversættelseshastighed og kvalitet.

For at se om der er en sammenhæng mellem behandlingstid og oversættelseskvalitet , analyserede vi sammenhængen mellem disse to målinger. Diagrammet ovenfor viser en korrelationskoefficient på omkring -0,093, hvilket indikerer en meget svag negativ korrelation. Det betyder, at hurtigere oversættelsestider ikke nødvendigvis påvirker kvaliteten, og de to målinger er for det meste uafhængige.

Indsigt i feedbackanalyse

Feedback giver værdifuld indsigt i oversættelseskvalitet. Her er de mest almindelige feedbacktyper fra MachineTranslation.com's aggregator og deres frekvens:

  1. For det meste klart: Det behøvede kun nogle revisioner - 76.877 tilfælde

  2. Næsten glat: Valgfri tweaks er påkrævet - 64.001 tilfælde

  3. Ganske raffineret: Kan drage fordel af lette redigeringer - 55.030 tilfælde

  4. Meget inkonsekvent: Kræver væsentlige redigeringer - 32.301 tilfælde

  5. Kræver grundig redigering: Det kræver grundig redigering - 27.697 tilfælde

Ud over de nævnte almindelige feedbacktyper analyserede vi yderligere for at tilbyde en mere nøjagtig repræsentation af oversættelseskvaliteten fra vores AI-drevne aggregator, som vist i skemaet nedenfor.

Indsigt i feedbackanalyse


Vores AI-drevne oversættelsesaggregator producerer "for det meste klart" output baseret på dens interne feedbackanalyse.

Diagrammet ovenfor viser vores AI-drevne aggregators interne feedbackanalyse for det oversatte indhold. De højeste gennemsnitlige score er for "Outstandingly Clear", "Nearly Smooth" og "Quite Refined".


"Outstandingly Clear" har den højeste gennemsnitlige score, hvilket indikerer minimalt behov for redigeringer. "Nearly Smooth" og "Quite Refined" har en lignende gennemsnitsscore på omkring 7,5-8, hvilket tyder på god kvalitet med mindre forbedringer nødvendige. 


I mellemtiden er de laveste score for "Meget inkonsistent" og "Kræver grundig redigering", med gennemsnitlige score under 5, hvilket indikerer betydelige oversættelsesproblemer.


Læs mere: Bedste maskinoversættelsesmotorer pr. sprogpar

Konklusion

Vores undersøgelse identificerer styrkerne og svaghederne ved forskellige oversættelsesmaskiner. Resultaterne af maskinoversætterne i denne artikel kan ændre sig, efterhånden som vi fortsætter med at forske i og udvikle vores AI-drevne aggregator.


Disse resultater kan hjælpe virksomheder og enkeltpersoner med at vælge den bedste oversættelsesmaskine baseret på deres specifikke behov, uanset om de lægger vægt på hastighed, kvalitet eller en balance mellem begge. Hvis du vil prøve maskinoversættelsesmotorerne nævnt i denne artikel, så besøg vores hjemmeside. Du kan også tilmelde dig vores gratis abonnement , som giver dig 1500 kreditter månedligt for mere adgang.