08/07/2024

Benchmarking מנועי תרגום: מחקר השוואתי של ביצועים ואיכות

מנועי תרגום רבים מציעים רמות משתנות של ביצועים ואיכות. אבל באיזה מהם כדאי לבחור?

MachineTranslation.com חקר מתרגמי מכונות מובילים שונים הזמינים בצבר התרגום המופעל על ידי בינה מלאכותית שלנו. ניתחנו את המנועים המובילים על סמך מדדי מפתח כדי למצוא את האיזון הטוב ביותר בין מהירות ודיוק.

מנועי תרגום המכונות המובילים שסקרנו הם DeepL, Google, Chat GPT, Microsoft, Lingvanex, Modern MT, Royalflush, Niutrans ו-Groq.

השוואה מפורטת של מנועי תרגום מובילים

מופעל בינה מלאכותית שלנו אגרגטור תרגום מכונה אסף נתונים נרחבים מתרגומי משתמשים ואינטראקציות. בעזרת הנתונים האלה, ניתחנו שני מדדי מפתח: ציוני תרגום ממוצעים וזמני עיבוד.

ציונים ממוצעים של מנועי תרגום

הציון הממוצע הוא אינדיקטור מרכזי לאיכות התרגום שמפיק כל מנוע. הציונים מגיעים ממשוב על טקסטים מתורגמים, מדורגים לפי בהירות, קוהרנטיות והיקף העריכות הנדרשות. התוצאות המוצגות במאמר זה עשויות להשתנות והן עשויות להשתנות בהתבסס על משוב ומחקר מתמשכים.

 להלן הציונים הממוצעים של מנועי התרגום המובילים:

  • DeepL : 8.38

  • גוגל : 7.90

  • צ'אט GPT : 7.82

  • מיקרוסופט : 7.77

  • Lingvanex : 7.49

  • MT מודרני : 7.48

  • Royalflush : 6.54

  • ניוטרנס : 6.65

  • גרוק : 6.66

ציונים ממוצעים של מנועי תרגום

תרשים זה ממחיש את הציונים הממוצעים עבור כל מנוע.

בהתבסס על התרשים למעלה, DeepL בעל הציון הממוצע הגבוה ביותר, מראה איכות תרגום מעולה מבין אחד עשר מתרגמי המכונה. גם גוגל ו-Chat GPT מתפקדים היטב, ואחריהם מקרוב מיקרוסופט.

Lingvanex ו-Modern MT הם ביצועים מתונים, מספקים איכות משביעת רצון אך לא גבוהה כמו הביצועים המובילים. ל-Royalflush, Niutrans ו-Groq יש את הציונים הממוצעים הנמוכים ביותר, כלומר התרגומים שלהם זקוקים לרוב לעריכות נוספות.

קרא עוד: שפות הנתמכות על ידי מנועי תרגום מכונה פופולריים

זמן עיבוד של מנועים שונים

זמן עיבוד הוא מדד מכריע המשקף את היעילות של מנוע תרגום. זמני עיבוד מהירים יותר חיוניים לתרגומים בזמן אמת. להלן זמני העיבוד הממוצעים עבור כל מנוע:

  • גוגל : 0.22 שניות

  • מיקרוסופט : 0.26 שניות

  • אמזון : 0.33 שניות

  • MT מודרני : 0.36 שניות

  • Lingvanex : 0.45 שניות

  • DeepL : 0.51 שניות

  • צ'אט GPT : 1.12 שניות

  • ניוטרנס : 1.47 שניות

  • Royalflush : 1.83 שניות


זמן עיבוד של מנועים שונים



תרשים זה מציג את זמן העיבוד הממוצע של כל מנוע תרגום מכונה.


מהתרשים שלמעלה, גוגל, מיקרוסופט ואמזון הן המהירות ביותר, מה שהופך אותן לאידיאליות לתרגום מהיר. ל-MT, Lingvanex ו-DeepL המודרניים יש מהירויות מתונות.


ChatGPT, Niutrans ו-Royalflush הם האיטיים ביותר, מה שיכול להיות חיסרון במצבים רגישים לזמן.

מתאם בין זמן תהליך לציון

מטריצת מפת חום


תרשים זה אינו מציג מתאם בין מהירות תרגום ואיכות.

כדי לראות אם יש קשר בין זמן עיבוד לבין איכות התרגום , ניתחנו את המתאם בין שני המדדים הללו. התרשים שלמעלה מציג מקדם מתאם של כ-0.093, המצביע על מתאם שלילי חלש מאוד. המשמעות היא שזמני תרגום מהירים יותר לא בהכרח משפיעים על האיכות, ושני המדדים הם לרוב בלתי תלויים.

תובנות לגבי ניתוח משוב

משוב מציע תובנות חשובות לגבי איכות התרגום. להלן סוגי המשוב הנפוצים ביותר מהאגרגטור של MachineTranslation.com ותדירותם:

  1. ברור ברובו: זה היה צריך רק כמה תיקונים - 76,877 מקרים

  2. כמעט חלק: נדרשות שינויים אופציונליים - 64,001 מקרים

  3. די מעודן: עשוי להפיק תועלת מעריכות קלות - 55,030 מקרים

  4. מאוד לא עקבי: דורש עריכות משמעותיות - 32,301 מקרים

  5. דורש עריכה יסודית: זה דורש עריכה יסודית - 27,697 מקרים

בנוסף לסוגי המשוב הנפוצים שהוזכרו, ניתחנו עוד יותר כדי להציע ייצוג מדויק יותר של איכות התרגום מהאגרגטור המופעל על ידי AI שלנו, כפי שמוצג בתרשים למטה.

תובנות לגבי ניתוח משוב


אגרגטור התרגום המופעל על ידי AI שלנו מייצר פלט "ברור" על סמך ניתוח המשוב הפנימי שלו.

התרשים שלמעלה מציג את ניתוח המשוב הפנימי של צובר ה-AI שלנו עבור התוכן המתורגם. הציונים הממוצעים הגבוהים ביותר הם עבור "ברור יוצא מן הכלל", "כמעט חלק" ו"די מעודן".


ל"ברור יוצא מן הכלל" יש את הציון הממוצע הגבוה ביותר, המצביע על צורך מינימלי בעריכות. ל-"Nearly Smooth" ו-"Quite Refined" יש ציון ממוצע דומה של בסביבות 7.5-8, מה שמצביע על איכות טובה עם שיפורים קלים נדרשים. 


בינתיים, הציונים הנמוכים ביותר הם עבור "מאוד לא עקבי" ו"דורש עריכה יסודית", עם ציונים ממוצעים מתחת ל-5, מה שמצביע על בעיות תרגום משמעותיות.


קרא עוד: מנועי תרגום המכונה הטובים ביותר לכל צמד שפות

סיכום

המחקר שלנו מזהה את החוזקות והחולשות של מנועי תרגום שונים. הממצאים על מתרגמי המכונות במאמר זה עשויים להשתנות ככל שאנו ממשיכים לחקור ולפתח את האגרגטור המופעל בינה מלאכותית שלנו.


ממצאים אלו יכולים לעזור לעסקים ולאנשים פרטיים לבחור את מנוע התרגום הטוב ביותר בהתבסס על הצרכים הספציפיים שלהם, בין אם הם מדגישים מהירות, איכות או איזון בין שניהם. אם אתה רוצה לנסות את מנועי תרגום המכונה המוזכרים במאמר זה, בקר בדף הבית שלנו. אתה יכול גם להירשם אלינו תוכנית מנוי בחינם , המעניק לך 1500 קרדיטים חודשיים לגישה נוספת.