אליבאבא הציגה את המתחרה ננו בננה – מחולל תמונות חזק בשם Qwen‑Image‑2.0 מבוסס בינה מלאכותית
אליבאבא משיקה מודל חדש ליצירת תמונות – Qwen‑Image‑2.0
החברה אליבאבא הציגה את הפיתוח האחרון שלה בתחום הבינה המלאכותית – Qwen‑Image‑2.0, שנועד ליצור ולערוך חומרים גרפיים. המודל מציג כמה יתרונות מפתח שמקנים לו תחרותיות בשוק ה-AI.
מה יכול Qwen‑Image‑2.0 לעשות
יכולת | תיאור | דיוק בתעתיק טקסט | התמונות המופקות כוללות טקסט ללא שגיאות ומאפשרות בחירת סגנון כתיבה | תמיכה בבקשות ארוכות | המודל מעבד עד 1000 טוקנים, מה שמפתח אפשרויות להרכבות מורכבות והוראות מפורטות | מגוון פורמטים פלט | ממצלמות מציאותיות ודפי מצגות ועד לגלריות וקומיקסים | אסתטיקה והרכב | יכולת למקם את הטקסט בהרמוניה, לבחור גופן וליישר עצמים בתמונה.
דוגמה: בעת יצירת תמונת לוח מבריק המודל משקף נכונה את האובייקטים הסביבתיים ומשלב כתובים ללא אובדן איכות.
איך נוצר המודל
Qwen‑Image‑2.0 משלבת שני תחומי מחקר באליבאבא:
1. יצירת תמונות – דיוק מרבי ופרטיות, כולל תצוגה נכונה של טקסט.
2. עריכת תמונות – שמירה על התוכן המקורי ללא 왜곡, פונקציונליות ואחידות.
שילוב גישות אלה הוביל ליצירת מודל אוניברסלי עם ארכיטקטורה מפושטת: גודל קטן יותר אך יצירת תמונה מהירה יותר.
יתרונות מול המתחרים
- דיוק – יורש כישורי עריכת תמונות מגרסאות קודמות.
- גמישות בקבלת בקשות – עד 1000 טוקנים מאפשרות הגדרת סצנות מורכבות והרכב.
- אסתטיקה – ממקם את הטקסט באופן אוטומטי ובוחר גופן בהתאם להקשר התמונה.
- הרכב – יישור אלמנטים מאפשר יצירת קומיקסים ומודעות קולנועיות אינפורמטיביות.
בדיקות ב-AI Arena
אליבאבא ערכה השוואה עיוורת בין Qwen‑Image‑2.0 למודלים מובילים:
משימה | מתחרים מובילים | יצירת תמונות | Google Gemini‑3‑Pro‑Image‑Preview, OpenAI GPT Image 1.5 | עריכת תמונות | רק המודל הפלאגמן Gemini של גוגל עולה על Qwen‑Image‑2.0
לכן ברוב הסצנריונים Qwen‑Image‑2.0 מציג ביצועים מובילים בין מודלים סיניים ובינלאומיים.
סיכום:
אליבאבא הציגה מודל יצירת תמונות חזק, גמיש ואסתטית מאוזן, המסוגל לענות על צרכי מקצוענים בעיצוב וגם משתמשים המחפשים פתרונות מהירים ליצירת תוכן ויזואלי.
תגובות (0)
שתפו את דעתכם — אנא היו מנומסים והישארו בנושא.
התחברו כדי להגיב