אליבאבא משיקה מודלים קומפקטיים של Qwen 3.5, הפועלים ישירות במחשבים ניידים ומעלים את המתחרים של OpenAI.
אליבאבא קווין 3.5 — סדרה חדשה של מודלים קומפקטיים בינה מלאכותית
במסגרת מחלקת הבינה המלאכותית שלה, אליבאבא הודיעה על השקת שורת המודלים Qwen 3.5, שמבטיחה «גודל קטן + יעילות גבוהה». בהשוואה למודלים אמריקאים, הם מציגים דיוק טוב יותר עם נפח זיכרון נמוך יותר.
| מודל | גודל | מאפיינים עיקריים |
|---|---|---|
| Qwen 3.5‑0.8B | 0.8 מיליארד פרמטרים | «קמצוץ» ומהיר, מיועד לפרוטוטיפים ולמכשירים ניידים עם עצמאות מוגבלת |
| Qwen 3.5‑2B | 2 מיליארד | דומה ל‑0.8B אך מעט חזק יותר |
| Qwen 3.5‑4B | 4 מיליארד | מולטימודלי, חלון הקשר 262 144 טוקנים; מתאים לפתרונות סוכנות קלים |
| Qwen 3.5‑9B | 9 מיליארד | מסוגל להרהר, חורגת מ‑OpenAI gpt‑oss‑120B (13.5× יותר פרמטרים) ומציגה רמת מתאבן בלוגיקה |
כל המודלים זמינים ברישיון Apache 2.0, מה שמאפשר שימוש מסחרי והמשך אימון לפי הצורך.
מה חדש בארכיטקטורה?
אליבאבא התירה מ‑Transformer הקלאסי ויישמה תכנית היברידית:
* Gated Delta Networks (GDN) – מציעות קצב העברה גבוה ועיכוב נמוך.
* Mixture‑of‑Experts (MoE) – פותרות את בעיית הזיכרון המוגבל של מודלים קטנים.
בגלל זאת, Qwen 3.5 יכול לעבוד עם טוקנים מולטימודלים מידית, ולא “להצמיד” מחוללי תמונות למודלים טקסטואליים כפי שעשו הדורות הקודמים. כתוצאה מכך, הגרסאות 4B ו‑9B מזהות רכיבי UI ומחשבות עצמים בווידאו.
בדיקות ותוצאות
| מדד | Qwen 3.5‑9B |
|-----|------------|
| MMMU‑Pro (ויזואלי) | 70.1 % – חורגת מ‑Google Gemini 2.5 Flash‑Lite (59.7) ו‑Qwen 3‑VL‑30B‑A3B (63.0) |
| חשיבה לוגית | 81.7 % – יותר מ‑OpenAI gpt‑oss‑120B (80.1), למרות שהאחרון מכיל פי 10 פרמטרים |
| HMMT Feb 2025 (מתמטיקה) | 83.2 % (9B), 74.0 % (4B) – מוכיחה שאינן נדרשים משאבים ענקיים לעניינים מדעיים מורכבים |
| OmniDocBench v1.58 | 87.7 % – מובילה בין כל המודלים |
| MMMLU (רב‑שפה) | 81.2 % – חורגת מ‑gpt‑oss‑120B (78.2) |
למה זה חשוב?
הופעת Qwen 3.5 התואמת את הצמיחה בביקוש לסוכני בינה מלאכותית עצמאיים. המשתמש המודרני דורש לא רק צ'אטבוטים, אלא מערכות ש:
1. חושבות – מרחישות על בעיות.
2. רותחים – מעבדות תמונות, וידאו ורכיבי UI.
3. פועלות – משתמשות בכלים (מלאת טפסים, סיווג קבצים).
מאחר שמודלים גדולים (שלושה‑חמשה מיליארד פרמטרים) יקרים בתפעול, Qwen 3.5 מציעה פתרון חסכוני יותר. ניתן להפעיל את המודלים מקומית ללא חיבור לענן ו-API, והאימון בעזרת משוב מאפשר להם לקבל “החלטות אנושיות” – לדוגמה, לארגן שולחן עבודה או לכתוב קוד לפי תיעוד וידאו.
יישומים מעשיים
* מכשירים ניידים – 0.8 מיליארד פרמטרים מתאימים לסמסון ומאפשרים פעולה עצמאית.
* תחנות עבודה – 9 מיליארד פרמטרים מספקות את כל הפונקציות של סוכן בינה מלאכותית ללא ענן.
* משרד ממשקים – בזכות “הצמדת רמת פיקסל” המודלים יכולים לנווט UI, למלא טפסים ולסווג קבצים, לבצע משימות פשוטות בשפה טבעית בדיוק כ-90 %.
כך, אליבאבא Qwen 3.5 פותחת את הדרך לסוכני בינה מלאכותית נגישים, גמישים וחזקים יותר, שיכולים לפעול בענן או מקומית, ולהתאים לדרישות המשתמש המודרני המתפתחות.
תגובות (0)
שתפו את דעתכם — אנא היו מנומסים והישארו בנושא.
התחברו כדי להגיב