גוגל השיקה את Gemini 3 Deep Think – שירות בינה מלאכותית מתקדם למשימות מדעיות, המשך "לכוונן" תשובות לפי בקשות.
גוגל הציגה גרסה מעודכנת של Gemini 3 Deep Think
החברה גוגל הכריזה על עדכון גדול חדש לפלטפורמה שלה Gemini 3 Deep Think – בינה מלאכותית המסוגלת להרהר ולפתור בעיות מדע-טכניות מורכבות.
מה השתנה
פרמטר | חדש | איך זה נראה | מטרה
---|---|---|---
מעבר מתיאוריה נקייה ליישום מעשי | פתרון בעיות ללא הגבלות ברורות, עם נתונים חלקיים | נגיש בתוך אפליקציית Gemini | מנויי Google AI Ultra יכולים להשתמש, ובאמצעות API – מהנדסים וחברות (נדרש בקשה)
שותפים לפיתוח | מדענים-חוקרים | עבודה משותפת על בעיות מורכבות
מדדי ביצועים
בדיקה | תוצאה | הערה
---|---|---
Humanity’s Last Exam | 48,4 % | ללא כלים צד שלישי
ARC‑AGI‑284,6 % | מדד לבוטי AI
Codeforces (Elo) | 3455 | דירוג גבוה בין פתרונות תוכנה
IMO 2025 | Meda זהובה | שוויון רמת משתתפי אולימפיאדה בינלאומית
כימיה/פיזיקה | תוצאה דומה | הוכחה של יוניברסליות בתחומים שונים
CMT‑Benchmark (פיזיקה תאורטית) | 50,5 % | ידיעה טובה של מושגים מורכבים
סוכן AI "Aletheia"
במעבדת DeepMind של גוגל נוצר סוכן Aletheia מבוסס על Gemini 3 Deep Think. תכונות עיקריות:
1. בדיקת השערות – הסוכן מזהה חולשות בפתרונות מוצעים ומתקן אותן בצורה איטרטיבית.
2. הכרה בחוסר ביטחון – יכול להודיע שהוא אינו יודע את התשובה.
3. אינטראקציה עם מקורות חיצוניים – משתמש בשירות החיפוש של גוגל ובניווט רשת, אך נמנע ממציאת קישורים מדומיינים.
רמות השגת יעד
גוגל חילקה את ההצלחות של Aletheia לחמש מדרגות:
- מדרגה 0 – "חדשנות מועטה" | מצב אוטונומי מלא, שלוש בעיות של P. Erdős נפתרו (שלב ראשון) | שלוש בעיות Erdős
- מדרגה 1 – "חדשנות מינימלית" | תוצאה נוספת במצב אוטונומי | משימה רבעית
- מדרגה 2 – "מתאימות לפרסום" | תוצאות הן באוטונומיה וגם בשיתוף עם אדם, וכן כלים עזריים | בעיות נתונים 3–4 – "פריצת דרך משמעותית/מפורסמת" | עדיין לא מושג—
איך Aletheia מתמודדת עם בעיות Erdős
* מתוך 700 בעיות שלא נפתרו עד כה, הסוכן פתר 13.
* אך רק 4 מהן באמת חדשות – האחרות ידועות בקהילה המדעית.
* מבין 212 הפתרונות המוצגים, רק 6,5 % היו נכונים תוכניתית; 68,5 % כללו שגיאות יסודיות, ו-31,5 % פרשנו את הבעיה לא נכון.
המפתחים מציינים כי AI נוטה "להפרש מחדש את השאלה כדי לענות בצורה פשוטה יותר", והוא "נפוץ מאוד לטעויות בהשוואה לבני אדם". בסופו של דבר עדיין אין אפשרות להחליף מתמטיקאים בבינה מלאכותית.
סיכום: Gemini 3 Deep Think וסוכן Aletheia מציגים תוצאות מרשימות בתחומים מדעיים שונים, אך שומרים על מגבלות משמעותיות במדויק ובאמינות הפתרונות. גוגל ממשיכה לעבוד לשיפור יכולת הבינה המלאכותית להרהר עמוק ולבדוק את מסקנותיה עצמה.
תגובות (0)
שתפו את דעתכם — אנא היו מנומסים והישארו בנושא.
התחברו כדי להגיב