הבינה המלאכותית הראתה יעילות נמוכה בהימורים ספורטיביים, ואבד את כל הכסף במשחקי הליגה העליונה האנגלית.

הבינה המלאכותית הראתה יעילות נמוכה בהימורים ספורטיביים, ואבד את כל הכסף במשחקי הליגה העליונה האנגלית.

3 hardware

קצר על תוצאות הניסוי

הסטארט‑אפ *General Reasoning* ערך מבחן בשם KellyBench, שבו נבדקו שמונה מערכות בינה מלאכותית מובילות (Google Gemini 3.1 Pro, OpenAI ChatGPT‑4, Anthropic Claude Opus 4.6, xAI Grok 4.20 ועוד) על יכולת להימשך במהלך עונת הליגה הפרמייר האנגלית 2023–2024.

לכל סוכן סופקה תיאור סטטיסטי מלא של כל הקבוצות והמשחקים העבריים, אך גישה לאינטרנט אסורה – המודלים יכלו להשתמש רק בנתונים שקיבלו מראש.

איך התבצע המבחן

1. שלוש ניסיונות: כל מערכת יכלה לבצע שלוש סדרות משיכות במהלך העונה.
2. משיכות: על תוצאות משחקים (הזדמנות/תיקו/כישלון) ומספר שערים.
3. מטרה: למקסם רווח, תוך ניהול סיכונים.

מי ניצח ואי מי הפסיד

מערכת בינה מלאכותית | תוצאה ממוצעת | הערה
Anthropic Claude Opus 4.6 | 11 % (כמעט שיווי משקל בניסיון אחד) | המשתתף "הצדיק ביותר", אבל עדיין הפסיד כסף
Google Gemini 3.1 Pro | +34 % בתשובה הראשונה, אז נכשל | רווח ראשון, אחר כך הפסד
xAI Grok 4.20 | נכשל מיד, לא סיים את שני הניסיונות הבאים | החלשה ביותר

בסופו של דבר כל מודל הפסיד כסף בעונה, וחלק מהם "נכשלו" לגמרי. זה מאשר את המסקנות של החוקרים: גם מערכות בינה מלאכותית מתקדמות מתקשות בתחזיות ארוכות טווח בעולם האמיתי.

מה זה אומר לעתיד הבינה המלאכותית

- החששות לגבי החלפת האדם עדיין נראים מוגזמים.
- מדדים נוכחיים משתמשים בתנאים "סטטיים" שלא משקפים את הבלבול והמורכבות של החיים האמיתיים.
- למרות שהבינה המלאכותית כבר מצליחה בכתיבת קוד, ברוב התחומים האחרים היא מוגבלת.

לכן, ניסוי KellyBench מראה כי הבינה המלאכותית עדיין אינה מוכנה להתחרות עם האדם במשימות דינמיות ובלתי צפויות, כמו תחזיות ספורט.

תגובות (0)

שתפו את דעתכם — אנא היו מנומסים והישארו בנושא.

אין תגובות עדיין. השאירו תגובה ושתפו את דעתכם!

כדי להשאיר תגובה, אנא התחברו.

התחברו כדי להגיב