הקומפלקס של Anthropic Claude‑מכיל 16 סוכנים בינה מלאכותית ויצר באופן עצמאי קומפילר C.

הקומפלקס של Anthropic Claude‑מכיל 16 סוכנים בינה מלאכותית ויצר באופן עצמאי קומפילר C.

8 software

במסגרת ניסוי החברה Anthropic אספה קבוצה של 16 סוכנים עצמאיים של בינה מלאכותית שיצרו יחד מאפס קומפיילר לשפת C בשפת Rust. התוצאה – יישום "נקי" שמסוגל לבנות את ליבת Linux 6.19 ולקומפילציה פרויקטים כמו PostgreSQL, SQLite, Redis, FFmpeg ו-QEMU, אך נותר במידה רבה מאחור ב-GCC מבחינת איכות וביצועים.

איך זה נעשה
שלב מה קרה: 16 מופעים של המודל Claude Opus 4.6 הופעלו בדוקרים Docker נפרדים ללא גישה לאינטרנט. כל אחד מהם מחיק את המאגר המשותף Git וקיבל משימות דרך קובצי lock. תכנון עצמאי: אין מתאם מרכזי – כל סוכן קובע בעצמו איזה חלק "הברור" של העבודה לבצע הלאה. במצב קונפליקט, הקוד מצטרף אוטומטית. פיתוח: הסוכנים נדרשו לכתוב קומפיילר C מאפס. העבודה ארכה 2 שבועות ודחפה כמעט 2000 סשנים של Claude Code. בדיקות: כדי לא "לבלוע" את ההקשר של המודל בשאילתות ארוכות, הבדיקות רצות במצב תקציר (במחרוזת רק כמה שורות פלט). לצורך מהירות נוסף מצב טיפול מהיר ל-1–10 % מהבדיקות.

המוצר הסופי
* נפח – כ-100 000 שורות קוד Rust.
* פונקציונליות – יכול לבנות את ליבת Linux 6.19 ב-x86, ARM ו-RISC‑V; קומפילציה של PostgreSQL, SQLite, Redis, FFmpeg, QEMU; עובר ~99 % מהבדיקות של GCC.
* מגבלות – אינו מייצר קוד מכונה 16‑bit (לריצה של Linux נדרש GCC), אסמבלי ומקשר עובדים עם שגיאות, וביצוע הקוד נמוך יותר ממ-GCC. איכות הקוד המקורי ב-Rust משאירה רצון טוב בהשוואה לעבודה של מפתח מנוסה.

עלות הניסוי
מדד | עלות
---|---
טוקנים Claude API ~\$20 000
עלויות נוספות (למידת מודל, ארגון פרויקט, קבוצות בדיקה) | לא כלולות בסכום המצויין

לקחים ומסקנות
1. גבול האוטונומיה – כאשר הקוד מגיע לכ-100 000 שורות, הסוכנים מפסיקים להבין את הפרויקט במלואו; זה כנראה הגבול העליון עבור AI עצמאית.
2. צורך בתמיכה – ניסיונות להרחיב פונקציונליות לרוב נשברו בחלקים שכבר פועלים של הקוד.
3. חשיבות סביבת הפיתוח – בידוד מהאינטרנט והגדרה נכונה של בדיקות הוכחו כקריטיים להפעלת סוכנים יציבה.

סיכום
הניסוי מראה שמודלי AI מודרניים מסוגלים לייצר מערכות תוכנה מורכבות עם בקרת מינימלית. אולם הם עדיין לא יכולים להחליף במלואם מפתחים מנוסים: איכות הקוד, ביצועים ואמינות נותרות נמוכות מהקומפיילרים המסורתיים, ומגבלת הפרויקט מוגבלת למאות אלפי שורות. זה צעד חשוב קדימה אך עוד רחוק ממפתח תוכנה עצמאית מלאה.

תגובות (0)

שתפו את דעתכם — אנא היו מנומסים והישארו בנושא.

אין תגובות עדיין. השאירו תגובה ושתפו את דעתכם!

כדי להשאיר תגובה, אנא התחברו.

התחברו כדי להגיב