ניווט נגישות
LiveScience תפריט כתבה

Acing this new AI exam — which its creators say is the toughest in the world — might point to the first signs of AGI‎

LiveScience
23:11

Humanity’s Last Exam is a PhD-level benchmark designed to test the limits of AI reasoning. Although Google’s Gemini 3 scored a staggering 48.4%, experts stress that this does not indicate the arrival of artificial general intelligence (AGI).

דיווח על כתבה זו הסתרת כתבות מאתר זה המשך קריאה באתר המקור