
“Visual Capitalist” platforması dünyada ən çox istifadə olunan süni intellekt modellərini IQ testindən keçirib.
Yeniavaz.com xəbər verir ki, qiymətləndirmə üçün “Mensa Norway” təşkilatı tərəfindən hazırlanmış IQ testi istifadə olunub. Bu test insan intellektinin ölçülməsi üçün ən çətin testlərdən biri hesab edilir.
Açıqlanan nəticələr göstərir ki, ötən illə müqayisədə süni intellekt modelləri arasındakı fərq xeyli azalıb. Bu il liderlik iki model arasında bölüşdürülüb. İlon Mask tərəfindən təsis edilən “xAI” şirkətinə məxsus “Grok-4.20 Expert Mode” və “OpenAI” şirkətinin “OpenAI GPT 5.4 Pro (Vision)” modelinin hər biri 145 – maksimal bal toplayaraq zirvədə qərarlaşıb. Onlara ən yaxın nəticəni isə 141 balla “Google” şirkətinə məxsus “Gemini 3.1 Pro Preview” göstərib.
Müqayisə üçün qeyd edək ki, ötən il maksimum nəticə cəmi 135 bal olub və bu göstərici də “OpenAI”nin “o3” modeli tərəfindən əldə edilib. Son nəticələr süni intellekt texnologiyalarının, xüsusilə məntiqi düşünmə və abstrakt problemlərin həlli sahəsində sürətlə inkişaf etdiyini nümayiş etdirir.
Bununla belə, inkişaf bütün şirkətlər üçün eyni səviyyədə olmayıb. Məsələn, “Mistral AI” tərəfindən hazırlanan ən yaxşı model cəmi 97 bal toplayaraq liderlərdən xeyli geri qalır.
Qeyd edək ki, “Mensa Norway” IQ testi 35 vizual məntiq tapşırığından ibarətdir. Test zamanı vizual modellər şəkillər əsasında, mətn modelləri isə sözlü təsvirlər üzərindən qiymətləndirilir. Bununla yanaşı, bu nəticələr ümumi intellektin tam göstəricisi deyil və yalnız müqayisə xarakteri daşıyır.
“Mensa Norway”in IQ testinə görə ən “ağıllı” süni intellekt modelləri aşağıdakı kimi olub:
“Grok-4.20 Expert Mode – 145;
“OpenAI GPT 5.4 Pro (Vision)” – 145;
“Gemini 3.1 Pro Preview” – 141;
“OpenAI GPT 5.4 Thinking (Vision)” – 139;
“OpenAI GPT 5.3” – 136;
“Grok-4.20 Expert Mode (Vision)” – 133;
“OpenAI GPT 5.4 Thinking” – 133;
“Meta Muse Spark” – 133;
“Gemini 3.1 Pro Preview (Vision)” – 132;
“Qwen 3.5” – 130;
“Claude-4.6 Opus” – 130;
“Kimi K2.5” – 127;
“Manus” – 115;
“DeepSeek R1” – 112;
“DeepSeek V3” – 111;
“Gemini 3.1 Flash Preview” – 110;
“Llama 4 Maverick” – 110;
“OpenAI GPT 5.3 (Vision)” – 109;
“Claude-4.6 Sonnet” – 106;
“Bing Copilot” – 101.
Murad Məmmədov
Tətbiqimizi yükləyə bilərsiniz