OpenAI süni intellektin elmi tədqiqat və məntiq qabiliyyətlərini qiymətləndirmək məqsədilə “FrontierScience” adlı yeni elmi benchmarku ictimaiyyətə təqdim edib.
AzEdu.az-ın xarici mediadan əldə etdiyi məlumata görə, yeni ölçmə sistemi süni intellekt modellərinin yalnız bilik səviyyəsini deyil, həm də elmi düşünmə, hipotez qurma və mürəkkəb problemləri mərhələli şəkildə həll etmə bacarıqlarını yoxlamağı hədəfləyir.
"FrontierScience" benchmarku fizika, kimya və biologiya sahələrini əhatə edir. Test tapşırıqları beynəlxalq səviyyəli alimlər tərəfindən hazırlanıb və real elmi tədqiqat proseslərinə uyğun qurulub. Bu yanaşma süni intellektin laboratoriya və akademik mühitlərdə nə dərəcədə effektiv istifadə oluna biləcəyini müəyyən etməyə imkan verir.
Benchmark iki əsas mərhələdən ibarətdir. Birinci mərhələ elmi olimpiada tipli suallar vasitəsilə nəzəri bilik və məntiqi düşünməni ölçür. İkinci mərhələdə isə modellər açıq tipli tədqiqat problemləri ilə üzləşir və onlardan elmi yanaşma, analiz və əsaslandırılmış nəticələr tələb olunur.
OpenAI-nin açıqlamasına görə, ilkin nəticələr müasir süni intellekt modellərinin nəzəri suallarda yüksək göstəricilər nümayiş etdirdiyini, lakin real tədqiqat səviyyəli problemlərdə hələ inkişaf potensialının mövcud olduğunu göstərir. Şirkət hesab edir ki, FrontierScience gələcəkdə süni intellektin elmə töhfə imkanlarını ölçmək üçün əsas istinad nöqtələrindən birinə çevriləcək.
Qeyd edək ki, bu benchmark elmi ictimaiyyət üçün açıq olacaq və müxtəlif süni intellekt modellərinin müqayisəli şəkildə qiymətləndirilməsinə şərait yaradacaq.