تقييم نماذج الذكاء الاصطناعي وفق معايير جديدة