Команда исследователей провела исследование для оценки точности автоматически сгенерированных ИИ-рассказов в радиологии. Исследователи использовали различные метрики оценки для оценки производительности этих инструментов ИИ. Они также попросили шести человеческих радиологов прочитать ИИ-сгенерированные отчеты.
Анализ показал, что по сравнению с человеческими радиологами, автоматические системы оценки хуже справлялись с задачей оценки ИИ-сгенерированных отчетов.… Read the rest