На порталі Arxiv опублікована стаття групи дослідників «LongEval: рекомендації щодо людської оцінки узагальнень».
У матеріалі йдеться про те, як оцінка, що здійснюється людиною (найкраща практика для точної оцінки достовірності автоматично згенерованих зведень/резюме) та інші рішення дозволяють впоратися зі складністю та навантаженням, які супроводжують процес оцінювання. Автори вивчили 162 статті, присвячені підготовці переказу у вигляді короткого резюме, узагальнили поточну практику людського оцінювання зведеної інформації, згенерованої ШІ. Вони використовували LongEval – набір посібників з оцінювання людиною точності докладних резюме, які вирішують такі проблеми: забезпечення достовірності; мінімізація навантаження на людину за збереження високої точності достовірності; забезпечення цінності автоматичного резюме. Застосування LongEval у дослідженнях анотацій двох наборів даних результатів узагальнення у різних галузях знань (SQuALITY та PubMed) дозволило виявити, що перехід до більш тонкої деталізації суджень знижує дисперсію результатів.
Фото: скріншот
#НРАТ_Усі_новини #НРАТ_Науковцям_новини #НРАТ_Освітянам_новини
LONGEVAL ДЛЯ ОЦІНКИ УЗАГАЛЬНЕНЬ ВІД ШІ
2023-08-09
Поширити