Новости и объявления
Алгоритмы 1980-х годов, лежащие в основе современного ИИ, получили премию А. М. Тьюринга
Эндрю Барто и Ричард Саттон получили премию имени А. М. Тьюринга за создание основ обучения с подкреплением, лежащего в основе современного ИИ, включая AlphaGo и большие модели рассуждений (LRM). Ассоциация вычислительной техники (ACM) отметила их инновационные исследования, начатые в 1980-х, которые позволяют машинам учиться через обратную связь.
Премия, называемая «Нобелевской премией по информатике», включает миллион долларов и присуждена за их алгоритмы, преобразованные в математическую модель. Их учебник «Обучение с подкреплением: введение» 1998 года, процитированный более 75 тысяч раз, стал основополагающим трудом.
В сочетании с глубоким обучением их методы привели к успехам: AlphaGo победил Ли Седоля, ChatGPT обучался с обратной связью, а технология применяется от робототехники до онлайн-рекламы. Джефф Дин из Google отметил, что их работа воплощает цель Тьюринга о машинах, учащихся на опыте.
Текст: Загиров Алимагомед
