Поєднання різних підходів та стратегій: Збільшення творчості в програмах шахів на штучному інтелекті

Коли карантин у зв’язку з Covid-19 змусив людей залишитися вдома минулого року, комп’ютерний вчений Том Захаві відновив своє захоплення шахами. Інспірований читанням мемуарів Гаррі Каспарова, Захаві поглибився у відео та фільми про шахи, такі як “Гамбіт Ферзі”. Однак Захаві швидко зрозумів, що виявляється він краще вирішує шахові головоломки, ніж грає насправді. Ці головоломки створювали штучні ситуації, які ставали викликом для гравців знайти інноваційні способи отримати перевагу.

Що стосується цих шахових головоломок, то вони допомагали розкрити обмеження традиційних шахових програм. Математик Сер Роджер Пенроуз створив головоломку в 2017 році, яку навіть найсильніші комп’ютерні шахові програми не могли вирішити правильно. Захаві впізнав, що комп’ютери, хоч і можуть перевершувати людей у звичайній грі, мають труднощі вирішувати складні проблеми поза своїми навчальними даними.

Захаві, дослідник у Google DeepMind, сприйняв це як можливість дослідити творче вирішення проблем в системах штучного інтелекту. Він та його команда розробили унікальний підхід: поєднуючи до 10 систем штучного інтелекту для прийняття рішень, оптимізованих для різних стратегій. Вони інтегрували AlphaZero від DeepMind, потужну шахову програму, як отправну точку. Будучи на чужих і використовуючи переваги кожної системи, нова програма перевершувала AlphaZero окремо і показувала збільшену вправність та творчість при вирішенні головоломок Пенроуза. Кожного разу, коли один підхід перешкоджавлявся, програма плавно переходила до іншого.

Успіх підходу Захаві спонукав комп’ютерного вченого Елісон Лімхетчарат. Вона визнала переваги використання різноманітних систем штучного інтелекту, в особливості у сферах вирішення проблем поза шахами. Лімхетчарат підкреслила, що наявність команди агентів, навчених в різних областях, збільшує шанси успішно вирішувати складні виклики.

Це дослідження свідчить про те, що системи штучного інтелекту можуть отримати користь від колаборативного вирішення проблем та вивчення різних рішень. Антуан Каллі, дослідник із штучного інтелекту в Імперському коледжі Лондона, порівняв це зі штучними сесіями мозку, які призводять до творчого та ефективного вирішення проблем. Шукаючи альтернативні підходи, системи штучного інтелекту можуть подолати свої обмеження і пропонувати інноваційні рішення.

Робота Захаві також розглядає обмеження навчання з підсиленням, основу потужних шахових програм, таких як AlphaZero. Хоча навчання з підсиленням дозволяє системам штучного інтелекту вчитися та покращуватися через випробування та помилки, часто воно не дозволяє розвинути цілісне розуміння гри. Захаві помітив, що ці системи мають темні місця, коли мова йде про нові ситуації чи проблеми, з якими вони ніколи не стикалися. Недостатність впізнавання невдачі заважала їм проявляти творчість.

Натомість Роз у Захаві спонукає інтеграцію визнання невдачі та творче вирішення проблем в системах штучного інтелекту. Це дозволить програмам штучного інтелекту подолати темні місця, розширити їх можливості вирішення проблем та пропонувати більш доповнені рішення.

**Часті питання на основі основних тем та інформації, представленої у статті:**

**Q: Що надихнуло комп’ютерного вченого Тома Захаві відновити своє захоплення шахами?**
А: Тома Захаві надихнула читання мемуарів Гаррі Каспарова та перегляд відео та фільмів про шахи, таких як “Гамбіт Ферзі”, під час карантину у зв’язку з Covid-19.

**Q: Що зрозумів Захаві про шахові головоломки та традиційні шахові програми?**
А: Захаві зрозумів, що шахові головоломки допомагали розкрити обмеження традиційних шахових програм. Комп’ютери могли перевершувати людей у звичайній грі, але вони боролися з складними проблемами поза своїми навчальними даними.

**Q: Як Захаві та його команда підходили до проблеми творчого вирішення проблем в системах штучного інтелекту?**
А: Захаві та його команда поєднали до 10 систем штучного інтелекту для прийняття рішень, оптимізованих для різних стратегій. Вони інтегрували AlphaZero від DeepMind як отправну точку та використовували переваги кожної системи для створення нової програми, що перевершувала AlphaZero окремо.

**Q: Яка роль мала співпраця в підході Захаві?**
А: Співпраця була ключовою в підході Захаві. Коли один підхід зіштовхувався з перешкодою, програма плавно переходила до іншого, що дозволяло команді поєднувати переваги різних систем.

**Q: Які переваги бачила комп’ютерний вчений Алісон Лімхетчарат у використанні різноманітних систем штучного інтелекту?**
А: Лімхетчарат підкреслила, що різноманітні системи штучного інтелекту, навчені в різних сферах, збільшують шанси успішно вирішувати складні виклики, не лише в шахах, але й у сценаріях вирішення проблем поза шахами.

**Q: Що вказує дослідження про системи штучного інтелекту та вирішення проблем?**
A: Дослідження показує, що системи штучного інтелекту можуть отримати користь від колаборативного вирішення проблем та дослідження різних рішень. Пошук альтернативних підходів дозволяє їм подолати обмеження та пропонувати інноваційні рішення.

**Q: Які обмеження адресує робота Захаві у навчанні з підсиленням?**
A: Робота Захаві адресує обмеження навчання з підсиленням, основу потужних шахових програм, таких як AlphaZero. Ці системи часто мають темні місця, коли мова йде про нові ситуації або проблеми, з якими вони ніколи не стикалися.

**Q: Як Захаві пропонує подолати ці обмеження в системах штучного інтелекту?**
A: Захаві пропонує інтегрувати визнання невдачі та творче вирішення проблем в системи штучного інтелекту. Це дозволить програмам штучного інтелекту подолати темні місця, розширити їх можливості вирішення проблем та пропонувати більш доповнені рішення.

The source of the article is from the blog klikeri.rs