Uczenie się ze wzmocnieniem jest typem uczenia się, które pozwala urządzeniom i oprogramowaniu na zmaksymalizowanie osiągnięć poprzez uczenie się z ich własnego środowiska. Kiedy nowa informacja dociera do systemu, wzmocnione algorytmy mogą oszacować swój stan obecny i wybrać najlepszy sposób działania. Nowa informacja może wzmocnić stan obecny lub zainicjować zmianę na stan bliższy idealnemu. Ostatecznie, wzmocnione algorytmy dojdą i skupią się wokół ogólnego optimum.





