Describir: Učenie simulovaného agenta s pomocou hlbokého učenia posilňovaním