Describir: Učenie agenta odmenou a trestom v simulovanom prostredí