Tipo de Machine Learning onde um agente aprende a tomar decisões através de tentativa e erro, recebendo recompensas ou penalidades. Usado em jogos, robótica e sistemas de recomendação.
Navegar por letra: