added comments

e173a575 · nambh713 · cb0f1435 · e173a575 · e173a575
Commit e173a575 authored 5 years ago by nambh713
--- a/QLearning/bin/QLearningController.class
+++ b/QLearning/bin/QLearningController.class
--- a/QLearning/src/QLearningController.java
+++ b/QLearning/src/QLearningController.java
@@ -153,21 +153,14 @@ public class QLearningController extends Controller {
 				} 
 				else {
 					double curQvalue = Qtable.get(prev_stateaction);
-					//System.out.print("cur q value: "+ curQvalue);
 					double Rvalue = StateAndReward.getRewardHover(previous_angle, previous_vx, previous_vy);
-					//System.out.print("r value"+ Rvalue);
-					
-
 					double alpha = alpha(Ntable.get(prev_stateaction));
 					double Qmax = getMaxActionQValue(new_state);
-					//System.out.print("Qmax"+ Qmax);
+					//Q(s,a)
 					curQvalue = curQvalue + alpha *(Rvalue + GAMMA_DISCOUNT_FACTOR*Qmax -curQvalue);
 					Qtable.put(prev_stateaction, curQvalue);
 				}
 				
-				/* TODO: IMPLEMENT Q-UPDATE HERE! */
-				
-				/* See top for constants and below for helper functions */
 				
 				int action = selectAction(new_state); /* Make sure you understand how it selects an action */