Context Navigation

GenericFunctionApproximationGrammarPolicy.cs

Timestamp:

02/11/15 13:06:02 (10 years ago)

Author:

gkronber

Message:

#2283: commit before cleanup after EuroCAST

File:

-                      r11977
+                      r11980
+      }
       const double beta = 20;
+      /*
+      const double beta = 10;
       var w = from idx in Enumerable.Range(0, maxIdx)
               let afterStateQ = activeAfterStates[idx]
 …
       selectedStateIdx = actionIndexMap[bestAction];
       Debug.Assert(selectedStateIdx >= 0);
       /*
       if (random.NextDouble() < 0.2) {
+      */
+      if (random.NextDouble() < 0.5) {
         selectedStateIdx = actionIndexMap[random.Next(maxIdx)];
       } else {
 …
         selectedStateIdx = actionIndexMap[bestIdxs[random.Next(bestIdxs.Count)]];
+      }
       */
       return true;
+    }
 …
       double delta = reward - GetValue(state);
       // delta /= problem.GetFeatures(state).Count();
       //const double alpha = 0.01;
+      //const double alpha = 0.001;
       foreach (var feature in problem.GetFeatures(state)) {
         featureTries[feature.Id] = GetFeatureTries(feature.Id) + 1;

Note: See TracChangeset for help on using the changeset viewer.