Context Navigation

Changeset 12026 for branches

Timestamp:

02/17/15 16:04:58 (10 years ago)

Author:

gkronber

Message:

#2283: fix in generic function approximation grammar policy (constant alpha value of 0.01)

File:

-                      r11981
+                      r12026
       double delta = reward - GetValue(state);
       foreach (var feature in problem.GetFeatures(state)) {
+        featureTries[feature.Id] = GetFeatureTries(feature.Id) + 1;
+        Debug.Assert(GetFeatureTries(feature.Id) >= 1);
+        double alpha = 1.0 / GetFeatureTries(feature.Id);
+        alpha = Math.Max(alpha, 0.001);
+        //featureTries[feature.Id] = GetFeatureTries(feature.Id) + 1;
+        //Debug.Assert(GetFeatureTries(feature.Id) >= 1);
+        //double alpha = 1.0 / GetFeatureTries(feature.Id);
+        //alpha = Math.Max(alpha, 0.001);
+        var alpha = 0.01;
         double w;

Note: See TracChangeset for help on using the changeset viewer.