Context Navigation

← Previous Change
Next Change →

Program.cs

Timestamp:

01/19/15 20:09:12 (10 years ago)

Author:

gkronber

Message:

#2283: performance tuning and reactivated random-roll-out policy in sequential search

File:

: 1 edited

branches/HeuristicLab.Problems.GrammaticalOptimization/Main/Program.cs (modified) (10 diffs)

Legend:

: Unmodified
: Added
: Removed

branches/HeuristicLab.Problems.GrammaticalOptimization/Main/Program.cs

-                      r11795
+                      r11799
       CultureInfo.DefaultThreadCurrentCulture = CultureInfo.InvariantCulture;
       //RunDemo();
       RunGridTest();
+      RunDemo();
+      //RunGridTest();
+    }
 …
       //var globalRandom = new Random(31415);
       var localRandSeed = 31415;
       var reps = 5;
       var policies = new Func<IBanditPolicy>[]
+      var reps = 10;
+      var policyFactories = new Func<IBanditPolicy>[]
+        {
          () => new RandomPolicy(),
 …
          () => new ChernoffIntervalEstimationPolicy( 0.1),
          () => new ChernoffIntervalEstimationPolicy( 0.2),
+         () => new ThresholdAscentPolicy(5, 0.01),
+         () => new ThresholdAscentPolicy(5, 0.05),
+         () => new ThresholdAscentPolicy(5, 0.1),
+         () => new ThresholdAscentPolicy(5, 0.2),
          () => new ThresholdAscentPolicy(10, 0.01),
          () => new ThresholdAscentPolicy(10, 0.05),
          () => new ThresholdAscentPolicy(10, 0.1),
          () => new ThresholdAscentPolicy(10, 0.2),
+         () => new ThresholdAscentPolicy(50, 0.01),
+         () => new ThresholdAscentPolicy(50, 0.05),
+         () => new ThresholdAscentPolicy(50, 0.1),
+         () => new ThresholdAscentPolicy(50, 0.2),
          () => new ThresholdAscentPolicy(100, 0.01),
          () => new ThresholdAscentPolicy(100, 0.05),
          () => new ThresholdAscentPolicy(100, 0.1),
          () => new ThresholdAscentPolicy(100, 0.2),
+         () => new ThresholdAscentPolicy(100, 0.01),
+         () => new ThresholdAscentPolicy(100, 0.05),
+         () => new ThresholdAscentPolicy(100, 0.1),
+         () => new ThresholdAscentPolicy(100, 0.2),
+         //() => new ThresholdAscentPolicy(1000, 0.01),
+         //() => new ThresholdAscentPolicy(1000, 0.05),
+         //() => new ThresholdAscentPolicy(1000, 0.1),
+         //() => new ThresholdAscentPolicy(1000, 0.2),
+         () => new ThresholdAscentPolicy(500, 0.01),
+         () => new ThresholdAscentPolicy(500, 0.05),
+         () => new ThresholdAscentPolicy(500, 0.1),
+         () => new ThresholdAscentPolicy(500, 0.2),
          //() => new ThresholdAscentPolicy(5000, 0.01),
          //() => new ThresholdAscentPolicy(10000, 0.01),
         };
+      foreach (var problem in new Tuple<IProblem, int>[]
+        {
+          Tuple.Create((IProblem)new SantaFeAntProblem(), 17),
+          Tuple.Create((IProblem)new SymbolicRegressionPoly10Problem(), 23),
+        })
+        foreach (var useCanonical in new bool[] { true, false })
+          foreach (var randomTries in new int[] { 0, /*1, 10, /* 5, 100 /*, 500, 1000 */}) {
+            foreach (var policy in policies) {
+      var instanceFactories = new Func<Random, Tuple<IProblem, int>>[]
+      {
+        (rand) => Tuple.Create((IProblem)new SantaFeAntProblem(), 17),
+        (rand) => Tuple.Create((IProblem)new FindPhrasesProblem(rand, 10, numPhrases:5, phraseLen:3, numOptimalPhrases:5, numDecoyPhrases:0, correctReward:1, decoyReward:0, phrasesAsSets:false ), 15),
+        (rand) => Tuple.Create((IProblem)new FindPhrasesProblem(rand, 10, numPhrases:5, phraseLen:3, numOptimalPhrases:5, numDecoyPhrases:0, correctReward:1, decoyReward:0, phrasesAsSets:true ), 15),
+        (rand) => Tuple.Create((IProblem)new FindPhrasesProblem(rand, 10, numPhrases:5, phraseLen:3, numOptimalPhrases:5, numDecoyPhrases:200, correctReward:1, decoyReward:0.5, phrasesAsSets:false), 15),
+        (rand) => Tuple.Create((IProblem)new FindPhrasesProblem(rand, 10, numPhrases:5, phraseLen:3, numOptimalPhrases:5, numDecoyPhrases:200, correctReward:1, decoyReward:0.5, phrasesAsSets:true), 15),
+        (rand) => Tuple.Create((IProblem)new SymbolicRegressionPoly10Problem(), 23)
+      };
+      foreach (var instanceFactory in instanceFactories) {
+        foreach (var useCanonical in new bool[] { true, false }) {
+          foreach (var randomTries in new int[] { 0, 1, 10, /* 5, 100 /*, 500, 1000 */}) {
+            foreach (var policyFactory in policyFactories) {
               var myRandomTries = randomTries;
               var localRand = new Random(localRandSeed);
               var options = new ParallelOptions();
               options.MaxDegreeOfParallelism = 1;
+              options.MaxDegreeOfParallelism = 4;
               Parallel.For(0, reps, options, (i) => {
-                //var t = Task.Run(() => {
                 Random myLocalRand;
                 lock (localRand)
                   myLocalRand = new Random(localRand.Next());
-                //for (int i = 0; i < reps; i++) {
                 int iterations = 0;
 …
                 //var problem = new RoyalPairProblem();
                 //var problem = new EvenParityProblem();
+                // var alg = new MctsSampler(problem.Item1, problem.Item2, myLocalRand, myRandomTries, policy()); // TODO: Make sure we generate the same random numbers for each
+                var alg = new SequentialSearch(problem.Item1, problem.Item2, myLocalRand, myRandomTries, new GenericGrammarPolicy(problem.Item1, policy(), useCanonical));
+                // var alg = new MctsSampler(problem.Item1, problem.Item2, myLocalRand, myRandomTries, policy());
+                var instance = instanceFactory(myLocalRand);
+                var problem = instance.Item1;
+                var maxLen = instance.Item2;
+                var alg = new SequentialSearch(problem, maxLen, myLocalRand, myRandomTries,
+                  new GenericGrammarPolicy(problem, policyFactory(), useCanonical));
                 //var alg = new ExhaustiveBreadthFirstSearch(problem, 25);
                 //var alg = new AlternativesContextSampler(problem, 25);
 …
                   iterations++;
                   globalStatistics.AddSentence(sentence, quality);
                   if (iterations % 1000 == 0) {
                     Console.WriteLine("{0,5} {1,25} {2} {3}", myRandomTries, policy(), useCanonical, globalStatistics);
+                  if (iterations % 10000 == 0) {
+                    Console.WriteLine("{0,3} {1,5} \"{2,25}\" {3} {4}", i, myRandomTries, policyFactory(), useCanonical, globalStatistics);
+                  }
                 };
                 alg.FoundNewBestSolution += (sentence, quality) => {
+                  Console.WriteLine("{0,5} {1,25} {2} {3}", myRandomTries, policy(), useCanonical, globalStatistics);
+                  //Console.WriteLine("{0,5} {1,25} {2} {3}",
+                  //  myRandomTries, policyFactory(), useCanonical,
+                  //  globalStatistics);
                 };
                 alg.Run(maxIterations);
-                //Console.WriteLine("{0,5} {1} {2}", randomTries, policyFactory(1), globalStatistics);
-                //}
-                //});
-                //tasks.Add(t);
               });
+            }
+          }
+      //Task.WaitAll(tasks.ToArray());
+        }
+      }
+    }
     private static void RunDemo() {
-      // TODO: clone problem for parallel grid test
       // TODO: move problem instances into a separate folder
-      // TODO: improve performance of SequentialSearch (memory allocations related to sequences)
       // TODO: implement bridge to HL-GP
       // TODO: unify MCTS, TD and ContextMCTS Solvers (stateInfos)
 …
       var random = new Random();
+      var problem = new RoyalSequenceProblem(random, 10, 30, 2, 1, 0);
       //var phraseLen = 3;
       //var numPhrases = 5;
       //var problem = new RoyalPhraseSequenceProblem(random, 15, numPhrases, phraseLen: phraseLen, numCorrectPhrases: 1, correctReward: 1, incorrectReward: 0.0, phrasesAsSets: true);
       // var phraseLen = 2;
+      // var phraseLen = 3;
       // var numPhrases = 5;
       // var problem = new FindPhrasesProblem(random, 15, numPhrases, phraseLen, numOptimalPhrases: numPhrases, numDecoyPhrases: 0, correctReward: 1.0, decoyReward: 0.0, phrasesAsSets: true);
+      // var problem = new FindPhrasesProblem(random, 10, numPhrases, phraseLen, numOptimalPhrases: numPhrases, numDecoyPhrases: 200, correctReward: 1.0, decoyReward: 0.5, phrasesAsSets: true);
       // good results for symb-reg
 …
       // - GenericThompsonSamplingPolicy("")
       // - UCTPolicy(0.10) (5 of 5 runs, 35000 iters avg.)
       // good results for artificial ant:
       // prev results:
 …
       // - GaussianModelWithUnknownVariance (and Q= 0.99-quantil) also works well for Ant
       // 2015 01 19: grid test with canonical states (non-canonical slightly worse)
+      // - Threshold Ascent (best 100, 0.01; all variants relatively good
+      //var problem = new SymbolicRegressionPoly10Problem();
+      var problem = new SantaFeAntProblem();
+      // - Threshold Ascent (best 100, 0.01; all variants relatively good)
+      // - Policies where the variance has a large weight compared to the mean? (Gaussian(compatible), Gaussian with fixed variance, UCT with large c, alle TA)
+      //var problem = new SymbolicRegressionPoly10Problem();
+      //var problem = new SantaFeAntProblem();
       //var problem = new SymbolicRegressionProblem("Tower");
       //var problem = new PalindromeProblem();
 …
       //var alg = new MctsSampler(problem, 23, random, 0, new BoltzmannExplorationPolicy(100));
       //var alg = new MctsSampler(problem, 23, random, 0, new EpsGreedyPolicy(0.1));
       var alg = new SequentialSearch(problem, 17, random, 0,
         new HeuristicLab.Algorithms.Bandits.GrammarPolicies.GenericGrammarPolicy(problem, new BoltzmannExplorationPolicy(10), true));
+      var alg = new SequentialSearch(problem, 30, random, 0,
+        new HeuristicLab.Algorithms.Bandits.GrammarPolicies.GenericGrammarPolicy(problem, new EpsGreedyPolicy(0.1), true));
       //var alg = new MctsQLearningSampler(problem, sentenceLen, random, 0, null);
       //var alg = new MctsQLearningSampler(problem, 30, random, 0, new EpsGreedyPolicy(0.2));
 …
         iterations++;
         globalStatistics.AddSentence(sentence, quality);
         if (iterations % 100 == 0) {
+        if (iterations % 1000 == 0) {
           if (iterations % 1000 == 0) Console.Clear();
           Console.SetCursorPosition(0, 0);

Note: See TracChangeset for help on using the changeset viewer.

Context Navigation

Changeset 11799 for branches/HeuristicLab.Problems.GrammaticalOptimization/Main/Program.cs

Legend:

branches/HeuristicLab.Problems.GrammaticalOptimization/Main/Program.cs

Download in other formats: