Context Navigation

source: trunk/sources/ALGLIB/lbfgs.cs @ 2575

Visit:

Last change on this file since 2575 was 2563, checked in by gkronber, 15 years ago
Updated ALGLIB to latest version. #751 (Plugin for for data-modeling with ANN (integrated into CEDMA))
File size: 47.7 KB

Rev	Line
[2563]	1	/*************************************************************************
	2	Copyright (c) 2007-2008, Sergey Bochkanov (ALGLIB project).
	3
	4	>>> SOURCE LICENSE >>>
	5	This program is free software; you can redistribute it and/or modify
	6	it under the terms of the GNU General Public License as published by
	7	the Free Software Foundation (www.fsf.org); either version 2 of the
	8	License, or (at your option) any later version.
	9
	10	This program is distributed in the hope that it will be useful,
	11	but WITHOUT ANY WARRANTY; without even the implied warranty of
	12	MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
	13	GNU General Public License for more details.
	14
	15	A copy of the GNU General Public License is available at
	16	http://www.fsf.org/licensing/licenses
	17
	18	>>> END OF LICENSE >>>
	19	*************************************************************************/
	20
	21	using System;
	22
	23	namespace alglib
	24	{
	25	public class lbfgs
	26	{
	27	public struct lbfgsstate
	28	{
	29	public int n;
	30	public int m;
	31	public double epsg;
	32	public double epsf;
	33	public double epsx;
	34	public int maxits;
	35	public int flags;
	36	public int nfev;
	37	public int mcstage;
	38	public int k;
	39	public int q;
	40	public int p;
	41	public double[] rho;
	42	public double[,] y;
	43	public double[,] s;
	44	public double[] theta;
	45	public double[] d;
	46	public double stp;
	47	public double[] work;
	48	public double fold;
	49	public double gammak;
	50	public double[] x;
	51	public double f;
	52	public double[] g;
	53	public bool xupdated;
	54	public AP.rcommstate rstate;
	55	public int repiterationscount;
	56	public int repnfev;
	57	public int repterminationtype;
	58	public bool brackt;
	59	public bool stage1;
	60	public int infoc;
	61	public double dg;
	62	public double dgm;
	63	public double dginit;
	64	public double dgtest;
	65	public double dgx;
	66	public double dgxm;
	67	public double dgy;
	68	public double dgym;
	69	public double finit;
	70	public double ftest1;
	71	public double fm;
	72	public double fx;
	73	public double fxm;
	74	public double fy;
	75	public double fym;
	76	public double stx;
	77	public double sty;
	78	public double stmin;
	79	public double stmax;
	80	public double width;
	81	public double width1;
	82	public double xtrapf;
	83	};
	84
	85
	86	public struct lbfgsreport
	87	{
	88	public int iterationscount;
	89	public int nfev;
	90	public int terminationtype;
	91	};
	92
	93
	94
	95
	96	public const double ftol = 0.0001;
	97	public const double xtol = 100*AP.Math.MachineEpsilon;
	98	public const double gtol = 0.9;
	99	public const int maxfev = 20;
	100	public const double stpmin = 1.0E-20;
	101	public const double stpmax = 1.0E20;
	102
	103
	104	/*************************************************************************
	105	LIMITED MEMORY BFGS METHOD FOR LARGE SCALE OPTIMIZATION
	106
	107	The subroutine minimizes function F(x) of N arguments by using a quasi-
	108	Newton method (LBFGS scheme) which is optimized to use a minimum amount
	109	of memory.
	110
	111	The subroutine generates the approximation of an inverse Hessian matrix by
	112	using information about the last M steps of the algorithm (instead of N).
	113	It lessens a required amount of memory from a value of order N^2 to a
	114	value of order 2NM.
	115
	116	Input parameters:
	117	N - problem dimension. N>0
	118	M - number of corrections in the BFGS scheme of Hessian
	119	approximation update. Recommended value: 3<=M<=7. The smaller
	120	value causes worse convergence, the bigger will not cause a
	121	considerably better convergence, but will cause a fall in the
	122	performance. M<=N.
	123	X - initial solution approximation, array[0..N-1].
	124	EpsG - positive number which defines a precision of search. The
	125	subroutine finishes its work if the condition \|\|G\|\| < EpsG is
	126	satisfied, where \|\|.\|\| means Euclidian norm, G - gradient, X -
	127	current approximation.
	128	EpsF - positive number which defines a precision of search. The
	129	subroutine finishes its work if on iteration number k+1 the
	130	condition \|F(k+1)-F(k)\| <= EpsF*max{\|F(k)\|, \|F(k+1)\|, 1} is
	131	satisfied.
	132	EpsX - positive number which defines a precision of search. The
	133	subroutine finishes its work if on iteration number k+1 the
	134	condition \|X(k+1)-X(k)\| <= EpsX is fulfilled.
	135	MaxIts- maximum number of iterations. If MaxIts=0, the number of
	136	iterations is unlimited.
	137	Flags - additional settings:
	138	* Flags = 0 means no additional settings
	139	* Flags = 1 "do not allocate memory". used when solving
	140	a many subsequent tasks with same N/M values.
	141	First call MUST be without this flag bit set,
	142	subsequent calls of MinLBFGS with same LBFGSState
	143	structure can set Flags to 1.
	144
	145	Output parameters:
	146	State - structure used for reverse communication.
	147
	148	See also MinLBFGSIteration, MinLBFGSResults
	149
	150	-- ALGLIB --
	151	Copyright 14.11.2007 by Bochkanov Sergey
	152	*************************************************************************/
	153	public static void minlbfgs(int n,
	154	int m,
	155	ref double[] x,
	156	double epsg,
	157	double epsf,
	158	double epsx,
	159	int maxits,
	160	int flags,
	161	ref lbfgsstate state)
	162	{
	163	bool allocatemem = new bool();
	164	int i_ = 0;
	165
	166	System.Diagnostics.Debug.Assert(n>=1, "MinLBFGS: N too small!");
	167	System.Diagnostics.Debug.Assert(m>=1, "MinLBFGS: M too small!");
	168	System.Diagnostics.Debug.Assert(m<=n, "MinLBFGS: M too large!");
	169	System.Diagnostics.Debug.Assert((double)(epsg)>=(double)(0), "MinLBFGS: negative EpsG!");
	170	System.Diagnostics.Debug.Assert((double)(epsf)>=(double)(0), "MinLBFGS: negative EpsF!");
	171	System.Diagnostics.Debug.Assert((double)(epsx)>=(double)(0), "MinLBFGS: negative EpsX!");
	172	System.Diagnostics.Debug.Assert(maxits>=0, "MinLBFGS: negative MaxIts!");
	173
	174	//
	175	// Initialize
	176	//
	177	state.n = n;
	178	state.m = m;
	179	state.epsg = epsg;
	180	state.epsf = epsf;
	181	state.epsx = epsx;
	182	state.maxits = maxits;
	183	state.flags = flags;
	184	allocatemem = flags%2==0;
	185	flags = flags/2;
	186	if( allocatemem )
	187	{
	188	state.rho = new double[m-1+1];
	189	state.theta = new double[m-1+1];
	190	state.y = new double[m-1+1, n-1+1];
	191	state.s = new double[m-1+1, n-1+1];
	192	state.d = new double[n-1+1];
	193	state.x = new double[n-1+1];
	194	state.g = new double[n-1+1];
	195	state.work = new double[n-1+1];
	196	}
	197
	198	//
	199	// Initialize Rep structure
	200	//
	201	state.xupdated = false;
	202
	203	//
	204	// Prepare first run
	205	//
	206	state.k = 0;
	207	for(i_=0; i_<=n-1;i_++)
	208	{
	209	state.x[i_] = x[i_];
	210	}
	211	state.rstate.ia = new int[6+1];
	212	state.rstate.ra = new double[4+1];
	213	state.rstate.stage = -1;
	214	}
	215
	216
	217	/*************************************************************************
	218	One L-BFGS iteration
	219
	220	Called after initialization with MinLBFGS.
	221	See HTML documentation for examples.
	222
	223	Input parameters:
	224	State - structure which stores algorithm state between calls and
	225	which is used for reverse communication. Must be initialized
	226	with MinLBFGS.
	227
	228	If suborutine returned False, iterative proces has converged.
	229
	230	If subroutine returned True, caller should calculate function value
	231	State.F an gradient State.G[0..N-1] at State.X[0..N-1] and call
	232	MinLBFGSIteration again.
	233
	234	-- ALGLIB --
	235	Copyright 20.04.2009 by Bochkanov Sergey
	236	*************************************************************************/
	237	public static bool minlbfgsiteration(ref lbfgsstate state)
	238	{
	239	bool result = new bool();
	240	int n = 0;
	241	int m = 0;
	242	int maxits = 0;
	243	double epsf = 0;
	244	double epsg = 0;
	245	double epsx = 0;
	246	int i = 0;
	247	int j = 0;
	248	int ic = 0;
	249	int mcinfo = 0;
	250	double v = 0;
	251	double vv = 0;
	252	int i_ = 0;
	253
	254
	255	//
	256	// Reverse communication preparations
	257	// I know it looks ugly, but it works the same way
	258	// anywhere from C++ to Python.
	259	//
	260	// This code initializes locals by:
	261	// * random values determined during code
	262	// generation - on first subroutine call
	263	// * values from previous call - on subsequent calls
	264	//
	265	if( state.rstate.stage>=0 )
	266	{
	267	n = state.rstate.ia[0];
	268	m = state.rstate.ia[1];
	269	maxits = state.rstate.ia[2];
	270	i = state.rstate.ia[3];
	271	j = state.rstate.ia[4];
	272	ic = state.rstate.ia[5];
	273	mcinfo = state.rstate.ia[6];
	274	epsf = state.rstate.ra[0];
	275	epsg = state.rstate.ra[1];
	276	epsx = state.rstate.ra[2];
	277	v = state.rstate.ra[3];
	278	vv = state.rstate.ra[4];
	279	}
	280	else
	281	{
	282	n = -983;
	283	m = -989;
	284	maxits = -834;
	285	i = 900;
	286	j = -287;
	287	ic = 364;
	288	mcinfo = 214;
	289	epsf = -338;
	290	epsg = -686;
	291	epsx = 912;
	292	v = 585;
	293	vv = 497;
	294	}
	295	if( state.rstate.stage==0 )
	296	{
	297	goto lbl_0;
	298	}
	299	if( state.rstate.stage==1 )
	300	{
	301	goto lbl_1;
	302	}
	303
	304	//
	305	// Routine body
	306	//
	307
	308	//
	309	// Unload frequently used variables from State structure
	310	// (just for typing convinience)
	311	//
	312	n = state.n;
	313	m = state.m;
	314	epsg = state.epsg;
	315	epsf = state.epsf;
	316	epsx = state.epsx;
	317	maxits = state.maxits;
	318	state.repterminationtype = 0;
	319	state.repiterationscount = 0;
	320	state.repnfev = 0;
	321
	322	//
	323	// Update info
	324	//
	325	state.xupdated = false;
	326
	327	//
	328	// Calculate F/G
	329	//
	330	state.rstate.stage = 0;
	331	goto lbl_rcomm;
	332	lbl_0:
	333	state.repnfev = 1;
	334
	335	//
	336	// Preparations
	337	//
	338	state.fold = state.f;
	339	v = 0.0;
	340	for(i_=0; i_<=n-1;i_++)
	341	{
	342	v += state.g[i_]*state.g[i_];
	343	}
	344	v = Math.Sqrt(v);
	345	if( (double)(v)==(double)(0) )
	346	{
	347	state.repterminationtype = 4;
	348	result = false;
	349	return result;
	350	}
	351	state.stp = 1.0/v;
	352	for(i_=0; i_<=n-1;i_++)
	353	{
	354	state.d[i_] = -state.g[i_];
	355	}
	356
	357	//
	358	// Main cycle
	359	//
	360	lbl_2:
	361	if( false )
	362	{
	363	goto lbl_3;
	364	}
	365
	366	//
	367	// Main cycle: prepare to 1-D line search
	368	//
	369	state.p = state.k%m;
	370	state.q = Math.Min(state.k, m-1);
	371
	372	//
	373	// Store X[k], G[k]
	374	//
	375	for(i_=0; i_<=n-1;i_++)
	376	{
	377	state.s[state.p,i_] = -state.x[i_];
	378	}
	379	for(i_=0; i_<=n-1;i_++)
	380	{
	381	state.y[state.p,i_] = -state.g[i_];
	382	}
	383
	384	//
	385	// Minimize F(x+alpha*d)
	386	//
	387	state.mcstage = 0;
	388	if( state.k!=0 )
	389	{
	390	state.stp = 1.0;
	391	}
	392	mcsrch(n, ref state.x, ref state.f, ref state.g, ref state.d, ref state.stp, ref mcinfo, ref state.nfev, ref state.work, ref state, ref state.mcstage);
	393	lbl_4:
	394	if( state.mcstage==0 )
	395	{
	396	goto lbl_5;
	397	}
	398	state.rstate.stage = 1;
	399	goto lbl_rcomm;
	400	lbl_1:
	401	mcsrch(n, ref state.x, ref state.f, ref state.g, ref state.d, ref state.stp, ref mcinfo, ref state.nfev, ref state.work, ref state, ref state.mcstage);
	402	goto lbl_4;
	403	lbl_5:
	404
	405	//
	406	// Main cycle: update information and Hessian.
	407	// Check stopping conditions.
	408	//
	409	state.repnfev = state.repnfev+state.nfev;
	410	state.repiterationscount = state.repiterationscount+1;
	411
	412	//
	413	// Calculate S[k], Y[k], Rho[k], GammaK
	414	//
	415	for(i_=0; i_<=n-1;i_++)
	416	{
	417	state.s[state.p,i_] = state.s[state.p,i_] + state.x[i_];
	418	}
	419	for(i_=0; i_<=n-1;i_++)
	420	{
	421	state.y[state.p,i_] = state.y[state.p,i_] + state.g[i_];
	422	}
	423
	424	//
	425	// Stopping conditions
	426	//
	427	if( state.repiterationscount>=maxits & maxits>0 )
	428	{
	429
	430	//
	431	// Too many iterations
	432	//
	433	state.repterminationtype = 5;
	434	result = false;
	435	return result;
	436	}
	437	v = 0.0;
	438	for(i_=0; i_<=n-1;i_++)
	439	{
	440	v += state.g[i_]*state.g[i_];
	441	}
	442	if( (double)(Math.Sqrt(v))<=(double)(epsg) )
	443	{
	444
	445	//
	446	// Gradient is small enough
	447	//
	448	state.repterminationtype = 4;
	449	result = false;
	450	return result;
	451	}
	452	if( (double)(state.fold-state.f)<=(double)(epsf*Math.Max(Math.Abs(state.fold), Math.Max(Math.Abs(state.f), 1.0))) )
	453	{
	454
	455	//
	456	// F(k+1)-F(k) is small enough
	457	//
	458	state.repterminationtype = 1;
	459	result = false;
	460	return result;
	461	}
	462	v = 0.0;
	463	for(i_=0; i_<=n-1;i_++)
	464	{
	465	v += state.s[state.p,i_]*state.s[state.p,i_];
	466	}
	467	if( (double)(Math.Sqrt(v))<=(double)(epsx) )
	468	{
	469
	470	//
	471	// X(k+1)-X(k) is small enough
	472	//
	473	state.repterminationtype = 2;
	474	result = false;
	475	return result;
	476	}
	477
	478	//
	479	// Calculate Rho[k], GammaK
	480	//
	481	v = 0.0;
	482	for(i_=0; i_<=n-1;i_++)
	483	{
	484	v += state.y[state.p,i_]*state.s[state.p,i_];
	485	}
	486	vv = 0.0;
	487	for(i_=0; i_<=n-1;i_++)
	488	{
	489	vv += state.y[state.p,i_]*state.y[state.p,i_];
	490	}
	491	if( (double)(v)==(double)(0) \| (double)(vv)==(double)(0) )
	492	{
	493
	494	//
	495	// Rounding errors make further iterations impossible.
	496	//
	497	state.repterminationtype = -2;
	498	result = false;
	499	return result;
	500	}
	501	state.rho[state.p] = 1/v;
	502	state.gammak = v/vv;
	503
	504	//
	505	// Calculate d(k+1) = H(k+1)*g(k+1)
	506	//
	507	// for I:=K downto K-Q do
	508	// V = s(i)^T * work(iteration:I)
	509	// theta(i) = V
	510	// work(iteration:I+1) = work(iteration:I) - VRho(i)y(i)
	511	// work(last iteration) = H0*work(last iteration)
	512	// for I:=K-Q to K do
	513	// V = y(i)^T*work(iteration:I)
	514	// work(iteration:I+1) = work(iteration:I) +(-V+theta(i))Rho(i)s(i)
	515	//
	516	// NOW WORK CONTAINS d(k+1)
	517	//
	518	for(i_=0; i_<=n-1;i_++)
	519	{
	520	state.work[i_] = state.g[i_];
	521	}
	522	for(i=state.k; i>=state.k-state.q; i--)
	523	{
	524	ic = i%m;
	525	v = 0.0;
	526	for(i_=0; i_<=n-1;i_++)
	527	{
	528	v += state.s[ic,i_]*state.work[i_];
	529	}
	530	state.theta[ic] = v;
	531	vv = v*state.rho[ic];
	532	for(i_=0; i_<=n-1;i_++)
	533	{
	534	state.work[i_] = state.work[i_] - vv*state.y[ic,i_];
	535	}
	536	}
	537	v = state.gammak;
	538	for(i_=0; i_<=n-1;i_++)
	539	{
	540	state.work[i_] = v*state.work[i_];
	541	}
	542	for(i=state.k-state.q; i<=state.k; i++)
	543	{
	544	ic = i%m;
	545	v = 0.0;
	546	for(i_=0; i_<=n-1;i_++)
	547	{
	548	v += state.y[ic,i_]*state.work[i_];
	549	}
	550	vv = state.rho[ic]*(-v+state.theta[ic]);
	551	for(i_=0; i_<=n-1;i_++)
	552	{
	553	state.work[i_] = state.work[i_] + vv*state.s[ic,i_];
	554	}
	555	}
	556	for(i_=0; i_<=n-1;i_++)
	557	{
	558	state.d[i_] = -state.work[i_];
	559	}
	560
	561	//
	562	// Next step
	563	//
	564	state.fold = state.f;
	565	state.k = state.k+1;
	566	state.xupdated = true;
	567	goto lbl_2;
	568	lbl_3:
	569	result = false;
	570	return result;
	571
	572	//
	573	// Saving state
	574	//
	575	lbl_rcomm:
	576	result = true;
	577	state.rstate.ia[0] = n;
	578	state.rstate.ia[1] = m;
	579	state.rstate.ia[2] = maxits;
	580	state.rstate.ia[3] = i;
	581	state.rstate.ia[4] = j;
	582	state.rstate.ia[5] = ic;
	583	state.rstate.ia[6] = mcinfo;
	584	state.rstate.ra[0] = epsf;
	585	state.rstate.ra[1] = epsg;
	586	state.rstate.ra[2] = epsx;
	587	state.rstate.ra[3] = v;
	588	state.rstate.ra[4] = vv;
	589	return result;
	590	}
	591
	592
	593	/*************************************************************************
	594	L-BFGS algorithm results
	595
	596	Called after MinLBFGSIteration returned False.
	597
	598	Input parameters:
	599	State - algorithm state (used by MinLBFGSIteration).
	600
	601	Output parameters:
	602	X - array[0..N-1], solution
	603	Rep - optimization report:
	604	* Rep.TerminationType completetion code:
	605	* -2 rounding errors prevent further improvement.
	606	X contains best point found.
	607	* -1 incorrect parameters were specified
	608	* 1 relative function improvement is no more than
	609	EpsF.
	610	* 2 relative step is no more than EpsX.
	611	* 4 gradient norm is no more than EpsG
	612	* 5 MaxIts steps was taken
	613	* Rep.IterationsCount contains iterations count
	614	* NFEV countains number of function calculations
	615
	616	-- ALGLIB --
	617	Copyright 14.11.2007 by Bochkanov Sergey
	618	*************************************************************************/
	619	public static void minlbfgsresults(ref lbfgsstate state,
	620	ref double[] x,
	621	ref lbfgsreport rep)
	622	{
	623	int i_ = 0;
	624
	625	x = new double[state.n-1+1];
	626	for(i_=0; i_<=state.n-1;i_++)
	627	{
	628	x[i_] = state.x[i_];
	629	}
	630	rep.iterationscount = state.repiterationscount;
	631	rep.nfev = state.repnfev;
	632	rep.terminationtype = state.repterminationtype;
	633	}
	634
	635
	636	/*************************************************************************
	637	THE PURPOSE OF MCSRCH IS TO FIND A STEP WHICH SATISFIES A SUFFICIENT
	638	DECREASE CONDITION AND A CURVATURE CONDITION.
	639
	640	AT EACH STAGE THE SUBROUTINE UPDATES AN INTERVAL OF UNCERTAINTY WITH
	641	ENDPOINTS STX AND STY. THE INTERVAL OF UNCERTAINTY IS INITIALLY CHOSEN
	642	SO THAT IT CONTAINS A MINIMIZER OF THE MODIFIED FUNCTION
	643
	644	F(X+STPS) - F(X) - FTOLSTP*(GRADF(X)'S).
	645
	646	IF A STEP IS OBTAINED FOR WHICH THE MODIFIED FUNCTION HAS A NONPOSITIVE
	647	FUNCTION VALUE AND NONNEGATIVE DERIVATIVE, THEN THE INTERVAL OF
	648	UNCERTAINTY IS CHOSEN SO THAT IT CONTAINS A MINIMIZER OF F(X+STP*S).
	649
	650	THE ALGORITHM IS DESIGNED TO FIND A STEP WHICH SATISFIES THE SUFFICIENT
	651	DECREASE CONDITION
	652
	653	F(X+STPS) .LE. F(X) + FTOLSTP*(GRADF(X)'S),
	654
	655	AND THE CURVATURE CONDITION
	656
	657	ABS(GRADF(X+STPS)'S)) .LE. GTOLABS(GRADF(X)'S).
	658
	659	IF FTOL IS LESS THAN GTOL AND IF, FOR EXAMPLE, THE FUNCTION IS BOUNDED
	660	BELOW, THEN THERE IS ALWAYS A STEP WHICH SATISFIES BOTH CONDITIONS.
	661	IF NO STEP CAN BE FOUND WHICH SATISFIES BOTH CONDITIONS, THEN THE
	662	ALGORITHM USUALLY STOPS WHEN ROUNDING ERRORS PREVENT FURTHER PROGRESS.
	663	IN THIS CASE STP ONLY SATISFIES THE SUFFICIENT DECREASE CONDITION.
	664
	665	PARAMETERS DESCRIPRION
	666
	667	N IS A POSITIVE INTEGER INPUT VARIABLE SET TO THE NUMBER OF VARIABLES.
	668
	669	X IS AN ARRAY OF LENGTH N. ON INPUT IT MUST CONTAIN THE BASE POINT FOR
	670	THE LINE SEARCH. ON OUTPUT IT CONTAINS X+STP*S.
	671
	672	F IS A VARIABLE. ON INPUT IT MUST CONTAIN THE VALUE OF F AT X. ON OUTPUT
	673	IT CONTAINS THE VALUE OF F AT X + STP*S.
	674
	675	G IS AN ARRAY OF LENGTH N. ON INPUT IT MUST CONTAIN THE GRADIENT OF F AT X.
	676	ON OUTPUT IT CONTAINS THE GRADIENT OF F AT X + STP*S.
	677
	678	S IS AN INPUT ARRAY OF LENGTH N WHICH SPECIFIES THE SEARCH DIRECTION.
	679
	680	STP IS A NONNEGATIVE VARIABLE. ON INPUT STP CONTAINS AN INITIAL ESTIMATE
	681	OF A SATISFACTORY STEP. ON OUTPUT STP CONTAINS THE FINAL ESTIMATE.
	682
	683	FTOL AND GTOL ARE NONNEGATIVE INPUT VARIABLES. TERMINATION OCCURS WHEN THE
	684	SUFFICIENT DECREASE CONDITION AND THE DIRECTIONAL DERIVATIVE CONDITION ARE
	685	SATISFIED.
	686
	687	XTOL IS A NONNEGATIVE INPUT VARIABLE. TERMINATION OCCURS WHEN THE RELATIVE
	688	WIDTH OF THE INTERVAL OF UNCERTAINTY IS AT MOST XTOL.
	689
	690	STPMIN AND STPMAX ARE NONNEGATIVE INPUT VARIABLES WHICH SPECIFY LOWER AND
	691	UPPER BOUNDS FOR THE STEP.
	692
	693	MAXFEV IS A POSITIVE INTEGER INPUT VARIABLE. TERMINATION OCCURS WHEN THE
	694	NUMBER OF CALLS TO FCN IS AT LEAST MAXFEV BY THE END OF AN ITERATION.
	695
	696	INFO IS AN INTEGER OUTPUT VARIABLE SET AS FOLLOWS:
	697	INFO = 0 IMPROPER INPUT PARAMETERS.
	698
	699	INFO = 1 THE SUFFICIENT DECREASE CONDITION AND THE
	700	DIRECTIONAL DERIVATIVE CONDITION HOLD.
	701
	702	INFO = 2 RELATIVE WIDTH OF THE INTERVAL OF UNCERTAINTY
	703	IS AT MOST XTOL.
	704
	705	INFO = 3 NUMBER OF CALLS TO FCN HAS REACHED MAXFEV.
	706
	707	INFO = 4 THE STEP IS AT THE LOWER BOUND STPMIN.
	708
	709	INFO = 5 THE STEP IS AT THE UPPER BOUND STPMAX.
	710
	711	INFO = 6 ROUNDING ERRORS PREVENT FURTHER PROGRESS.
	712	THERE MAY NOT BE A STEP WHICH SATISFIES THE
	713	SUFFICIENT DECREASE AND CURVATURE CONDITIONS.
	714	TOLERANCES MAY BE TOO SMALL.
	715
	716	NFEV IS AN INTEGER OUTPUT VARIABLE SET TO THE NUMBER OF CALLS TO FCN.
	717
	718	WA IS A WORK ARRAY OF LENGTH N.
	719
	720	ARGONNE NATIONAL LABORATORY. MINPACK PROJECT. JUNE 1983
	721	JORGE J. MORE', DAVID J. THUENTE
	722	*************************************************************************/
	723	private static void mcsrch(int n,
	724	ref double[] x,
	725	ref double f,
	726	ref double[] g,
	727	ref double[] s,
	728	ref double stp,
	729	ref int info,
	730	ref int nfev,
	731	ref double[] wa,
	732	ref lbfgsstate state,
	733	ref int stage)
	734	{
	735	double v = 0;
	736	double p5 = 0;
	737	double p66 = 0;
	738	double zero = 0;
	739	int i_ = 0;
	740
	741
	742	//
	743	// init
	744	//
	745	p5 = 0.5;
	746	p66 = 0.66;
	747	state.xtrapf = 4.0;
	748	zero = 0;
	749
	750	//
	751	// Main cycle
	752	//
	753	while( true )
	754	{
	755	if( stage==0 )
	756	{
	757
	758	//
	759	// NEXT
	760	//
	761	stage = 2;
	762	continue;
	763	}
	764	if( stage==2 )
	765	{
	766	state.infoc = 1;
	767	info = 0;
	768
	769	//
	770	// CHECK THE INPUT PARAMETERS FOR ERRORS.
	771	//
	772	if( n<=0 \| (double)(stp)<=(double)(0) \| (double)(ftol)<(double)(0) \| (double)(gtol)<(double)(zero) \| (double)(xtol)<(double)(zero) \| (double)(stpmin)<(double)(zero) \| (double)(stpmax)<(double)(stpmin) \| maxfev<=0 )
	773	{
	774	stage = 0;
	775	return;
	776	}
	777
	778	//
	779	// COMPUTE THE INITIAL GRADIENT IN THE SEARCH DIRECTION
	780	// AND CHECK THAT S IS A DESCENT DIRECTION.
	781	//
	782	v = 0.0;
	783	for(i_=0; i_<=n-1;i_++)
	784	{
	785	v += g[i_]*s[i_];
	786	}
	787	state.dginit = v;
	788	if( (double)(state.dginit)>=(double)(0) )
	789	{
	790	stage = 0;
	791	return;
	792	}
	793
	794	//
	795	// INITIALIZE LOCAL VARIABLES.
	796	//
	797	state.brackt = false;
	798	state.stage1 = true;
	799	nfev = 0;
	800	state.finit = f;
	801	state.dgtest = ftol*state.dginit;
	802	state.width = stpmax-stpmin;
	803	state.width1 = state.width/p5;
	804	for(i_=0; i_<=n-1;i_++)
	805	{
	806	wa[i_] = x[i_];
	807	}
	808
	809	//
	810	// THE VARIABLES STX, FX, DGX CONTAIN THE VALUES OF THE STEP,
	811	// FUNCTION, AND DIRECTIONAL DERIVATIVE AT THE BEST STEP.
	812	// THE VARIABLES STY, FY, DGY CONTAIN THE VALUE OF THE STEP,
	813	// FUNCTION, AND DERIVATIVE AT THE OTHER ENDPOINT OF
	814	// THE INTERVAL OF UNCERTAINTY.
	815	// THE VARIABLES STP, F, DG CONTAIN THE VALUES OF THE STEP,
	816	// FUNCTION, AND DERIVATIVE AT THE CURRENT STEP.
	817	//
	818	state.stx = 0;
	819	state.fx = state.finit;
	820	state.dgx = state.dginit;
	821	state.sty = 0;
	822	state.fy = state.finit;
	823	state.dgy = state.dginit;
	824
	825	//
	826	// NEXT
	827	//
	828	stage = 3;
	829	continue;
	830	}
	831	if( stage==3 )
	832	{
	833
	834	//
	835	// START OF ITERATION.
	836	//
	837	// SET THE MINIMUM AND MAXIMUM STEPS TO CORRESPOND
	838	// TO THE PRESENT INTERVAL OF UNCERTAINTY.
	839	//
	840	if( state.brackt )
	841	{
	842	if( (double)(state.stx)<(double)(state.sty) )
	843	{
	844	state.stmin = state.stx;
	845	state.stmax = state.sty;
	846	}
	847	else
	848	{
	849	state.stmin = state.sty;
	850	state.stmax = state.stx;
	851	}
	852	}
	853	else
	854	{
	855	state.stmin = state.stx;
	856	state.stmax = stp+state.xtrapf*(stp-state.stx);
	857	}
	858
	859	//
	860	// FORCE THE STEP TO BE WITHIN THE BOUNDS STPMAX AND STPMIN.
	861	//
	862	if( (double)(stp)>(double)(stpmax) )
	863	{
	864	stp = stpmax;
	865	}
	866	if( (double)(stp)<(double)(stpmin) )
	867	{
	868	stp = stpmin;
	869	}
	870
	871	//
	872	// IF AN UNUSUAL TERMINATION IS TO OCCUR THEN LET
	873	// STP BE THE LOWEST POINT OBTAINED SO FAR.
	874	//
	875	if( state.brackt & ((double)(stp)<=(double)(state.stmin) \| (double)(stp)>=(double)(state.stmax)) \| nfev>=maxfev-1 \| state.infoc==0 \| state.brackt & (double)(state.stmax-state.stmin)<=(double)(xtol*state.stmax) )
	876	{
	877	stp = state.stx;
	878	}
	879
	880	//
	881	// EVALUATE THE FUNCTION AND GRADIENT AT STP
	882	// AND COMPUTE THE DIRECTIONAL DERIVATIVE.
	883	//
	884	for(i_=0; i_<=n-1;i_++)
	885	{
	886	x[i_] = wa[i_];
	887	}
	888	for(i_=0; i_<=n-1;i_++)
	889	{
	890	x[i_] = x[i_] + stp*s[i_];
	891	}
	892
	893	//
	894	// NEXT
	895	//
	896	stage = 4;
	897	return;
	898	}
	899	if( stage==4 )
	900	{
	901	info = 0;
	902	nfev = nfev+1;
	903	v = 0.0;
	904	for(i_=0; i_<=n-1;i_++)
	905	{
	906	v += g[i_]*s[i_];
	907	}
	908	state.dg = v;
	909	state.ftest1 = state.finit+stp*state.dgtest;
	910
	911	//
	912	// TEST FOR CONVERGENCE.
	913	//
	914	if( state.brackt & ((double)(stp)<=(double)(state.stmin) \| (double)(stp)>=(double)(state.stmax)) \| state.infoc==0 )
	915	{
	916	info = 6;
	917	}
	918	if( (double)(stp)==(double)(stpmax) & (double)(f)<=(double)(state.ftest1) & (double)(state.dg)<=(double)(state.dgtest) )
	919	{
	920	info = 5;
	921	}
	922	if( (double)(stp)==(double)(stpmin) & ((double)(f)>(double)(state.ftest1) \| (double)(state.dg)>=(double)(state.dgtest)) )
	923	{
	924	info = 4;
	925	}
	926	if( nfev>=maxfev )
	927	{
	928	info = 3;
	929	}
	930	if( state.brackt & (double)(state.stmax-state.stmin)<=(double)(xtol*state.stmax) )
	931	{
	932	info = 2;
	933	}
	934	if( (double)(f)<=(double)(state.ftest1) & (double)(Math.Abs(state.dg))<=(double)(-(gtol*state.dginit)) )
	935	{
	936	info = 1;
	937	}
	938
	939	//
	940	// CHECK FOR TERMINATION.
	941	//
	942	if( info!=0 )
	943	{
	944	stage = 0;
	945	return;
	946	}
	947
	948	//
	949	// IN THE FIRST STAGE WE SEEK A STEP FOR WHICH THE MODIFIED
	950	// FUNCTION HAS A NONPOSITIVE VALUE AND NONNEGATIVE DERIVATIVE.
	951	//
	952	if( state.stage1 & (double)(f)<=(double)(state.ftest1) & (double)(state.dg)>=(double)(Math.Min(ftol, gtol)*state.dginit) )
	953	{
	954	state.stage1 = false;
	955	}
	956
	957	//
	958	// A MODIFIED FUNCTION IS USED TO PREDICT THE STEP ONLY IF
	959	// WE HAVE NOT OBTAINED A STEP FOR WHICH THE MODIFIED
	960	// FUNCTION HAS A NONPOSITIVE FUNCTION VALUE AND NONNEGATIVE
	961	// DERIVATIVE, AND IF A LOWER FUNCTION VALUE HAS BEEN
	962	// OBTAINED BUT THE DECREASE IS NOT SUFFICIENT.
	963	//
	964	if( state.stage1 & (double)(f)<=(double)(state.fx) & (double)(f)>(double)(state.ftest1) )
	965	{
	966
	967	//
	968	// DEFINE THE MODIFIED FUNCTION AND DERIVATIVE VALUES.
	969	//
	970	state.fm = f-stp*state.dgtest;
	971	state.fxm = state.fx-state.stx*state.dgtest;
	972	state.fym = state.fy-state.sty*state.dgtest;
	973	state.dgm = state.dg-state.dgtest;
	974	state.dgxm = state.dgx-state.dgtest;
	975	state.dgym = state.dgy-state.dgtest;
	976
	977	//
	978	// CALL CSTEP TO UPDATE THE INTERVAL OF UNCERTAINTY
	979	// AND TO COMPUTE THE NEW STEP.
	980	//
	981	mcstep(ref state.stx, ref state.fxm, ref state.dgxm, ref state.sty, ref state.fym, ref state.dgym, ref stp, state.fm, state.dgm, ref state.brackt, state.stmin, state.stmax, ref state.infoc);
	982
	983	//
	984	// RESET THE FUNCTION AND GRADIENT VALUES FOR F.
	985	//
	986	state.fx = state.fxm+state.stx*state.dgtest;
	987	state.fy = state.fym+state.sty*state.dgtest;
	988	state.dgx = state.dgxm+state.dgtest;
	989	state.dgy = state.dgym+state.dgtest;
	990	}
	991	else
	992	{
	993
	994	//
	995	// CALL MCSTEP TO UPDATE THE INTERVAL OF UNCERTAINTY
	996	// AND TO COMPUTE THE NEW STEP.
	997	//
	998	mcstep(ref state.stx, ref state.fx, ref state.dgx, ref state.sty, ref state.fy, ref state.dgy, ref stp, f, state.dg, ref state.brackt, state.stmin, state.stmax, ref state.infoc);
	999	}
	1000
	1001	//
	1002	// FORCE A SUFFICIENT DECREASE IN THE SIZE OF THE
	1003	// INTERVAL OF UNCERTAINTY.
	1004	//
	1005	if( state.brackt )
	1006	{
	1007	if( (double)(Math.Abs(state.sty-state.stx))>=(double)(p66*state.width1) )
	1008	{
	1009	stp = state.stx+p5*(state.sty-state.stx);
	1010	}
	1011	state.width1 = state.width;
	1012	state.width = Math.Abs(state.sty-state.stx);
	1013	}
	1014
	1015	//
	1016	// NEXT.
	1017	//
	1018	stage = 3;
	1019	continue;
	1020	}
	1021	}
	1022	}
	1023
	1024
	1025	private static void mcstep(ref double stx,
	1026	ref double fx,
	1027	ref double dx,
	1028	ref double sty,
	1029	ref double fy,
	1030	ref double dy,
	1031	ref double stp,
	1032	double fp,
	1033	double dp,
	1034	ref bool brackt,
	1035	double stmin,
	1036	double stmax,
	1037	ref int info)
	1038	{
	1039	bool bound = new bool();
	1040	double gamma = 0;
	1041	double p = 0;
	1042	double q = 0;
	1043	double r = 0;
	1044	double s = 0;
	1045	double sgnd = 0;
	1046	double stpc = 0;
	1047	double stpf = 0;
	1048	double stpq = 0;
	1049	double theta = 0;
	1050
	1051	info = 0;
	1052
	1053	//
	1054	// CHECK THE INPUT PARAMETERS FOR ERRORS.
	1055	//
	1056	if( brackt & ((double)(stp)<=(double)(Math.Min(stx, sty)) \| (double)(stp)>=(double)(Math.Max(stx, sty))) \| (double)(dx*(stp-stx))>=(double)(0) \| (double)(stmax)<(double)(stmin) )
	1057	{
	1058	return;
	1059	}
	1060
	1061	//
	1062	// DETERMINE IF THE DERIVATIVES HAVE OPPOSITE SIGN.
	1063	//
	1064	sgnd = dp*(dx/Math.Abs(dx));
	1065
	1066	//
	1067	// FIRST CASE. A HIGHER FUNCTION VALUE.
	1068	// THE MINIMUM IS BRACKETED. IF THE CUBIC STEP IS CLOSER
	1069	// TO STX THAN THE QUADRATIC STEP, THE CUBIC STEP IS TAKEN,
	1070	// ELSE THE AVERAGE OF THE CUBIC AND QUADRATIC STEPS IS TAKEN.
	1071	//
	1072	if( (double)(fp)>(double)(fx) )
	1073	{
	1074	info = 1;
	1075	bound = true;
	1076	theta = 3*(fx-fp)/(stp-stx)+dx+dp;
	1077	s = Math.Max(Math.Abs(theta), Math.Max(Math.Abs(dx), Math.Abs(dp)));
	1078	gamma = sMath.Sqrt(AP.Math.Sqr(theta/s)-dx/s(dp/s));
	1079	if( (double)(stp)<(double)(stx) )
	1080	{
	1081	gamma = -gamma;
	1082	}
	1083	p = gamma-dx+theta;
	1084	q = gamma-dx+gamma+dp;
	1085	r = p/q;
	1086	stpc = stx+r*(stp-stx);
	1087	stpq = stx+dx/((fx-fp)/(stp-stx)+dx)/2*(stp-stx);
	1088	if( (double)(Math.Abs(stpc-stx))<(double)(Math.Abs(stpq-stx)) )
	1089	{
	1090	stpf = stpc;
	1091	}
	1092	else
	1093	{
	1094	stpf = stpc+(stpq-stpc)/2;
	1095	}
	1096	brackt = true;
	1097	}
	1098	else
	1099	{
	1100	if( (double)(sgnd)<(double)(0) )
	1101	{
	1102
	1103	//
	1104	// SECOND CASE. A LOWER FUNCTION VALUE AND DERIVATIVES OF
	1105	// OPPOSITE SIGN. THE MINIMUM IS BRACKETED. IF THE CUBIC
	1106	// STEP IS CLOSER TO STX THAN THE QUADRATIC (SECANT) STEP,
	1107	// THE CUBIC STEP IS TAKEN, ELSE THE QUADRATIC STEP IS TAKEN.
	1108	//
	1109	info = 2;
	1110	bound = false;
	1111	theta = 3*(fx-fp)/(stp-stx)+dx+dp;
	1112	s = Math.Max(Math.Abs(theta), Math.Max(Math.Abs(dx), Math.Abs(dp)));
	1113	gamma = sMath.Sqrt(AP.Math.Sqr(theta/s)-dx/s(dp/s));
	1114	if( (double)(stp)>(double)(stx) )
	1115	{
	1116	gamma = -gamma;
	1117	}
	1118	p = gamma-dp+theta;
	1119	q = gamma-dp+gamma+dx;
	1120	r = p/q;
	1121	stpc = stp+r*(stx-stp);
	1122	stpq = stp+dp/(dp-dx)*(stx-stp);
	1123	if( (double)(Math.Abs(stpc-stp))>(double)(Math.Abs(stpq-stp)) )
	1124	{
	1125	stpf = stpc;
	1126	}
	1127	else
	1128	{
	1129	stpf = stpq;
	1130	}
	1131	brackt = true;
	1132	}
	1133	else
	1134	{
	1135	if( (double)(Math.Abs(dp))<(double)(Math.Abs(dx)) )
	1136	{
	1137
	1138	//
	1139	// THIRD CASE. A LOWER FUNCTION VALUE, DERIVATIVES OF THE
	1140	// SAME SIGN, AND THE MAGNITUDE OF THE DERIVATIVE DECREASES.
	1141	// THE CUBIC STEP IS ONLY USED IF THE CUBIC TENDS TO INFINITY
	1142	// IN THE DIRECTION OF THE STEP OR IF THE MINIMUM OF THE CUBIC
	1143	// IS BEYOND STP. OTHERWISE THE CUBIC STEP IS DEFINED TO BE
	1144	// EITHER STPMIN OR STPMAX. THE QUADRATIC (SECANT) STEP IS ALSO
	1145	// COMPUTED AND IF THE MINIMUM IS BRACKETED THEN THE THE STEP
	1146	// CLOSEST TO STX IS TAKEN, ELSE THE STEP FARTHEST AWAY IS TAKEN.
	1147	//
	1148	info = 3;
	1149	bound = true;
	1150	theta = 3*(fx-fp)/(stp-stx)+dx+dp;
	1151	s = Math.Max(Math.Abs(theta), Math.Max(Math.Abs(dx), Math.Abs(dp)));
	1152
	1153	//
	1154	// THE CASE GAMMA = 0 ONLY ARISES IF THE CUBIC DOES NOT TEND
	1155	// TO INFINITY IN THE DIRECTION OF THE STEP.
	1156	//
	1157	gamma = sMath.Sqrt(Math.Max(0, AP.Math.Sqr(theta/s)-dx/s(dp/s)));
	1158	if( (double)(stp)>(double)(stx) )
	1159	{
	1160	gamma = -gamma;
	1161	}
	1162	p = gamma-dp+theta;
	1163	q = gamma+(dx-dp)+gamma;
	1164	r = p/q;
	1165	if( (double)(r)<(double)(0) & (double)(gamma)!=(double)(0) )
	1166	{
	1167	stpc = stp+r*(stx-stp);
	1168	}
	1169	else
	1170	{
	1171	if( (double)(stp)>(double)(stx) )
	1172	{
	1173	stpc = stmax;
	1174	}
	1175	else
	1176	{
	1177	stpc = stmin;
	1178	}
	1179	}
	1180	stpq = stp+dp/(dp-dx)*(stx-stp);
	1181	if( brackt )
	1182	{
	1183	if( (double)(Math.Abs(stp-stpc))<(double)(Math.Abs(stp-stpq)) )
	1184	{
	1185	stpf = stpc;
	1186	}
	1187	else
	1188	{
	1189	stpf = stpq;
	1190	}
	1191	}
	1192	else
	1193	{
	1194	if( (double)(Math.Abs(stp-stpc))>(double)(Math.Abs(stp-stpq)) )
	1195	{
	1196	stpf = stpc;
	1197	}
	1198	else
	1199	{
	1200	stpf = stpq;
	1201	}
	1202	}
	1203	}
	1204	else
	1205	{
	1206
	1207	//
	1208	// FOURTH CASE. A LOWER FUNCTION VALUE, DERIVATIVES OF THE
	1209	// SAME SIGN, AND THE MAGNITUDE OF THE DERIVATIVE DOES
	1210	// NOT DECREASE. IF THE MINIMUM IS NOT BRACKETED, THE STEP
	1211	// IS EITHER STPMIN OR STPMAX, ELSE THE CUBIC STEP IS TAKEN.
	1212	//
	1213	info = 4;
	1214	bound = false;
	1215	if( brackt )
	1216	{
	1217	theta = 3*(fp-fy)/(sty-stp)+dy+dp;
	1218	s = Math.Max(Math.Abs(theta), Math.Max(Math.Abs(dy), Math.Abs(dp)));
	1219	gamma = sMath.Sqrt(AP.Math.Sqr(theta/s)-dy/s(dp/s));
	1220	if( (double)(stp)>(double)(sty) )
	1221	{
	1222	gamma = -gamma;
	1223	}
	1224	p = gamma-dp+theta;
	1225	q = gamma-dp+gamma+dy;
	1226	r = p/q;
	1227	stpc = stp+r*(sty-stp);
	1228	stpf = stpc;
	1229	}
	1230	else
	1231	{
	1232	if( (double)(stp)>(double)(stx) )
	1233	{
	1234	stpf = stmax;
	1235	}
	1236	else
	1237	{
	1238	stpf = stmin;
	1239	}
	1240	}
	1241	}
	1242	}
	1243	}
	1244
	1245	//
	1246	// UPDATE THE INTERVAL OF UNCERTAINTY. THIS UPDATE DOES NOT
	1247	// DEPEND ON THE NEW STEP OR THE CASE ANALYSIS ABOVE.
	1248	//
	1249	if( (double)(fp)>(double)(fx) )
	1250	{
	1251	sty = stp;
	1252	fy = fp;
	1253	dy = dp;
	1254	}
	1255	else
	1256	{
	1257	if( (double)(sgnd)<(double)(0.0) )
	1258	{
	1259	sty = stx;
	1260	fy = fx;
	1261	dy = dx;
	1262	}
	1263	stx = stp;
	1264	fx = fp;
	1265	dx = dp;
	1266	}
	1267
	1268	//
	1269	// COMPUTE THE NEW STEP AND SAFEGUARD IT.
	1270	//
	1271	stpf = Math.Min(stmax, stpf);
	1272	stpf = Math.Max(stmin, stpf);
	1273	stp = stpf;
	1274	if( brackt & bound )
	1275	{
	1276	if( (double)(sty)>(double)(stx) )
	1277	{
	1278	stp = Math.Min(stx+0.66*(sty-stx), stp);
	1279	}
	1280	else
	1281	{
	1282	stp = Math.Max(stx+0.66*(sty-stx), stp);
	1283	}
	1284	}
	1285	}
	1286	}
	1287	}

Note: See TracBrowser for help on using the repository browser.

Download in other formats:

Update cookies preferences