Lieven Smits
inhoud

Hoofdstuk 3. Het Feynman-Kac-Itô-formalisme

3.1 Motivatie

In het Feynman-Kac-formalisme werd de propagator e-t(H0+V) uitgedrukt in functie van de Wienerintegraal van de Brownse brug:

(exp(-t(H0+V))f)(x)=int exp(-int_0^t V(omega(s))ds)f(y)d mu_0,t;y,x(omega) dy

We willen een soortgelijke formule bekomen voor een bredere klasse Hamiltonianen, nl. van de vorm

H(A) = (1/2)(-iÑ-A)2 + V

waar A een vectorveld is. Een dergelijke Hamiltoniaan beschrijft de evolutie van een deeltje onder invloed van een scalaire potentiaal V en een magnetische vectorpotentiaal A.

We zullen eerst het geval beschouwen waarin A een onbeperkt differentieerbare functie is waarvan alle afgeleiden willekeurig klein worden buiten een geschikte compacte verzameling punten. Voorts zullen we eerst een tussenresultaat met V = 0 formuleren (stelling 3.11) om een idee te krijgen van wat er precies met het magneetveld gebeurt. De specifieke moeilijkheid bestaat erin, een goede vervanger te vinden voor de integraal van A.v langs een niet-differentieerbaar pad, waar v in het differentieerbare geval de snelheid voorstelde.

3.2 Een benaderde integraalkern

Laten we eens de suggestie van Feynman volgen, de actie te berekenen die overeenkomt met een éénparig rechtlijnige beweging van x naar y die een tijd s/i (i de imaginaire eenheid).

We proberen dus

Ks(x,y)  =  (normalisatiefactor).e-S(s,x,y)
   =  (2ps)-n/2 e-||x-y||2/2s + i(A(x)+A(y)).(x-y)/2

waarbij, zoals aangekondigd, V = 0 gekozen werd, en s.(A(x)+A(y))/2 als een goede benadering voor de integraal van A(x(s)) voor s tussen 0 en s gezien werd.

Het volgende lemma toont aan dat de integraaloperatoren Qs met kernen Ks(x,y) 'lijken' op de halfgroep voortgebracht door H(A).

3.3 Lemma

Zij A:Ân®Ân tweemaal differentieerbaar en laat A en zijn eerste afgeleiden willekeurig klein worden buiten een geschikt compact deel van Ân.

Definieer, voor s ³ 0, Ks:Ân ´ Ân ® C: (x,y® (2ps)-n/2 e-||x-y||2/2s + i(A(x)+A(y)).(x-y)/2

Zij Qs de integraaloperator in L2(Ân) met kern Ks:

(Q_s f)(x) := int K_s(x,y)f(y)dy

Dan is Qs een begrensde operator met norm hoogstens 1 en bovendien is voor elke f Î D(H0) = {fÎL2;Ñf,DfÎL2}:

lim s->0 (d/ds)(Q_s f) = -H_0(A)f = (-1/2)(-i nabla - A)^2 f

bewijs

Zij Ps(x,y) := (2ps)-n/2 e-||x-y||2/2s de integraalkern voor e-sH0. De invloed van het magnetische veld doet zich slechts voelen als een faseverschuiving: |Ks(x,y)| = Ps(x,y) en dus:

|(Q_s f)(x)| <= (exp(-sH_0)|f|)(x)

Hieruit volgt dat ||Qs||2 £ ||e-sH0||2 £ 1 (de laatste ongelijkheid was lemma 2.3.2).

De rest van het bewijs is een rechtstreekse berekening, die enigszins ingekort kan worden door op te merken dat voor elk paar functies f en h:

Delta(exp(ih)f) = exp(ih)(-(nabla h)^2 f + 2i nabla h nabla f + i(Delta h)f + Delta f)

Verder is voor ieder tweemaal differentieerbaar vectorveld A:

Delta_y((1/2)(A(x)+A(y)).(x-y)) = (1/2)(Delta A).(x-y) - (div A)(y)

Nu kan de bewuste afgeleide uitgerekend worden.

(d/ds)(Q_s f)(x) = int((1/2)Delta y P_s(x,y))exp((i/2)(A(x)+A(y))(x-y))f(y)dy

De volgende stap wordt voor tweemaal differentieerbare f bekomen door partiële integratie. Als de afgeleiden van f slechts in distributiezin bestaan, is hij een rechtstreeks gevolg van de definitie van distributie-afgeleiden.

wat de berekening voltooit.

////

Nu we de werking van H0(A) onder controle beginnen te krijgen, is het mogelijk een resultaat te bewijzen dat sterk doet denken aan de productformule van Lie-Trotter. Ook het bewijs is ermee analoog. In feite zijn beide resultaten slechts bijzondere gevallen van een stelling van Chernoff. De bewering is de volgende.

3.4 Stelling

Met A en Qs zoals in het vorige lemma is

s-limn®¥(Qt/n)n = e-tH0(A).

bewijs

Zij D de Banachruimte D(H0) met norm |||f||| = ||H0(A)f||2 + ||f||2. Noteer St voor de halfgroep e-tH0(A). Het vorige lemma geeft dat

limn®¥ ||n(St/n - Qt/n)f||2  =  t.lims®0 ||(Ss - Qs)f/s||2
   =  t.lims®0 ||(Ssf - f)/s - (Qsf - f)/s||2
   =  t.lims®0 ||-H0(A)f + H0(A)f||2
   =  0.

Beschouw de familie {n(St/n - Qt/n);nÎN} begrensde operatoren van D naar L2(Ân). We hebben zojuist aangetoond dat deze aan de voorwaarden van Lemma 2.3.2 voldoet en dus is voor ieder compact deel K van D:

limn®¥ supfÎK ||n(St/n - Qt/n)f||2 = 0.

De stelling wordt nu bewezen door K = {Ssf;0£s£t} te kiezen voor een willekeurige gegeven f Î D. Dit is het continue beeld in D van het compacte interval [0,t].

Dan blijkt dat

||(Q_t/n^n - S_t)f||_2 -> 0

Voor willekeurige f Î L2(Ân) en t ³ 0 gaat men tenslotte als volgt te werk. Zij e > 0 gegeven. Kies f0 Î D zodat ||St(f-f0||2 £ e/3 en ||f-f0||2 £ e/3. Kies n0 Î N zodat voor n ³ n0: ||(Qt/nn - St)f0||2 £ e/3.

Dan is

||(Qt/nn - St)f||2  £  ||(Qt/nn - St)f0||2 + ||Qt/nn...||.||f-f0||2 + ||St(f-f0||2
   £  e.

De willekeur van e bewijst de stelling.

////

3.5 Stochastische integralen

We zullen nu trachten het effect van e-tH0(A) te beschrijven als een padintegraal, steunend op de vorige stelling.

(exp(-tH_0(A))g)(x) = L^2-lim van een n-voudige nu-dimensionale integraal

(waar xn = x).

Beschouw de coördinaten xn, xn-1,...,x0 nu als posities van een Brownse beweging op tijdstip 0, t/n,...,t:

(...) = L2-limn®¥Ex[g(b(t))eFn(b)], waar

F_n(b) = i som(k=0 tot n-1)(A(b(kt/n))+A(b((k+1)t/n)))/2 (b(kt/n)-b((k+1)t/n))

Het blijkt dus nuttig te zijn de uitdrukking limn®¥Fn(b) te bestuderen. Deze heeft, op de factor i na, de vorm van een Riemann-Stieltjes-integraal

'int_s=0^t A(b(s))db(s)'

nochtans is voor Brownse beweging bijna geen enkel pad ergens differentieerbaar (zie bijvoorbeeld [Hida1] p. 52), zodat we aangewezen zijn op de beschrijving door middel van stochastische integralen.

Precies dezelfde argumenten kunnen aangevoerd worden om de stochastische integraal t.o.v. het Wienerproces in te voeren, dit om de L2-operatoren te bestuderen via hun matrixelementen (f,e-tHg), waar f en g kwadratisch integreerbare functies (al dan niet lid van een of andere orthogonale basis) zijn.

3.6 Stelling

Zij b een n-dimensionale Brownse beweging, f:Ân®Ân continu differentieerbaar met f en f' begrensd.

Dan bestaat de volgende limiet in de zin van L2(Db):

int f(b).db = limiet van partieelsommen

en bovendien is

E^0[kwadraat van de stoch.integraal] = E^0[gewone integraal van f^2]

bewijs

Stel

qn,m := f(b((m-1)/2n))(b(m/2n) - b((m-1)/2n))

Jn := Sm=1..2n qn,m

Voor i ¹ j is E0[qn,iqn,j] = 0. Immers, neem bijvoorbeeld j > i:

schrijf de q's uit en splits het gedeelte b(j/2^n)-b((j-1)/2^n) af

Verder is

E^0[q_n,m^2]=E^0[f^2(b((m-1)/2^n))]/2^n

Samen geeft dit

E^0[J_n^2]=som(m=1..2^n)(1/2^n)E^0[f^2(b((m-1)/2^n))]

Deze laatste uitdrukking convergeert met stijgende n als Riemannsom naar

int_0^1 f^2(b(s))ds

wegens de continuïteit van b en f. Bovendien is de convergentie stochastisch gedomineerd door ||f||¥2.

We tonen nu aan dat de rij (Jn)n een Cauchyrij is in L2(Db) en dus convergeert naar een kwadratisch integreerbare stochastische variabele:

werk de kwadraatnorm van J_n+1 - J_n uit en begrens door het supremum van f'^2

De limiet in kwestie bestaat dus. Bovendien is

limiet van de normen is norm van de limiet

////

3.7 Definitie van de stochastische integraal voor Brownse beweging en continu differentieerbare vectorvelden

Voorgaande stelling kan vrijwel letterlijk herschreven worden om het bestaan aan te tonen van

int_s^t f(b)db = lim_n som(s < m/2^n <= t) f(b((m-1)/2^n))(b(m/2^n)-b((m-1)/2^n))

voor diadische s en t, 0 £ s < t. Slechts het bereik van de sommatie-indices moet aangepast worden. Bovendien geldt dat de som der stochastische integralen van s tot u en van u tot t gelijk is aan de stochastische integraal van s tot t, en dit laatste object is L2-continu in s en t:

E^0[integraal van t-eps/2 tot t+eps/2] <= (ess.sup |f|)^2 . eps

Deze laatste eigenschap laat toe de definitie te veralgemenen tot willekeurige s en t ³ 0 en te verifiëren dat nog steeds

kwadratische verwachting van de stoch. integraal is verwachting van de
tijdsintegraal van f^2(b(s))

Paragraaf 3.5 suggereerde dat we een stochastische integraal nodig hebben ten opzichte van de Wienermaat, net zozeer als ten opzichte van de Brownse beweging. Daarom herformuleren we stelling 3.6 in volgend

3.8 Corollarium

Zij w een n-dimensionaal Wienerproces, f:Ân®Ân kwadratisch integreerbaar en continu differentieerbaar met f en f' begrensd.

Dan bestaat de L2(dm0)-limiet

int_0^1 f(omega)d omega = lim_n som(m=1..2^n) f(omega((m-1)/2^n))(omega(m/2^n)-omega((m-1)/2^n))

en bovendien is

E[(int_0^1 f(om)d om)^2] = E[int_0^1 f^2(om(s))ds] = int f^2(x) d^nu x

(met E de verwachtingswaarde t.o.v. de Wienermaat)

bewijs

Behalve de laatste gelijkheid is dit identiek met het bewijs van stelling 3.6, waar overal b door w vervangen wordt. De laatste gelijkheid volgt uit het feit dat w(s) de verdeling van de Lebesguemaat heeft.

////

De stochastische limietvariabele heet de Itô-integraal van de vectorwaardige functie f.

3.9 Uitbreiding tot willekeurige lokaal kwadratisch integreerbare vectorpotentialen

De Itô-integraal zoals hij reeds besproken werd, bepaalt een isometrie

L2(Ân) Ç C1(Ân) Ç {f en f' begrensd} ® L2(W)

waarbij links en rechts de L2-metriek werd gekozen. Het domein van deze isometrie is metrisch onvolledig en kan dus op canonieke wijze vervolledigd worden. Expliciet: iedere kwadratisch integreerbare vectorwaardige functie is de L2-limiet van een rij functies waarvoor de Itô-integraal gedefinieerd is. De Itô-integralen van deze functies vormen een Cauchyrij in L2(W), waarvan de limiet dan de Itô-integraal van de oorspronkelijke functie wordt genoemd. Men ziet gemakkelijk dat het resultaat van deze constructie onafhankelijk is van de gekozen rij.

Tenslotte breiden we de definitie van de Itô-integraal nog uit tot lokaal kwadratisch integreerbare vectorfuncties. Zij f Î L2loc(Ân) en noteer met B(0,R) de gesloten bol met straal R omheen de oorsprong. Voor bijna alle w Î W bestaat de limiet

lim_R->oo int_0^1 1_B(0,R)(om) f(om) d om

want {w(s);0 £ s £1} is compact. Deze laatste puntsgewijze limiet nemen we nu aan als standaarddefinitie van de Itô-integraal.

Opmerking

De Itô-integraal zoals hij hier gedefinieerd werd, is een functieklasse, op m0-equivalentie na, van W naar Â. Itô zelf heeft echter een puntsgewijze definitie gegeven voor een veel ruimere klasse integranda, nl. de zogenaamde nonanticipating functionals, i.h.b. dus voor functies die afhangen van het gekozen pad. Hoewel Itô's definitie iets meer inleiding vraagt, geeft zij meteen een aantal handige eigenschappen van de stochastische integraal cadeau, zoals bijvoorbeeld continuïteit in de bovengrens (bij ons lemma 3.14).

[McKean1] presenteert deze definitie op een erg overzichtelijke wijze.

3.10 Het Feynman-Kac-Itô-formalisme

We hebben nu in bepaalde gevallen het bestaan van de limiet in paragraaf 3.5 geverifieerd, in andere gevallen hebben we een analoog begrip gedefinieerd. Alvorens 3.5 als een stelling te herformuleren, geven we nog een lemma dat de sprongen van de Brownse beweging in toom houdt. Dit zal nodig zijn om later met middelwaarden van afgeleiden te kunnen rekenen.

Lemma

Definieer voor een gegeven Brownse beweging b en een exponent a > 2, en voor elk positief natuurlijk getal n:

f(b;n,alfa):=som(k=1..2^n)||b(k/2^n)-b((k-1)/2^n)||^alfa

Dan convergeert f(b;n,a) P0-bijna zeker én in elke Lp-norm (1 < p < ¥) naar 0.

bewijs

De notaties zijn eenvoudiger voor ééndimensionale beweging, en dit houdt geen beperking in van de draagwijdte van de redenering.

We voeren eerst drie symbolen in.

Zij d(n,a,k) := |b(k/2n) - b((k-1)/2n)|a   (1 £ k < 2n). Dan is

D(n,alfa):=E^0[d(n,alfa,k)]=2^(-n alfa/2)/sqrt(2 pi) int_R |x|^alfa exp(-x^2/2)dx

Noteer tenslotte

c_alfa := 1/sqrt(2 pi) int_R |x|^alfa exp(-x^2/2)dx

Wegens de onafhankelijke toenamen van de Brownse beweging is

E^0[(sum(k=1..2^n)(d(n,alfa,k)-D(n,alfa))r)^2]

(de producttermen hebben immers verwachting nul).

Vervang nu het gemiddelde D(n,a) door een slechtere kwadratische schatting, namelijk 0:

(...) <= sum(k=1..2^n) E^0[d(n,alfa,k)^2]

Deze laatste uitdrukking kan berekend worden:

E0[d(n,a,k)2] = 2-nac2a

Samengevat luidt de zojuist bewezen ongelijkheid

E0[|f(b;n,a) - 2n(1-a/2)ca|2] £ 2n(1-a)c2a

Tenslotte is

P0(|f(b;n,a)| > 2e)  £  P0(|f(b;n,a) - 2n(1-a/2)ca| > 2n(1-a)ca)
(voor e > 0 willekeurig en n zo groot dat 2n(1-a/2)ca < e)
   £  E0[|f(b;n,a)-2n(1-a/2)ca|2](2n(1-a/2)ca)2
   £  c2aca22n[(1-a)+2(1-a/2)]

en dit is de algemene term van een sommeerbare reeks in n. Wegens het eerste lemma van Borel-Cantelli is dan

P(lim supn®¥ f(b;n,a) > 2e) = 0.

De Lp-convergentie volgt uit de driehoeksongelijkheid voor deze norm:

p-norm van f(b;n,alfa) is hoogstens som(k=1..2^n) p-norm van b(k/2^n)-b((k-1)/2^n) en dit convergeert naar 0 voor n->infty

////

3.11 Stelling

Voor een vectorpotentiaal A Î C2(Ân) waarvoor de waarden van de functie en die van al haar eerste en tweede afgeleiden begrensd zijn, en voor een scalaire potentiaal V = 0 geldt het Feynman-Kac-Itô-formalisme, dat we hier in zijn algemene vorm geven:

(e-tHg)(x) = Ex[eF(b,t)g(b(t))]   (g Î L2(Ân), x Î Ân)

waar F(b,t) in het algemeen wordt gegeven door

-i int_0^t A(b).db -(i/2) int_0^t (div a)(b(s))ds - int_0^t V(b(s))ds

bewijs

Uit paragraaf 3.5 weten we dat (e-tH(A)g)(x) als functie van x de L2-limiet voor stijgende n is van Ex[eFn(b,t)g(b,t)], waar

F_n(b,t) = i som(k=0..n-1)(A(b(kt/n))+A(b((k+1)t/n)))/2 (b(kt/n) - b((k+1)t/n)

We zullen bewijzen dat hiervan een deelrij puntsgewijs in x convergeert naar Ex[eF(b,t)g(b,t)]. Dit impliceert dan meteen L2(Ân)-convergentie voor de hele rij naar de gewenste limiet.

Omdat iFn zuiver imaginair is, volstaat het aan te tonen dat voor een deelrij indices k(n):

F_k(n)(b,t) -> F(b,t)

voor bijna alle paden b(t) van de Brownse beweging.

Zowel Fk(n)(b,t) als F(b,t) zijn de som van hun ééndimensionale componenten, zodat de keuze n = 1 geen beperking inhoudt.

We berekenen de kwadratische afwijking tussen F2n(b,t) en de 2n-de Riemannsom voor F(b,t):

pas tweemaal een middelwaardenstelling toe

Noem de eerste term tussen de accoladen Rk, de tweede Tk.

Noteer ||.||2 voor de L2-norm ten opzichte van Ex, dan is:

||F_2^n(b,t)-Riemannsom||_2 afschatten

en door op twee van deze termen lemma 3.10 toe te passen (deel 2: L2-convergentie) ziet men dat dit willekeurig klein wordt voor voldoende grote n.

Maar dit wil zeggen dat een deelrij van (F2n(b,t))nÎN naar F(b,t) convergeert voor bijna alle paden b(t).

////

3.12 FKI voor algemenere Hamiltonianen

Stelling 3.11 kan zonder veel extra moeite uitgebreid worden tot de klasse der potentialen V die continu zijn en langs onder begrensd, zoals we nu zullen illustreren.

Vermeerder in stelling 3.11 de termen Fn(b,t) met een bedrag

(t/n)som(k=0..n-1)V(b(kt/n))

dan blijft de convergentie Fn(b,t)®F(b,t) gelden. Om deze vermeerdering te verantwoorden in paragraaf 3.5, moeten we bewijzen dat

(exp(-tH(A))g)(x)=L2-lim_n->infty E^x[g(b(t))exp(F_n(b))]=L2-lim_n->infty((Q_t/n exp(-tV/n))^n g)(x)

Maar dit is niet zo moeilijk: eerst en vooral is

lim_s->0 d/ds (Q_s exp(-V))g = ... = -(H_0(A)+V)g

Zij Rs := Qse-sV, dan is ||Rs|| £ es.min(V) en stelling 3.4 kan bijna letterlijk herschreven worden met Rs in plaats van Qs om te bewijzen:

e-tH(A) = s-limn®¥(Rt/n)n.

Een verdere veralgemening tot zeer ruime klassen van scalaire en vectorpotentialen wordt gegeven in [Simon1], p. 163.

3.13 Herformulering voor de Itô-integraal

Voor een vectorpotentiaal A Î C2(Ân) waarvoor de waarden en de eerste en tweede afgeleiden begrensd zijn en een continue scalaire potentiaal V die langs onder begrensd is, geldt het Feynman-Kac-Itô-formalisme:

(f,e-tH(A)g) = òeF(w,t) f(w(0))g(w(t))dm0(w)    (f,g Î L2(Ân))

bewijs

Is een rechtstreeks gevolg van voorgaande stelling, de definitie van de Wienermaat en van het scalair product in L2(Ân).

////

3.14 Lemma

Zij mt de maat op de Borelstam van  met dichtheid

d mu_t/dx = int_0^t (2 pi s)^(-nu/2) exp(-||x||^2/2s) ds

Als A:Ân®Ân Borelmeetbaar is en kwadratisch integreerbaar ten opzichte van mt en b:W ´ [0,¥[®Ân een Brownse beweging, dan is

t -> int_0^t A(b).db

bijna zeker linkscontinu in ieder tijdstip t0 > 0.

bewijs

Veronderstel eerst dat A begrensd is. Dan is voor 0 £ s < t:

E^0[(int_s^t A(b).db)^2] <= ||A||_infty^2 . |t-s|

en dus is

t -> int_0^t A(b).db

L2-linkscontinu.

Definieer voor algemene A Î L2(mt), n Î N:

An := A.1(|A|<n)

Dan is elke An begrensd, en An2 convergeert met stijgende n naar A2 in L1(mt).

Zij nu een willekeurige e > 0 gegeven. Dan kan n Î N gekozen worden zodat

E^0[int_0^t |A^2(b(s)) - A_n^2(b(s))| ds] <= eps^2/4

en d > 0 kleiner dan e2/4||An||¥2

Voor |r - t| < d, 0 < r < t is dan

(E^0[(int_0^t A(b)db - int_0^r A(b)db)^2])^(1/2) <= (E^0[int_r^t|A^2(b(s))ds-A_n^2(b(s))|ds])^(-1/2) + (E^0[int_r^t A_n^2(b(s))ds])^(-1/2) <= eps/2 + eps/2

en de willekeur van e bewijst de L2-linkscontinuïteit van

t -> int_0^t A(b).db

maar hieruit volgt de bijna zekere linkscontinuïteit van deze functie in ieder tijdstip t0 afzonderlijk.

////

We zullen dit lemma nu gebruiken om FKI te herformuleren voor de Brownse brugmaat m0,x,y;t. Dit geeft een integraalkern voor de evolutie-operator e-tH. De gebruikte techniek is het probleem te herleiden tot Brownse beweging.

3.15 Stelling

Zij V een Borelmeetbare reëelwaardige functie op Ân en A een continu differentieerbaar vectorveld dat kwadratisch integreerbaar is ten opzichte van de eerder gedefinieerde maat mt. Noem

R_t(x,y) := E^x,0_y,t[exp(-int_0^t V(b(s))ds-i int_0^t A(b)/db-(i/2)int_0^t(div A)(b(s))ds)]

Veronderstel dat voor een zekere Borelmeetbare f:Ân®C, x Î Ân en t > 0:

E^x[exp(int_0^t V_(b(s))ds)|f(b(t))|] < infty

Dan is voor die x en t:

int R_t(x,y)f(y)dy := E^x[exp(-int_0^t V(b(s))ds-i int_0^t A(b)/db-(i/2)int_0^t(div A)(b(s))ds)f(b(t))]

bewijs

Noem Vk := min(V,k), en

L := E^x[exp(-int_0^t V(b(s))ds-i int_0^t A(b)/db-(i/2)int_0^t(div A)(b(s))ds)f(b(t))]

Wegens puntsgewijze convergentie, gedomineerd door

exp(int_0^t V_(b(s))ds)|f(b(t))|

is

L = lim_k->infty exp(-kt)E^x[exp(k-int_0^t V_k(b(s))ds-i int_0^t A(b)/db-(i/2)int_0^t(div A)(b(s))ds)f(b(t))]

Wegens voorgaand lemma is bijna zeker:

int_0^t A(b).db = lim_r->t int_0^r A(b).db

dus:

L = lim_k->infty lim_r<t exp(-kt)E^x[exp(int_0^r(k - V_k(b(s))ds-i int_0^r A(b)/db-(i/2)int_0^r(div A)(b(s))ds)f(b(t))]

Verder is de Brownse beweging een Markovproces:

E^x[f(b(t)):b(s):0<=s<=r] = E^b(r)[f(b(t-r))]

Per definitie is

en dus is

L = int_R^nu R_t(x,y)f(y)dy

////


inhoud