( rpsoft | 2022. 12. 08., cs – 10:24 )

Amit leírsz, az egy optimalizálási probléma. Ha van egy olyan feladatom, hogy

min f(x1, x2, ..., xn)

akkor annak vannak feltételei, hogy diszkrét minimumai legyenek. Mit tudok egy minimumról? Hogy egy kicsit hozzáadva bármely változóhoz, az rosszabb lesz:

f(x1 + d1, x2 + d2, ..., xn + dn) = f(x1, x2, ..., xn) + (d1, d2, ..., dn)^T f'(x1, x2, ..., xn) + 1/2 (d1, d2, ..., dn)^T f''(x1, x2, ..., xn) (d1, d2, ..., dn) + o(|d|^2).

Itt f'(...) egy n-elemű vektor, f''(...) egy nxn-es szimmetrikus mátrix, és o(|d|^2) egy olyan függvény, melyre o(|d|^2)/d^2 nullához tart, ha d->0. Tehát, ha nem lenne f'(x1, x2, ..., xn) nulla, akkor d-t elegendően kicsinek és mondjuk a deriválttal párhuzamosnak, de ellentétes irányúnak választva az f(x1+d1, x2 + d2, ..., xn + dn)-ről megmutathatnánk, hogy kisebb, mint f(x1, x2, ..., xn), tehát nem lehetne minimum, ami ellentmondás. Ezek szerint a minimalizálás szükséges feltétele n egyenlet teljesülése az x1, x2, ..., xn változókra,

∂f(x1, x2, ..., xn) / ∂ x1 = 0

∂f(x1, x2, ..., xn) / ∂ x2 = 0

...

∂f(x1, x2, ..., xn) / ∂ xn = 0

Ez egy szükséges feltétel, de nem elégséges. Annak, hogy ez egy izolált minimum legyen, egy elégséges feltétele, hogy a második deriváltak mátrixa pozitív definit legyen

f''(x1, x2, ..., xn) = ∂^2 f(x1, x2, ..., xn) / ∂ x^2 > 0,

ahol azon, hogy egy mátrix pozitív azt értjük, hogy tetszőleges d nemnulla vektorra d^T M d > 0. Természetesen ez nem szükséges feltétel, vannak magasabb rendű izolált minimumok (pl. x^4 esetében x=0). Ezekkel most nem foglalkozunk, elég speciális eset.

Tehát egy izolált minimum esetén az n darab egyenlet teljesül, és ha a második deriváltak márixa pozitív definit, az elégséges ahhoz, hogy ezek az egyenletek függetlenek legyenek, azaz a megoldás lokálisan egyértelmű. Ha a függvényed ilyen, akkor már "csak" a lokális minimumok közül kell választanod.

Amint látod, a minimalizálás nagyon más feladat, mint egyetlen egy egyenlet megoldása.