Holanda shēmas teorēma, ko dēvē arī par ģenētisko algoritmu fundamentālo teorēmu, ir nevienlīdzība, kas izriet no evolūcijas dinamikas vienādojuma rupjās struktūras. Shēmas teorēma apgalvo, ka īsas, zemas kārtas shēmas, kuru piemērotība ir virs vidējās, var palielināties ģenētiskā algoritma populācijā vairāku paaudžu gaitā. Teorēmu pagājušā gadsimta 70. gados ierosināja Džons Holands. Sākotnēji to plaši uzskatīja par pamatu ģenētisko algoritmu darbības un jaudas skaidrojumiem. Vēlākā literatūrā tomēr tika norādīts, ka šī interpretācija ir pārāk vienkāršota: shēmas teorēma dod tikai zemāko robežu sagaidāmajai shēmu skaita izmaiņai un ir iegūta zem vairākiem idealizētiem pieņēmumiem. Dažās publikācijās parādīts arī, ka shēmas teorēma ir īpašs gadījums plašākam cenas (Price) vienādojumam, kurā shēmas indikatora funkcija darbojas kā makroskopisks mērījums.
Shēma ir veidne, kas identificē virkņu apakškopu ar līdzībām noteiktās virkņu pozīcijās. Piemēram, binārajā alfabētā shēma 1*0* apzīmē visas virknes, kurās pirmajā pozīcijā ir 1, trešajā — 0, bet otrā un ceturtā pozīcija var būt jebkura (atsevišķi simboli aizstāti ar vietturētāju “*”). Shēmas ir cilindrisko kopu īpašs gadījums, tāpēc tās var traktēt kā elementus attiecīgā topoloģiskā telpā (cilindriskās kopas ģeneratori).
Definīcija un intuīcija
Vienkāršā valodā shēma (H) ir paraugs vai maska, kas nosaka noteiktas pozīcijas virkņu garumā, savukārt pārējās pozīcijas ir "neizšķirtas" (wildcards). Shēmas teorēma aplūko, kā šo shēmu skaits populācijā mainās, ja darbojas reprodukcijas mehānismi: atlase, krustošana (crossover) un mutācija. Ja shēma ir īsa (t. i., specifiskās pozīcijas ir tuvu viena otrai) un zemas kārtas (t. i., maz nerazlietoto, fiksēto pozīciju), un ja to vidējā piemērotība ir lielāka par populācijas vidējo piemērotību, tad šīs shēmas īpatsvars var pieaugt nākamajās paaudzēs.
Formālā izteiksme
Holanda klasiskā nevienlīdzība bieži tiek uzrakstīta šādi (gaidāmā vērtība vai sagaidāmais skaits m shēmām H nākamajā paaudzē):
E[m(H,t+1)] ≥ m(H,t) * (f(H) / f̄) * [1 - p_c * (δ(H)/(l-1)) - o(H) * p_m]
Kur:
- m(H,t) — shēmas H gadījumu skaits laikposmā t;
- f(H) — vidējā piemērotība tiem individuāliem stringiem, kas pieder shēmai H;
- f̄ — populācijas vidējā piemērotība;
- p_c — krustošanas (crossover) varbūtība (parasti viena-šķēršļu gadījums formulu atvasinājumos);
- p_m — mutācijas varbūtība uz vienu simbolu;
- o(H) — shēmas kārta (order): fiksēto (nespecifisko) pozīciju skaits shēmā;
- δ(H) — definējošā garuma (defining length): attālums starp pirmo un pēdējo fiksēto pozīciju;
- l — ģenotipa (stringa) kopējais garums.
Intuitīvi: f(H)/f̄ nosaka, cik veiksmīga shēma ir salīdzinājumā ar vidējo, bet izteiksmes kreisās puses faktors [1 - ...] atspoguļo, cik lielā mērā šī shēma tiek iznīcināta vai bojāta krustojuma un mutācijas rezultātā. Ja iznīcināšanas termiņš ir mazs un f(H)/f̄ > 1, tad sagaidāms shēmas īpatsvara palielinājums, kas, atkārtojoties pa paaudzēm, var radīt eksponenciālu augšanu ideālos apstākļos.
Shēmu parametri
- Kārta (o(H)) — cik daudz pozīciju shēmā ir konkrētas (nevis wildcards). Mazāka kārta nozīmē, ka mazāk bitu jāuztur vienā kopā, un tie mazāk riskē tikt izmainīti mutācijas laikā.
- Definējošā garuma (δ(H)) — attālums starp pirmajiem un pēdējiem noteiktajiem simboliem. Jo mazāks δ(H), jo mazāka iespēja, ka krustojums to "sagriezīs".
Nozīme ģenētiskajos algoritmos
Holanda shēmas teorēma deva konceptuālu pamatu building block hypothesis — idejai, ka labas atrisinājuma daļas (mazi, spēcīgi kombinēti bitti) tiek apkopotas un pakāpeniski salikti kopā, lai veidotu arvien labākus risinājumus. Teorēma palīdz saprast, kā atlase un ģenētiskie operatori var saglabāt un pastiprināt šādas detaļas populācijā. Tā arī iedrošināja pētniekus izstrādāt reprezentācijas un operatorus, kas saglabā "labus" bitu blokus (piem., mazā definējošā garuma shēmas).
Kritika un ierobežojumi
- Holanda teorēma dod tikai zemāko robežu sagaidāmajam shēmu skaitam — tā neparedz precīzas dinamikas vai ātrumu ilgtermiņā.
- Teorēma balstās uz vairākiem idealizētiem pieņēmumiem: proporcionālā atlasei, viena-šķēršļa krustojumam un nelielām mutāciju varbūtībām. Reālos algoritmos bieži izmanto citas atlases metodes, daudzšķēršļu krustošanu, populācijas aprēķina nianses utml., kas maina uzvedību.
- Shēmas var overlapot un veidot milzīgu skaitu to kombināciju; shēmu teorēma neatrisina, kā no šī milzīgā kopuma efektīvi izvēlēties vai modelēt atkarības starp bitiem (linkāžu problēma, epistāze).
- Vairāki pētnieki (piem., izmantojot Price vienādojumu, Vose un citi) ir parādījuši precīzākus vai visaptverošākus aprakstus GA dinamikai. Daļa literatūras arī apstrīd "building block" kā universālu paskaidrojumu — praktiskie rezultāti rāda, ka GA darbība reizēm balstās uz citiem mehānismiem.
- Teorija ir deterministiska sagaidāmajā vērtībā un neņem pilnībā vērā stohastiskumu (gala populāciju variāciju, ģimenes izmērus, nejaušu efektu, mazas populācijas izmaiņas).
Piemērs
Apsveriet bitu virknes garumu l = 4 un shēmu H = 1*0*. Ja populācijā ir m(H,t) = 10 piemēri, vidējā piemērotība šo piemēru vidū f(H) = 1.2 un populācijas vidējā piemērotība f̄ = 1.0, p_c = 0.7, p_m = 0.01, o(H) = 2 (divas konkrētas pozīcijas) un δ(H) = 2. Tad, pēc Holland izteiksmes, sagaidāmais šīs shēmas skaits nākamajā paaudzē būs vismaz:
10 * (1.2/1.0) * [1 - 0.7*(2/(4-1)) - 2*0.01] ≈ 12 * [1 - 0.4667 - 0.02] ≈ 12 * 0.5133 ≈ 6.16
Tas parāda: lai gan shēma ir labāka par vidējo (f(H)/f̄ > 1), krustojuma un mutācijas iznīcināšanas efekti var samazināt tās sagaidāmo skaitu nākamajā paaudzē. Ja aizsardzības faktors [1 - ...] būtu > 1/f(H)*f̄, ilgtermiņā šī shēma varētu augt eksponenciāli.
Praktiski secinājumi
- Holanda shēmas teorēma ir vērtīgs rīks, lai iegūtu intuitīvu izpratni par to, kā atlase un ģenētiskie operatori ietekmē "mazas" struktūras populācijā.
- Tas nav pilnīgs vai vienīgais paskaidrojums ģenētisko algoritmu sekmēm; praktiskai izmantošanai jāņem vērā shēmu savstarpējās atkarības (linkāža), atlases veids, operatoru īpatnības un stohastiskās ietekmes.
- Izstrādājot reprezentāciju un operatorus, praktiski jāmērķē uz to, lai svarīgās problēmas daļas būtu koncentrētas īsos, stabilos blokos (samazināts definējošais garums), vienlaikus izmēģinot adaptīvākas metodes (linkāžas mācīšanās, selekcijas modifikācijas u. c.).
Secinot — Holanda shēmas teorēma ir nozīmīgs teorētisks pamats ģenētisko algoritmu pētījumam, taču to jālieto kā viens no instrumentiem kombinācijā ar plašāku analīzi un empīriskām pārbaudēm.

