Matematyczne modele uczenia się – kontynuacja

Hull w każdej wyuczonej czynności wyróżniał dwie grupy komponentów – po pierwsze, siłę nawyku (SHR) (habit strength), jako rezultat asocjacyjnego uczenia się pod wpływem wzmocnienia, jak w warunkowaniu instrumentalnym, oraz po drugie, komponenty nie-asocjacyjne, z których najważniejszy był popęd (D) (drive). Hull podał następujący podstawowy wzór (Hull, 1951, s. 35) SER (potencjał pobudzenia) = D (popęd) x SHR (siła nawyku).

Z równania tego wynika, że tendencja do wykonania reakcji (SER) zależy od siły nawyku (SHR), nabytego dzięki uprzedniemu uczeniu się, przy czym rzeczywista wielkość reakcji zależy także od poziomu popędu (D) działającego w czasie, gdy ta reakcja jest wywoływana. Zatem głodny szczur, który nauczył się już drogi przez labirynt, przebiegnie ten labirynt szybciej niż szczur najedzony, równie dobrze znający labirynt. Ten podstawowy wzór komplikują – obok popędu – inne nieasocjacyjne czynniki, takie jak intensywność bodźców, które wywołują reakcje oraz wielkość przynęty użytej dla wzmacniania, jednakże to podstawowe równanie w swej nieskomplikowanej postaci może nas zapoznać z zasadniczą ideą systemu.

Aby przejść od tego bardzo prostego równania do czegoś, co by odpowiadało danym z eksperymentów, Hull musiał najpierw wyprowadzić wzór wyrażający prawo kształtowania nawyku, tj. najbardziej typową formę krzywej uczenia się dla nabywania prostego odruchu wzmacnianego w każdej próbie. Równaniu temu dał postać następującą (Hull, 1951, s. 32):

Hull stosował indeksy S i R w symbolach siły nawyku (SHR) i potencjału pobudzenia (SER) dla przypomnienia, że oznaczenia te w przypadku nawyku symbolizują związek pomiędzy określonym bodźcem (stimulus) a reakcją (response), a w przypadku potencjału pobudzenia (excitatory potential) – tendencję wywoływania tej reakcji przez określony bodziec. Indeksy te nie służą żadnym matematycznym celom, są to jedynie opisowe etykietki na symbolach (przy. aut.). gdzie JV jest liczbą wzmocnionych prób rozłożonych w równych odstępach czasu, zaś a jest stałą.

Prawo to stwierdza, że gdy inne czynniki pozostają niezmienione, to siła nawyku wzrasta w sposób regularny w miarę wzmacniania, aż do maksymalnej siły 1,00 (w jednostkach umownych). Wynikająca stąd krzywa jest krzywą o malejących przyrostach.

Leave a reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>