La conception motivationnelle de Bolles (1972) s’appuie entièrement sur les théories béhavioristes mais propose d’interpréter l’apprentissage d’une manière radicalement différente.
Pour le béhaviorisme, c’est la contingence entre un stimulus et une réponse qui permet d’expliquer l’apprentissage. Si certains événements sont contingents à l’occurrence d’une réponse particulière, il s’en suit que la réponse devient plus forte et donc que la modification comportementale peut être théoriquement attribuée à ce processus d’augmentation de la force de certains types de réponse.
Cependant, Bolles (1972) montre que, dans de nombreux cas, cette explication en termes de contingence ne permet nullement d’expliquer l’apprentissage. Par exemple, il existe des situations où l’animal acquiert si rapidement un comportement que la procédure de renforcement, décrite ci-dessus, n’a pas à être appliquée. De même, Bolles rapporte différentes études où le renforçateur est présenté régulièrement avec la réponse, sans pour autant augmenter la force de réponse. Différents phénomènes comme les comportements dits de superstitions, la polydipsommanie qui s’observent fréquemment chez le rat affamé durant l’apprentissage par conditionnement, sont très difficilement explicables dans le cadre d’une contingence entre stimulus et réponse.
Pour Bolles (1972), l’ensemble de ces phénomènes inexplicables peuvent facilement trouver une explication dans le cadre conceptuel qu’il propose.
Dans toutes les procédures dans lesquelles le conditionnement classique est supposé apparaître, celles-ci donnent l’opportunité à l’organisme d’apprendre des relations prédictives entre des événements environnementaux. L’animal n’apprend pas seulement à répondre aux stimuli, il peut aussi apprendre des expectations. Il propose donc un modèle entièrement basé sur ces différentes formes d’expectations qu’il présente sous forme de lois.
La loi primaire de l’apprentissage permet d’établir ce qui se produit lorsque l’organisme est confronté à un nouvel environnement. Quand l’apprentissage se produit, ce qui est appris est que certains événements, indices (S), prédisent certains autres événements qui ont une importance biologique (S*). L’animal peut incidemment présenter une nouvelle réponse, mais l’essentiel n’est pas là. L’essentiel est qu’il ait appris une expectation qui représente et correspond à une contingence S-S*.
La deuxième loi de l’apprentissage permet d’expliquer la contingence qui peut exister entre le comportement de l’animal, R, et les conséquences de sa réponse S*. Bolles estime que l’animal peut apprendre une expectation qui correspond à une relation R-S*. Cette expectation, avec celle qui correspond à S-S*, constitue l’ensemble de l’apprentissage dans la plupart des expériences d’apprentissage instrumentales.
Les deux formes d’expectations S-S* et R-S* sont synthétisées ou combinées dans ce que Bolles appelle un « syllogisme psychologique » qui fait en sorte, qu’en présence de l’indice S, l’animal va généralement produire la réponse R. Pour Bolles, cette proposition, qu’il appelle la loi de la performance, n’est pas une troisième forme d’apprentissage mais se résume uniquement aux deux formes d’expectation. Son but est d’expliquer comment l’expectation produit la performance.
Ces trois lois permettent, ensemble, d’expliquer les faits inexplicables relevés précédemment qui restaient incompréhensibles dans le cadre d’une explication purement pavlovienne ou skinnerienne. En effet, toute forme d’apprentissage à un moment t doit tenir compte des expectations qui ont été opérées à un moment t-1. Cette loi des expectations précédentes explique que lorsqu’un animal a préalablement appris, ou qu’il possède de façon innée une association R-S*, lorsqu’il est confronté à une situation d’apprentissage S-S*, son comportement va être dominé par les R-S* dominant, plus que par les R-S* liés aux contingences de l’environnement. Ce sont ces expectations précédentes qui imposent des contraintes sur ce que l’animal peut apprendre.
Ainsi, pour Bolles, l’augmentation de la force de la probabilité d’une réponse augmente en fonction des paramètres suivants :
- la force de l’expectation S-S*
- la force de l’expectation R-S*
- la valeur de S*
Pour lui, ce sont les indices environnementaux qui sont la source de la motivation incitative au travers de l’expectation S-S*. Par contre, la force de l’expectation R-S* n’a rien à voir avec la motivation de l’animal, elle détermine uniquement la direction que le comportement doit adopter. La valeur de S* peut être négative lorsque l’animal a faim ou négative quand il s’attend à recevoir un choc électrique. Cependant, il est à noter que l’augmentation de la privation de nourriture a uniquement pour effet d’augmenter la valeur de S*, pas la force de la réponse de l’animal ; cette dernière étant liée uniquement aux deux formes d’expectations.
Représentation intégrée du modèle apprentissage, expectations et renforcement(d’après Bolles, 1972)