Thế nào là Điều kiện hóa từ kết quả (Operant Conditioning)? – Exploring Psychology – Khám Phá Tâm Lý Học

Điều kiện hóa từ kết quả (đôi lúc còn được gọi là điều kiện hóa công cụ) là 1 phương thức học tập xuất hiện thông qua quy trình thưởng phạt những hành vi. Qua điều kiện hóa từ kết quả, 1 hợp tác được tạo dựng giữa hành vi và 1 kết quả do hành vi đấy mang trong mình lại.

Operant conditioning (typically referred lớn as instrumental conditioning) is a technique of studying that happens by means of rewards and punishments for habits. Via operant conditioning, an affiliation is made between a habits and a consequence for that habits.

block-type-r.jpg
Nguồn: loadtve

Dí dụ, lúc 1 con chuột trong phòng thí nghiệm nhấn nút màu sắc xanh, nó sẽ nhận được những viên thức ăn coi như phần thưởng, lúc nó nhấn nút màu sắc đỏ, loại nó nhận được là 1 cú sốc điện.

For instance, when a lab rat presses a blue button, he receives a meals pellet as a reward, however when he presses the purple button he receives a light electrical shock.

Kết quả là nó học phương pháp bấm nút màu sắc xanh và hạn chế bấm nút màu sắc đỏ.

In consequence, he learns lớn press the blue button however keep away from the purple button.

Lịch sử Điều kiện hóa từ kết quả. The Historical past of Operant Conditioning

Điều kiện hóa từ kết quả được gọi tên lần trước tiên bởi nhà tâm lý học hành vi B. F. Skinner, bởi vậy đôi lúc quy trình này còn được gọi là Điều kiện hóa Skinner. Là 1 nhà tâm lý học hành vi, Skinner tin rằng ko cần thiết cứ cần đào sâu vào những suy nghĩ hay động lực bên trong để giải thích hành vi. Thay đổi vào đấy, ông cho rằng ta chỉ nên nhìn vào loại biểu hiện ra bên bên cạnh, những nguyên nhân có thể xem được từ hành vi con người.

Operant conditioning was coined by behaviorist B.F. Skinner, which is why you might often hear it referred lớn as Skinnerian conditioning. As a behaviorist, Skinner believed that it was probably not vital lớn have a look at inside ideas and motivations so as lớn clarify habits. As a substitute, he advised, we must always look solely on the exterior, observable causes of human habits.

Suốt nửa đầu thế kỷ XX, thuyết hành vi phát triển thành phân ngành chủ đạo trong tâm lý học. Những ý tưởng của John B. Watson đã thống lĩnh trường phái tư tưởng này từ những ngày đầu. Watson tập trung vào những nguyên lý của điều kiện hóa cổ điển, ông siêu nổi danh có phát biểu cho rằng mình có thể làm bất cứ người nào, có bất kỳ nền móng học vấn nào, phát triển thành điều ông muốn thông qua huấn luyện.

Via the primary a part of the Twentieth-century, behaviorism had grow to be a significant power inside psychology. The concepts of John B. Watson dominated this college of thought early on. Watson targeted on the rules of classical conditioning, as soon as famously suggesting that he might take any particular person no matter their background and practice them lớn be something he selected.

Nguồn: My Room

Trong lúc những nhà tâm lý học hành vi đời đầu tập trung mối lưu ý của họ vào quy trình học tập thông qua hợp tác thì Skinner lại hứng thú hơn có phương pháp mà kết quả có được từ hành động của con người tác động lên hành vi của họ.

The place the early behaviorists had targeted their pursuits on associative studying, Skinner was extra eager about how the results of individuals’s actions influenced their habits.

Skinner dùng thuật ngữ “operant” để chỉ toàn bộ “những hành vi chủ động được thực hành trong 1 bối cảnh nhất định nhằm đưa tới 1 kết quả.” Nói phương pháp khác, học thuyết của Skinner giải thích phương pháp ta tiếp thu và thực hành được 1 loạt những hành vi qua học tập mà có, từng hành vi này đều có thể được xem hàng ngày.

Skinner used the time period operant lớn refer lớn any “lively habits that operates upon the setting lớn generate penalties.” In different phrases, Skinner’s concept defined how we purchase the vary of discovered behaviors we exhibit each day.

Học thuyết của ông bị tác động lớn từ công trình của nhà nghiên cứu Edward Thorndike, người đã đề xuất “Định luật về hiệu quả”.

His concept was closely influenced by the work of psychologist Edward Thorndike, who had proposed what he referred to as the legislation of impact.

Theo như nguyên lý này, hành động đưa tới những kết quả mong muốn sẽ dễ có khả năng lặp lại hơn trong lúc những hành động đưa tới kết quả ko mong muốn sẽ ít có khả năng lặp lại.

In accordance lớn this precept, actions which are adopted by fascinating outcomes are extra possible lớn be repeated whereas these adopted by undesirable outcomes are much less possible lớn be repeated.

Điều kiện hóa từ kết quả dựa trên 1 giả thuyết khá đơn giản – những hành động theo sau bởi 1 tác nhân củng cố sẽ trở nên vững cứng cáp hơn và dễ có khả năng xuất hiện trở lại trong tương lai. Trường hợp bạn nói 1 câu chuyện cười trong lớp và toàn bộ mọi người đều cười thì bạn sẽ có khả năng nói lại câu chuyện đấy trong tương lai.

Operant conditioning depends on a reasonably easy premise – actions which are adopted by reinforcement will likely be strengthened and extra possible lớn happen once more sooner or later. Should you inform a shaggy dog story at school and everyone laughs, you’ll most likely be extra possible lớn inform that story once more sooner or later.

Ngược lại, hành động theo tiếp theo bởi 1 hình phạt hoặc 1 hậu quả xấu sẽ bị yếu đi và ít có khả năng xuất hiện lại trong tương lai. Trường hợp bạn nói cũng câu chuyện đấy trên 1 lớp mà mà lần này chẳng ai cười thì lần tới khả năng cao là bạn sẽ ko nói câu chuyện đấy nữa.

Conversely, actions that end in punishment or undesirable penalties will likely be weakened and fewer possible lớn happen once more sooner or later. Should you inform the identical story once more in one other class however no one laughs this time, you may be much less possible lớn repeat the story once more sooner or later.

Xem Thêm  TỪ A ĐẾN Z SỰ THẬT VỀ XỎ KHUYÊN MŨI SEPTUM

Những dạng hành vi. Forms of Behaviors

Skinner phân biệt 2 dạng hành vi. Skinner distinguished between two various kinds of behaviors

Hành vi phản ứng là những hành vi xuất hiện 1 phương pháp tự động động và linh hoạt, như rụt tay lúc chạm vào bếp nóng hoặc giật giật chân lúc bác bỏ sĩ gõ vào khớp đầu gối. Bạn ko cần cần học những hành vi dạng này, đơn giản là chúng xuất hiện 1 phương pháp tự động động ko cần sự điều khiển của ý thức.

Respondent behaviors are those who happen robotically and reflexively, corresponding to pulling your hand again from a sizzling range or jerking your leg when the physician faucets in your knee. You don’t have lớn study these behaviors, they merely happen robotically and involuntarily.

– Những hành vi hình thành từ kết quả, mặt khác, lại là những hành vi có được dưới sự kiểm soát có ý thức của con người. 1 số có thể xuất hiện khá tự động phát và số khác lại có phần đích rõ ràng, nhưng kết quả/hay hậu quả của những hành động này sẽ tác động tới khả năng xuất hiện hay ko xuất hiện lại những hành động này trong tương lai. Hành động của chúng ta đặt trong 1 bối cảnh và những kết quả của hành động đóng 1 vai trò quan yếu trong quy trình học tập.

Operant behaviors, then again, are these below our acutely aware management. Some might happen spontaneously and others purposely, however it’s the penalties of those actions that then affect whether or not or not they happen once more sooner or later. Our actions on the setting and the results of that motion make up an essential a part of the educational course of.

Dù rằng điều kiện hóa cổ điển có thể bao quát được những hành vi của đối tượng phản ứng nhưng Skinner nhận ra rằng nó ko thể biểu hiện toàn bộ quá học tập rộng lớn. Thay đổi vào đấy, Skinner cho rằng điều kiện hóa từ kết quả nắm giữ 1 vai trò lớn lao hơn siêu nhiều.

Whereas classical conditioning might account for respondent behaviors, Skinner realized that it couldn’t account for an excessive amount of studying. As a substitute, Skinner advised that operant conditioning held far larger significance.

Skinner phát minh ra nhiều thiết bị khác nhau lúc ông còn trẻ và chính những kỹ năng này đã được ứng dụng siêu nhiều trong những nghiên cứu sau này về điều kiện hóa từ kết quả.

Skinner invented completely different gadgets throughout his boyhood and he put these abilities lớn work throughout his research on operant conditioning.

Ông tạo ta 1 thứ gọi là Hộp điều kiện hóa từ kết quả, mà nay ta vẫn gọi là Hộp Skinner. Hộp này về cơ bản là 1 loại hộp có thể nhốt những con vật bé như chuột hay bồ câu. Hộp này cũng có 1 then chắn hay chốt sắt mà con vật nó thể nhấn để nhận được phần thưởng.

He created a tool often known as an operant conditioning chamber, most frequently referred lớn at present as a Skinner field. The chamber was basically a field that might maintain a small animal corresponding to a rat or pigeon. The field additionally contained a bar or key that the animal might press so as lớn obtain a reward.

Để theo dõi phản ứng, Skinner cũng đã chế tạo ra 1 thiết bị có tên máy ghi lũy tích. Thiết bị này ghi lại những phản ứng bằng đường vẽ hướng dần lên trên, từ đây ta có thể đọc được những mức độ phản ứng thông qua độ dốc của đường ghi này.

So as lớn observe responses, Skinner additionally developed a tool often known as a cumulative recorder. The system recorded responses as an upward motion of a line in order that response charges might be learn by trying on the slope of the road.

Hộp Skinner và Máy ghi tích lũy. Nguồn: Studying-Theorists

Những thành tố của Điều kiện hóa từ kết quả. Parts of Operant Conditioning

Có 1 số khái niệm cơ bản trong Điều kiện hóa từ kết quả. There are a number of key ideas in operant conditioning.

Củng cố trong điều kiện hóa từ kết quả. Reinforcement in Operant Conditioning

Củng cố là bất kỳ sự kiện nào làm cho gia nâng cao hoặc liên quan hành vi theo sau nó. Có 2 loại củng cố: Reinforcement is any occasion that strengthens or will increase the habits it follows. There are two sorts of reinforcers:

– Củng cố hăng hái là những sự kiện hay kết quả phải chăng biểu hiện sau thời điểm hành vi được thực hành. Trong những tình trạng củng cố hăng hái, 1 phản ứng hoặc hành vi được củng cố bằng phương pháp thêm thứ gì đấy, như 1 lời khen hay 1 phần thưởng quản lý. Dí dụ, giả dụ bạn làm cho phải chăng trên chỗ làm cho và sếp bạn cho bạn tiền thưởng.

Nguồn: Greycaps

Optimistic reinforcers are favorable occasions or outcomes which are offered after the habits. In conditions that mirror constructive reinforcement, a response or habits is strengthened by the addition of one thing, corresponding to reward or a direct reward. For instance, in case you do a superb job at work and your supervisor provides you a bonus.

– Củng cố tiêu cực là việc loại bỏ 1 sự kiện hay kết quả ko mong muốn sau thời điểm 1 hành vi được thực hành. Trong những tình trạng này, 1 phản ứng được củng cố bởi việc loại bỏ thứ gì đấy khó chịu. Dí dụ, giả dụ con bạn la hét giữa tiệm tạp hóa, nhưng lại ngừng la hét lúc bạn đưa cho nó thứ gì đấy hay ho nó thích, thì lần tới giả dụ con khóc, bạn sẽ lại đưa cho con 1 thứ tương tự động. Hành vi của bạn được dẫn dắt bởi việc loại bỏ đi sự kiện khó chịu (tiếng la khóc của con), nhân tố tiêu cực tác động lên hành vi của bạn.

Detrimental reinforcers contain the removing of an unfavorable occasions or outcomes after the show of a habits. In these conditions, a response is strengthened by the removing of one thing thought of disagreeable. For instance, in case your baby begins lớn scream in the midst of the grocery retailer, however stops when you hand him a deal with, you may be extra possible lớn hand him a deal with the following time he begins lớn scream. Your motion led lớn the removing of the disagreeable situation (the kid screaming), negatively reinforcing your habits.

Xem Thêm  Lớn Be Continued Là Gì – Nghĩa Của Từ Lớn Be Continued In Our Subsequent

Trên cả 2 trường hợp củng cố trên, hành vi đều có sự gia nâng cao. In each of those circumstances of reinforcement, the habits will increase.

Trừng phạt trong điều kiện hóa từ kết quả. Punishment in Operant Conditioning

Trừng phạt là sự hiện diện của 1 sự kiện hoặc kết quả bất lợi làm cho giảm thiểu hành vi đi kèm tiếp theo. Có 2 loại trừng phạt:

Punishment is the presentation of an opposed occasion or consequence that causes a lower within the habits it follows. There are two sorts of punishment:

– Trừng phạt hăng hái, có lúc được gọi là trừng phạt ứng dụng, là đưa ra 1 sự kiện hay kết quả khó chịu để làm cho giảm đi phản ứng đi kèm tiếp theo. Phát vào mông con trẻ lúc chúng cư xử ko đúng là dí dụ về củng cố ứng dụng.

Optimistic punishment, typically referred lớn as punishment by utility, presents an unfavorable occasion or consequence so as lớn weaken the response it follows. Spanking for misbehavior is an instance of punishment by utility.

– Trừng phạt tiêu cực, còn được gọi là trừng phạt loại bỏ, xuất hiện lúc 1 sự kiện hay kết quả dễ chịu bỏ loại bỏ sau thời điểm hành vi được thực hành. Lấy lại máy chơi sport sau thời điểm con trẻ cư xử ko đúng là dí dụ về củng cố tiêu cực.

nagaldas.png
Nguồn: sentayho.com.vn

Detrimental punishment, also referred to as punishment by removing, happens when a positive occasion or consequence is eliminated after a habits happens. Taking away a baby’s online game following misbehavior is an instance of detrimental punishment.

Trên cả 2 trường hợp trừng phạt, hành vi đều giảm đi. In each of those circumstances of punishment, the habits decreases.

Khuôn thời kì củng cố. Reinforcement Schedules

Skinner cũng tìm ra ra rằng thời kì và phương pháp thức làm cho xuất hiện hành vi được củng cố cũng đóng 1 vai trò quyết định tốc độ và mức độ lĩnh hội (học tập) của chủ thể. Ông đã chỉ ra 1 số khuôn thời kì củng cố khác nhau:

Skinner additionally discovered that when and the way typically behaviors have been bolstered performed a task within the pace and power of acquisition. He recognized a number of completely different schedules of reinforcement:

– Củng cố liên tục là thực hành củng cố từng lúc phản ứng xuất hiện. Việc học tập có xu hướng xuất hiện tương đối nhanh, tuy nhiên mức phản ứng là khá thấp. Sự biến mất (hay dập tắt) cũng xuất hiện khá nhanh ngay lúc ngưng củng cố.

Steady reinforcement includes supply a reinforcement each time a response happens. Studying tends lớn happen comparatively rapidly, but the response price is kind of low. Extinction additionally happens in a short time as soon as reinforcement is halted.

– Khuôn thời kì củng cố tỷ lệ cố định là 1 dạng củng cố bán phần. Phản ứng chỉ được củng cố ngay lúc 1 số phản ứng đã xuất hiện. Điều này thường sẽ đưa tới mức phản ứng khá ổn định.

Mounted-ratio schedules are a kind of partial reinforcement. Responses are bolstered solely after a particular variety of responses have occurred. This sometimes leads lớn a reasonably regular response price.

– Khuôn thời kì củng cố theo quãng cố định là 1 dạng củng cố bán phần khác. Củng cố chỉ xuất hiện sau 1 quãng thời kì nhất định nào đấy trôi qua. Mức độ phản ứng cũng khá ổn định và khởi đầu nâng cao dần lúc thời kì củng cố tới sắp, và chậm dần ngay sau thời điểm củng cố đã được thực hành.

Mounted-interval schedules are one other type of partial reinforcement. Reinforcement happens solely after a sure interval of time has elapsed. Response charges stay pretty regular and begin lớn enhance because the reinforcement time attracts close to, however gradual instantly after the reinforcement has been delivered.

– Khuôn thời kì củng cố tỷ lệ linh hoạt cũng là 1 dạng củng cố bán phần, củng cố lên hành vi sau thời điểm 1 số lượng (ko cố định) phản ứng nào đấy đã xuất hiện. Nó sẽ đưa tới mức phản ứng cao và mức dập tắt hành vi chậm.

Variable-ratio schedules are additionally a kind of partial reinforcement that contain reinforcing habits after a diversified variety of responses. This leads lớn each a excessive response price and gradual extinction charges.

– Khuôn thời kì củng cố theo quãng linh hoạt là dạng cuối cùng trong củng cố bán phần do Skinner mô tả. Trên dạng này, củng cố được thực hành sau 1 số khoảng thời kì (ko cố định) nào đấy trôi qua. Điều này đưa tới mức phản ứng nhanh và mức dập tắt chậm.

Variable-interval schedulesare the ultimate type of partial reinforcement Skinner described. This schedule includes delivering reinforcement after a variable period of time has elapsed. This additionally tends lớn lead lớn a quick response price and gradual extinction price.

Dí dụ về Điều kiện hóa từ kết quả. Examples of Operant Conditioning

Ta có thể thấy khá nhiều dí dụ về điều kiện hóa từ kết quả trong cuộc sống quanh ta. Hay thử nghĩ tới con trẻ làm cho xong bài tập về nhà để được cha mẹ hay thầy cô giao khen thưởng, hoặc viên chức hoàn thành công việc được giao để được tuyên dương hoặc thăng tiến.

We will discover examples of operant conditioning at work throughout us. Contemplate the case of kids finishing homework lớn earn a reward from a mother or father or instructor, or workers ending initiatives lớn obtain reward or promotions.

1 số những dí dụ khác về điều kiện hóa từ kết quả trong thực tế: Some extra examples of operant conditioning in motion:

Trường hợp trẻ quấy phá trong lúc đi sắm đồ, bạn có thể cho con loại gì con thích để chúng ngưng la hét. Vì lúc đấy bạn đã thực hành củng cố hăng hái thói hư tật xấu đấy nên lần tới có thể con sẽ lại la hét quấy phá để lại được bạn cho đồ.

Xem Thêm  Viên chức kỹ thuật trong tiếng Anh là gì, định nghĩa, thí dụ Anh Việt

In case your baby acts out throughout a procuring journey, you may give him a deal with lớn get him lớn be quiet. As a result of you could have positively bolstered the misbehavior, he’ll most likely be extra possible lớn act out once more sooner or later so as lớn obtain one other deal with.

Sau khoản thời gian hoàn thành 1 vai trong vở kịch trên rạp hát, bạn được khán giả vỗ tay tán thưởng. Những tràng pháo tay đóng vai trò như củng cố hăng hái khuyến khích bạn thử thêm nhiều vai diễn khác.

After performing in a neighborhood theater play, you obtain applause from the viewers. This acts as a constructive reinforcer inspiring you lớn check out for extra efficiency roles.

Bạn dạy chú chó trên nhà phương pháp tìm lấy đồ cho bạn bằng phương pháp khen ngợi và vỗ đầu nó những lúc nó làm cho được.

Nguồn: Heritage Pet

You practice your canine lớn fetch by providing him reward and a pat on the pinnacle at any time when he performs the habits appropriately.

1 giáo sư nói sinh viên rằng giả dụ chúng đi học toàn bộ trong cả học kỳ thì chúng sẽ ko cần thi bài cuối khóa. Bằng phương pháp bỏ đi kích thích khó chịu (bài thi cuối khóa) sinh viên đã bị củng cố tiêu cực để tới lớp thường xuyên.

A professor tells college students that if they’ve excellent attendance all semester, then they don’t have lớn take the ultimate complete examination. By eradicating an disagreeable stimulus (the ultimate check) college students are negatively bolstered lớn attend class recurrently.

Trường hợp bạn ko thể nộp đồ án đúng hạn, sếp bạn sẽ tức giận và phê bình hiệu suất làm cho việc của bạn trước mặt đồng nghiệp. Đây chính là trừng phạt tiêu cực giúp hạn chế việc nộp trễ trong tương lai.

Should you fail lớn hand in a challenge on time, your boss turns into offended and berates your efficiency in entrance of your co-workers. This acts as a constructive punisher making it much less possible that you’ll end initiatives late sooner or later.

1 cô gái trẻ ko dọn dẹp phòng lúc mẹ nhắc nhở, bố mẹ cô đã tịch thu điện thoại của cô cho tới hết ngày. Đây chính là 1 dí dụ về trừng phạt tiêu cực, trong đấy 1 kích thích hăng hái bị lấy đi.

A teen lady doesn’t clear up her room as she was requested, so her mother and father take away her telephone for the remainder of the day. That is an instance of a detrimental punishment wherein a constructive stimulus is taken away.

Trong những dí dụ trên, lời hứa hẹn hay khả năng nhận phần thưởng làm hành vi gia nâng cao, nhưng điều kiện hóa từ kết quả cũng có thể được ứng dụng để giảm thiểu hành vi. Việc ứng dụng loại bỏ kết quả dễ chịu hoặc tiêu cực có thể được dùng để giảm hay ngăn ngừa những hành vi ko mong muốn. Dí dụ, thông tin có trẻ rằng chúng sẽ nhận được ít đặc quyền hơn trong giờ giải lao giả dụ chúng nó nói leo, trả treo trong lớp. Kiểu trừng phạt này có thể làm cho giảm những hành vi gây rối trên trẻ.

In a few of these examples, the promise or chance of rewards causes a rise in habits, however operant conditioning will also be used lớn lower a habits. The removing of a fascinating consequence or detrimental consequence utility can be utilized lớn lower or forestall undesirable behaviors. For instance, a baby could also be advised they’ll lose recess privileges in the event that they speak out of flip at school. This potential for punishment might lead lớn a lower in disruptive behaviors.

Kết luận. A Phrase From Verywell

Dù rằng thuyết hành vi có thể đã mất đi vị thể thống trị như nó đã từng trong những 5 đầu thế kỷ XX, điều kiện hóa từ kết quả vẫn đóng vai trò khá quan yếu và thường là công cụ được dùng trong quy trình học tập và điều chỉnh hành vi. Đôi lúc, hệ quả xuất hiện tự động nhiên sẽ đưa tới thay thế đổi trong hành vi. Trong những trường hợp khác, phần thưởng và trừng phạt có thể được tích hợp dần dần giúp tạo điều kiện thay thế đổi.

Whereas behaviorism might have misplaced a lot of the dominance it held through the early a part of the Twentieth-century, operant conditioning stays an essential and sometimes utilized software within the studying and habits modification course of. Typically pure penalties lead lớn modifications in our habits. In different situations, rewards and punishments could also be consciously doled out so as lớn create a change.

Điều kiện hóa từ kết quả là thứ mà bạn có thể ngay nagy lập tức nhận ra trong cuộc sống của chính bạn, dù là dạy dỗ con trẻ những điều hay lẽ cần hay huấn luyện chú chó cưng ngưng nhai gặm giày dép. Điều quan yếu cần nhớ là có kiểu học tập nào đi chăng nữa thì tất thảy đều cần thời kì. Hãy cân nhắc loại củng cố hay trừng phạt nào yêu thích nhất cho tình trạng hiện tại và đánh giá lựa chọn khuôn thời kì củng cố yêu thích sẽ giúp đưa tới kết quả tối ưu.

Operant conditioning is one thing you might instantly acknowledge in your personal life, whether or not it’s in your strategy lớn educating your kids good habits or in coaching the household canine lớn cease chewing in your favourite slippers. The essential factor lớn keep in mind is that with any sort of studying, it may typically take time. Contemplate the kind of reinforcement or punishment which will work greatest to your distinctive state of affairs and assess which sort of reinforcement schedule may lead lớn the very best outcomes.

Tài liệu tham khảo. Sources:

Coon, D & Mitterer, JO. Psychology: A Journey. Belmont, CA: Wadsworth; 2014.

Domjan, M. The Ideas of Studying and Conduct, Seventh Version. Stamford, CT; Cengage Studying; 2015.

Nguồn: sentayho.com.vn/operant-conditioning-a2-2794863

Như Trang.