বাড়ি উন্নয়ন রিইনফোর্সমেন্ট লার্নিং কী? - টেকোপিডিয়া থেকে সংজ্ঞা

রিইনফোর্সমেন্ট লার্নিং কী? - টেকোপিডিয়া থেকে সংজ্ঞা

সুচিপত্র:

Anonim

সংজ্ঞা - সংযুক্তি শিক্ষার অর্থ কী?

কৃত্রিম বুদ্ধিমত্তার প্রসঙ্গে রিইনফোর্সমেন্ট লার্নিং হ'ল এক ধরণের গতিশীল প্রোগ্রামিং যা পুরষ্কার ও শাস্তির ব্যবস্থা ব্যবহার করে অ্যালগরিদমকে প্রশিক্ষণ দেয়।

একটি শক্তিবৃদ্ধি শেখার অ্যালগরিদম বা এজেন্ট তার পরিবেশের সাথে ইন্টারঅ্যাক্ট করে শেখে। এজেন্ট সঠিকভাবে সম্পাদন করে এবং ভুলভাবে সম্পাদনের জন্য জরিমানা প্রাপ্ত করে। এজেন্ট কোনও মানুষের হস্তক্ষেপ ছাড়াই তার পুরষ্কার সর্বাধিক করে এবং তার জরিমানা হ্রাস করে শিখায়।

টেকোপিডিয়া রিইনফোর্ডমেন্ট লার্নিংয়ের ব্যাখ্যা দেয়

শক্তিবৃদ্ধি শেখা মেশিন লার্নিংয়ের এমন একটি পদ্ধতির যা আচরণবাদী মনোবিজ্ঞান দ্বারা অনুপ্রাণিত হয়। এটি একটি শিশু কীভাবে একটি নতুন কার্য সম্পাদন করতে শেখে তার অনুরূপ। অ্যালগরিদমকে কোনও কার্য সম্পাদন কীভাবে করা যায় তা স্পষ্টভাবে বলা হয়নি, তবে সমস্যাটি নিজে থেকে কাজ করে বলে শক্তিশালীকরণ শিখন অন্যান্য মেশিন লার্নিং পদ্ধতির সাথে বিপরীত হয়।

একজন এজেন্ট হিসাবে, যা একটি স্ব-ড্রাইভিং গাড়ি বা দাবা খেলা প্রোগ্রাম হতে পারে, তার পরিবেশের সাথে যোগাযোগ করে, কীভাবে এটি সম্পাদন করে তার উপর নির্ভর করে একটি পুরষ্কারের রাজ্য লাভ করে যেমন নিরাপদে গন্তব্যে গাড়ি চালানো বা কোনও খেলা জিততে। বিপরীতে, এজেন্ট ভুলভাবে কাজ করার জন্য যেমন একটি রাস্তা ছেড়ে যাওয়া বা চেকমাটেড হওয়ার জন্য একটি জরিমানা পায়।

এজেন্ট সময়ের সাথে সাথে তার পুরষ্কার সর্বাধিক করার এবং গতিশীল প্রোগ্রামিং ব্যবহার করে এর জরিমানা হ্রাস করার সিদ্ধান্ত নেয়। কৃত্রিম বুদ্ধিমত্তার কাছে এই পদ্ধতির সুবিধা হ'ল এটি কোনও এআই প্রোগ্রামকে কোনও প্রোগ্রামার বানান ছাড়াই শিখতে দেয় যে কোনও এজেন্ট কীভাবে কাজটি সম্পাদন করতে পারে।

রিইনফোর্সমেন্ট লার্নিং কী? - টেকোপিডিয়া থেকে সংজ্ঞা