সুচিপত্র:
সংজ্ঞা - প্রশ্ন-শেখার অর্থ কী?
কি-লার্নিং মডেল-মুক্ত শক্তিবৃদ্ধি শেখার প্রতিনিধিত্বকারী একটি অ্যালগরিদম কাঠামোর জন্য একটি শব্দ। নীতি মূল্যায়ন করে এবং স্টোকাস্টিক মডেলিং ব্যবহার করে, কি-লার্নিং একটি মার্কভ সিদ্ধান্ত প্রক্রিয়াতে এগিয়ে যাওয়ার সর্বোত্তম পথ সন্ধান করে।
টেকোপিডিয়া কিউ-লার্নিংয়ের ব্যাখ্যা দেয়
কিউ-লার্নিং অ্যালগরিদমের প্রযুক্তিগত মেকআপে একটি এজেন্ট, রাজ্যগুলির একটি সেট এবং প্রতি রাজ্যের ক্রিয়াকলাপ অন্তর্ভুক্ত।
কিউ ফাংশন পুরষ্কারকে মূল্য দিতে একটি ছাড়ের ফ্যাক্টরের সাথে একত্রে বিভিন্ন পদক্ষেপের জন্য ওজন ব্যবহার করে।
যদিও এটি একটি সহজ ধারণা বলে মনে হতে পারে, তবে বিভিন্ন ধরণের শক্তিবৃদ্ধি শেখার এবং গভীর শেখার মডেলগুলিতে কিউ-লার্নিং সর্বাধিক গুরুত্ব দেয় importance অন্যতম সেরা উদাহরণ হ'ল ডিপ কিউ-লার্নিং বিভিন্ন ধরণের ভিডিও গেমগুলিতে গেম-প্লে কৌশলগুলি শিখতে মেশিন লার্নিং প্রোগ্রামগুলিকে সহায়তা করতে ব্যবহৃত হয়, উদাহরণস্বরূপ, ১৯৮০ এর দশক থেকে আতারি গেমসে। এখানে একটি বিবর্তনমূলক নিউরাল নেটওয়ার্ক স্টোকাস্টিক মডেলটি কাজ করতে গেম-প্লেয়ের নমুনা নেয় যা কম্পিউটারকে সময়ের সাথে কীভাবে আরও ভাল খেলতে পারে তা জানতে সহায়তা করবে।
ক-লার্নিং কৃত্রিম বুদ্ধি এবং মেশিন লার্নিংকে এগিয়ে নিতে সাহায্য করার প্রচুর সম্ভাবনা রয়েছে।
