প্রশ্ন:
কিছু মেশিন লার্নিং প্রকল্পগুলিতে কেন বিপুল সংখ্যক অভিনেতার প্রয়োজন হতে পারে?
উত্তর:আপনি যখন মেশিন লার্নিংয়ের কথা ভাবেন, আপনি কম্পিউটারের ঘরে কীবোর্ডে দক্ষ ডেটা বিজ্ঞানীদের কথা ভাবেন। পরিমাণগত বিশ্লেষণ এবং অ্যালগরিদমের উপর চূড়ান্ত জোর দেওয়া হয়। এই প্রোগ্রামগুলির অনেকের কাছে তাত্ক্ষণিক বাস্তব-জগতের প্রসঙ্গ নেই - অন্ততপক্ষে, এটাই অনেকে মনে করবেন।
তবে, আজকের বেশিরভাগ গ্রাউন্ডব্রেকিং মেশিন লার্নিং প্রোগ্রামগুলি রাস্তায়, স্টোর এবং যে কোনও জায়গায় মানব অভিনেতাদের যথার্থ সেনাবাহিনী ব্যবহার করছে যে তারা হাঁটাচলা, কাজ করা বা কেনাকাটার মতো মৌলিক মানবিক কাজের মডেল করতে পারে।
ফ্রি ডাউনলোড: মেশিন লার্নিং এবং কেন এটি গুরুত্বপূর্ণ |
টম সাইমনাইটের একটি তারযুক্ত নিবন্ধটি এপি শিরোনাম "এআই স্মার্টকে তৈরি করতে, মনুষ্যদের অডবোল লো-পেইড টাস্কগুলি সম্পাদন করুন" শীর্ষক শিরোনামের সাথে এটি খুব ভালভাবে ফুটিয়ে তুলেছে।
পুরো খাবারের মুদি দোকানে নেওয়া সংক্ষিপ্ত ভিডিওগুলির উদাহরণ ব্যবহার করে সাইমনাইট এমন ধরণের কাজকে হাইলাইট করে যা মেশিন লার্নিংয়ের পরবর্তী পর্যায়ে কিছুটা তৈরি করতে সহায়তা করবে।
এটি এই প্রশ্নটির দিকে পরিচালিত করে যে এই সমস্ত লোক কেন একটি হাত বা পা সরে যাওয়ার মতো প্রাথমিক কাজ হিসাবে ডকুমেন্টিং সংক্ষিপ্ত এবং সাধারণ ভিডিওগুলিতে চিত্রায়িত করতে ব্যস্ত।
উত্তরটি কোথায় মেশিন লার্নিং এবং কোথায় চলছে সে সম্পর্কে কিছুটা আলোকপাত করে।
সিমোনাইট লেখেন যে তিনি এবং অন্যরা কেন ক্যামেরা নিয়ে ঘোরাফেরা করছেন, ব্যাখ্যা করে "গবেষকরা এবং উদ্যোক্তারা এআইকে দৈহিক বিশ্বে বুঝতে এবং তাদের অভিনয় দেখতে চান।" “অতএব শ্রমিকদের সুপারমার্কেট এবং বাড়িতে দৃশ্য প্রদর্শনের প্রয়োজন। তারা বিশ্ব এবং সেখানকার মানুষদের সম্পর্কে অ্যালগরিদম শেখানোর জন্য নির্দেশিক উপাদান তৈরি করছে ”
যেহেতু অনেক বিশেষজ্ঞ ইঙ্গিত করবেন, মেশিন লার্নিংয়ের বৃহত্তম বৃহত্তম সীমান্তগুলির মধ্যে ইমেজ প্রসেসিং এবং প্রাকৃতিক ভাষা প্রক্রিয়াকরণ জড়িত। এগুলি অত্যন্ত পরিমাণগত পদ্ধতি - অন্য কথায়, "পারফরম্যান্ট" রিয়েল-ওয়ার্ল্ড পরিবেশের মতো ইনপুটগুলির বিস্তৃত বর্ণালী নেই। পরিবর্তে, মেশিন লার্নিং প্রোগ্রামগুলি মডেল তৈরির জন্য খুব নির্দিষ্ট উপায়ে ভিজ্যুয়াল এবং অডিও ডেটা ব্যবহার করছে। চিত্র প্রক্রিয়াজাতকরণের সাথে, এটি দর্শনের (সীমাবদ্ধ) ক্ষেত্র থেকে বৈশিষ্ট্যগুলি বাছাই করছে। এনএলপি-র জন্য, এটি ফোনমেজাগুলি জমা করছে।
এই নির্দিষ্ট ইনপুট বিভাগগুলির বাইরে যাওয়াতে এমন কিছু জড়িত যা আপনি "চিত্র এবং স্পিচ ফাঁক" বলতে পারেন - চিত্র প্রক্রিয়াকরণ এবং স্পিচ সনাক্তকরণের মতো জিনিসগুলি ছাড়িয়ে আপনি এমন অঞ্চলে চলে যাচ্ছেন যেখানে কম্পিউটারগুলি বিভিন্ন উপায়ে বিশ্লেষণী হতে হয়। প্রশিক্ষণের সেটগুলি মূলত আলাদা হবে be
ভিডিওগ্রাফারদের সেনাবাহিনী প্রবেশ করুন। এই নতুন কিছু মেশিন লার্নিং প্রকল্পগুলির মধ্যে, মানুষের ক্রিয়াকলাপগুলির ক্ষুদ্রতম ধারণাগুলি হ'ল প্রশিক্ষণ সেট। শ্রেণিবদ্ধকরণ কার্যগুলিতে রচনা করা বৈশিষ্ট্য এবং প্রান্ত এবং পিক্সেলগুলি সন্ধানের জন্য প্রশিক্ষিত হওয়ার পরিবর্তে কম্পিউটারগুলি পরিবর্তে বিভিন্ন ধরণের ক্রিয়া কী দেখায় তা নির্ধারণের জন্য প্রশিক্ষণ ভিডিও ব্যবহার করছে।
মূল বিষয় হ'ল ইঞ্জিনিয়াররা যখন এই ডেটা সংহত এবং লোড করা হয় এবং কম্পিউটারটি এতে প্রশিক্ষিত হয় তখন কী করতে পারে। আপনি শীঘ্রই বিভিন্ন ক্ষেত্রে ফলাফল দেখতে পাবেন - উদাহরণস্বরূপ, এটি নজরদারিটিকে অত্যন্ত কার্যকর করে তুলবে। কম্পিউটারগুলি লোকেরা কী করছে তা ভিজ্যুয়াল ক্ষেত্রে "দেখতে" সক্ষম হতে পারে এবং বিপণন ও বিক্রয় যেমন বা সম্ভবত কিছু ক্ষেত্রে সরকারী সংস্থার কাজ বা অপরাধমূলক বিচারের ক্ষেত্রে প্রয়োগ করতে পারে।
এই পদক্ষেপগুলি সর্বোচ্চ সুবিধা এবং গোপনীয়তার প্রশ্নগুলির মধ্যে বিতর্ককে কিছুটা আলোকপাত করেছে। এই ভিডিওগুলির বেশিরভাগ ব্যবহার মেশিন লার্নিং মডেলগুলি তৈরি করবে যা নজরদারি করার জন্য কাজ করে - তবে যারা জরিপ করতে চান না তাদের সম্পর্কে কী বলা যায়? এই নতুন মেশিন লার্নিং প্রোগ্রামগুলি যখন সর্বজনীন স্থানে স্থাপন করা হয়, তখন ব্যক্তির অধিকার কী এবং সেই লাইনটি কোথায় আঁকানো হয়?
যাই হোক না কেন, সংস্থাগুলি মেশিন লার্নিং অগ্রগতির কয়েকটি পরবর্তী স্তরের রাউন্ডগুলি সত্যই খনন করতে এই ধরণের মানব এবং ভিডিও সংস্থানগুলি ব্যবহার করছে যা কেবলমাত্র চিত্রগুলিকে শ্রেণিবদ্ধ করা বা ফোনের সাথে কাজ করার পরিবর্তে কম্পিউটারকে তাদের চারপাশে কী ঘটছে তা সনাক্ত করতে সক্ষম করবে rather বক্তৃতা। এটি কৃত্রিম বুদ্ধিমত্তার একটি অত্যন্ত আকর্ষণীয় এবং বিতর্কিত উন্নয়ন, এবং প্রযুক্তি মিডিয়া এবং এর বাইরেও এর মনোযোগের অংশীদার দাবিদার।