সুচিপত্র:
সংজ্ঞা - অ্যাপাচি পিগ মানে কি?
অ্যাপাচি পিগ এমন একটি প্ল্যাটফর্ম যা বড় ডেটা সেটগুলি বিশ্লেষণ করতে ব্যবহৃত হয়। ডেটা বিশ্লেষণ প্রোগ্রাম প্রকাশ করার জন্য এটি একটি উচ্চ-স্তরের ভাষা এবং এই প্রোগ্রামগুলির মূল্যায়নের অবকাঠামোগত সমন্বয়ে গঠিত। পিগের একটি উল্লেখযোগ্য বৈশিষ্ট্য হ'ল এর কাঠামোটি উল্লেখযোগ্য সমান্তরালনের জন্য প্রতিক্রিয়াশীল।
পিগ হ্যাডোপ প্ল্যাটফর্মে কাজ করে, হ্যাডোপ ডিস্ট্রিবিউটেড ফাইল সিস্টেম (এইচডিএফএস) থেকে ডেটা লেখার এবং পড়ার এবং এক বা একাধিক মানচিত্রের কাজের মাধ্যমে প্রক্রিয়াজাতকরণ সম্পাদন করে। ওপেন সোর্স হিসাবে অ্যাপাচি পিগ উপলব্ধ।
অ্যাপাচি পিগ পিগ প্রোগ্রামিং ল্যাঙ্গুয়েজ বা হাদুপ পিগ নামেও পরিচিত।
টেকোপিডিয়া অ্যাপাচি পিগ ব্যাখ্যা করে
অ্যাপাচি পিগের দুটি অংশ রয়েছে: পিগ ল্যাটিন ভাষা এবং পিগ ইঞ্জিন। পিগ ল্যাটিন ভাষা হ'ল একটি স্ক্রিপ্টিং ভাষা যা ব্যবহারকারীরা এক বা একাধিক ইনপুট থেকে ডেটা প্রবাহকে যেভাবে পড়তে হবে এবং প্রক্রিয়াকরণ করতে হবে এবং সেই অবস্থানটি অবশ্যই সংরক্ষণ করতে হবে তা চিত্রিত করতে দেয়।
পিগ ল্যাটিনের কয়েকটি মূল বৈশিষ্ট্য নিম্নরূপ:
- প্রোগ্রামে সহজ: বিভিন্ন আন্তঃসংযুক্ত ডেটা ট্রান্সফর্মেশন নিয়ে গঠিত জটিল কাজগুলি স্পষ্টভাবে ডেটা ফ্লো সিকোয়েন্স হিসাবে এনকোড করা আছে। এটি তাদের লিখতে, বুঝতে এবং বজায় রাখতে সহজ করে তোলে।
- অপ্টিমাইজেশন সম্ভাবনা: যে পদ্ধতিতে কার্যগুলি এনকোড করা হয়েছে তাতে সিস্টেমটি স্বয়ংক্রিয় প্রয়োগ কার্যকর করতে পারে to এটি ব্যবহারকারীকে দক্ষতার পরিবর্তে শব্দার্থবিজ্ঞানের দিকে মনোযোগ দিতে দেয়।
- এক্সটেনসিবিলিটি: বিশেষ উদ্দেশ্যমূলক প্রক্রিয়াজাতকরণের জন্য ব্যবহারকারীদের নিজস্ব ফাংশন তৈরি করার অনুমতি দেওয়া হয়। পিগ ইঞ্জিনটি পিগ লাতিন ভাষায় লিখিত ডেটা প্রবাহের সম্পাদনের জন্য দায়ী। অনেকটা স্ট্যান্ডার্ড রিলেশনাল ডাটাবেস ম্যানেজমেন্ট সিস্টেম (আরডিবিএমএস) ডিজাইনের মতো, অ্যাপাচি পিগের মধ্যে ডেটা প্রসেসিং পরিচালিত অপারেটরদের পাশাপাশি একটি পার্সার, অপটিমাইজার এবং টাইপ পরীক্ষকও থাকে। শুয়োর মধ্যে লেনদেন, একটি ডেটা ক্যাটালগ বা সরাসরি ডেটা স্টোরেজ পরিচালনা করার বা কার্যকর করার কাঠামোর নিয়োগ করার ক্ষমতা অন্তর্ভুক্ত নয়।
