বাড়ি প্রবণতা কীভাবে বিদ্যমান ডেটা গুদামের পরিবেশগুলি বড় ডেটা বিশ্লেষণের চাহিদা পূরণের জন্য সেরা স্কেল করতে পারে?

কীভাবে বিদ্যমান ডেটা গুদামের পরিবেশগুলি বড় ডেটা বিশ্লেষণের চাহিদা পূরণের জন্য সেরা স্কেল করতে পারে?

Anonim

প্রশ্ন:

কীভাবে বিদ্যমান ডেটা গুদামের পরিবেশগুলি বড় ডেটা বিশ্লেষণের চাহিদা পূরণের জন্য সেরা স্কেল করতে পারে?

উত্তর:

পৃথক তথ্য গুদাম প্রকল্পগুলির কেস-কেস-কেস ভিত্তিতে মূল্যায়ন করা দরকার। সাধারণত, বড় ডেটা অ্যানালিটিকাকে আরও ভালভাবে পরিচালনা করার জন্য একটি বিদ্যমান ডেটা গুদাম ডিজাইনের প্রসারিত করার চেষ্টা করার জন্য, কী করা দরকার তা নির্ধারণের জন্য একটি মূল প্রক্রিয়া রয়েছে। আইটি পেশাদাররা এটিকে "স্কেলিং আপ" বা "স্কেলিং আউট" বলতে পারেন।

ওয়েবিনার: বড় আয়রন, বড় ডেটা দেখা: হ্যাডোপ এবং স্পার্কের সাথে মেইনফ্রেম ডেটা মুক্তি

এখানে নিবন্ধন করুন

স্কেলিংয়ের মধ্যে সাধারণত পর্যাপ্ত প্রক্রিয়াকরণ শক্তি পাওয়া, পর্যাপ্ত পরিমাণ মেমরি পাওয়া এবং ব্যবসায়ের যে সমস্ত বৃহত্তর ডেটা সেট সেট হয়ে যায় সেগুলি হ্যান্ডেল করার জন্য আরও শক্তিশালী সার্ভার ক্রিয়াকলাপকে সামঞ্জস্য করা। বিপরীতে, স্কেলিংয়ের অর্থ সার্ভার হার্ডওয়্যারগুলির ক্লাস্টারগুলি সংগ্রহ করা এবং বড় ডেটার সাথে একত্রে নেটওয়ার্কিং করা।

কিছু আইটি বিশেষজ্ঞ পরামর্শ দিয়েছেন যে আপাচি হাদুপ এবং অন্যান্য জনপ্রিয় বড় ডেটা সরঞ্জাম এবং প্ল্যাটফর্মগুলির সাথে আরও সাধারণ পদ্ধতি হ'ল কাঙ্ক্ষিত প্রভাবগুলি অর্জনের জন্য হার্ডওয়্যার স্কেল আউট করা এবং ক্লাস্টার হার্ডওয়্যার। তবে, অন্যরা উল্লেখ করেছেন যে আজকের প্রযুক্তির সাহায্যে একটি ডেটা গুদাম একটি ক্রয় কৌশল ব্যবহার করে স্কেল করতে পারে যা একটি সার্ভারে সংস্থান যুক্ত করে, যেমন প্রচুর পরিমাণে র‌্যামের সাথে আরও বেশি সংখ্যক প্রসেসিং কোর পেয়ে থাকে।

তারা স্কেল বা স্কেল আউট হোক না কেন, ডেটা গুদামগুলিকে বড় ডেটা ওয়ার্ক লোডগুলি পরিচালনা করতে সক্ষম হতে অতিরিক্ত শারীরিক হার্ডওয়্যার সম্পদ প্রয়োজন need তাদের অতিরিক্ত মানব প্রশাসনেরও প্রয়োজন, যার অর্থ অভ্যন্তরীণ দলগুলির জন্য আরও প্রশিক্ষণ। একটি নতুন বিগ ডাটা ইকোসিস্টেমের জন্য এটির সজ্জিত করার জন্য বিদ্যমান লিগ্যাসি সিস্টেমে বৃহত্তর ডেটা ওয়ার্ক লোডগুলির কী ধরণের চাপ এবং চাপ পড়বে তা নির্ধারণ করতে প্রচুর পরিকল্পনার প্রকল্পে যেতে হবে। একটি বড় সমস্যা হ'ল স্টোরেজ বাধা, যার জন্য স্টোরেজ সেন্টারে আপগ্রেড প্রয়োজন হয় এবং অন্যান্য ধরণের পারফরম্যান্স বাধা যেগুলি সম্বোধন না করা হলে একটি নবজাতক সিস্টেমকে হাবলু করতে পারে।

কীভাবে বিদ্যমান ডেটা গুদামের পরিবেশগুলি বড় ডেটা বিশ্লেষণের চাহিদা পূরণের জন্য সেরা স্কেল করতে পারে?