বাড়ি এটি বাণিজ্যিক বড় এবং ছোট ডেটা: আসল মানটি কোথায়?

বড় এবং ছোট ডেটা: আসল মানটি কোথায়?

সুচিপত্র:

Anonim

বড় ডেটা হ'ল একটি কম্বল শব্দ যা প্রচুর পরিমাণে ডেটা হ্যান্ডলিংয়ের জন্য ব্যবহৃত হয়। আমরা সকলেই বুঝতে পারি যে ডেটার পরিমাণ যত বেশি হবে তত জটিল হয়। প্রচলিত ডাটাবেস সমাধানগুলি প্রায়শই তাদের জটিলতা এবং আকারের কারণে বড় পরিমাণে ডেটা সঠিকভাবে পরিচালনা করতে ব্যর্থ হয়। সুতরাং, প্রচুর পরিমাণে ডেটা পরিচালনা করা এবং প্রকৃত অন্তর্দৃষ্টি আহরণ করা একটি চ্যালেঞ্জিং কাজ। একই "মান" ধারণাটি ছোট ডেটার ক্ষেত্রেও প্রযোজ্য।

বিগ ডেটা কীভাবে ব্যবহৃত হয়

আরডিবিএমএস ধারণার ভিত্তিতে প্রচলিত ডাটাবেস সমাধানগুলি লেনদেনের ডেটাগুলি খুব ভাল পরিচালনা করতে পারে এবং বিভিন্ন অ্যাপ্লিকেশনগুলিতে বহুল ব্যবহৃত হয়। কিন্তু যখন ডেটাগুলির একটি বৃহত সেট হ্যান্ডেল করার বিষয়টি আসে (ডেটা যা সংরক্ষণাগারযুক্ত এবং টেরাইবাইট বা পেটাবাইটে থাকে), এই ডাটাবেস সমাধানগুলি প্রায়শই ব্যর্থ হয়। এই ডেটা সেটগুলি অনেক বড় এবং বেশিরভাগ সময় theyতিহ্যবাহী ডাটাবেসের আর্কিটেকচারের সাথে খাপ খায় না। এই দিনগুলিতে, বড় ডেটা বড় আকারের ডেটা হ্যান্ডল করার জন্য একটি ব্যয়-কার্যকর পদ্ধতিতে পরিণত হয়েছে। সাংগঠনিক দৃষ্টিকোণ থেকে, বড় ডেটার ব্যবহারগুলি নিম্নলিখিত বিভাগগুলিতে বিভক্ত হতে পারে, যেখানে বড় ডেটার আসল মান থাকে:

  • বিশ্লেষণাত্মক ব্যবহার

    বড় ডেটা বিশ্লেষকরা তথ্যের অনেকগুলি গুরুত্বপূর্ণ লুকানো দিক প্রকাশ করেছেন যা প্রক্রিয়া করা খুব ব্যয়বহুল। উদাহরণস্বরূপ, যদি আমাদের কোনও নির্দিষ্ট নতুন বিষয়ে শিক্ষার্থীদের প্রবণতা পরীক্ষা করতে হয়, তবে আমরা প্রতিদিনের উপস্থিতি রেকর্ড এবং অন্যান্য সামাজিক এবং ভৌগোলিক তথ্য বিশ্লেষণ করে এটি করতে পারি। এই তথ্যগুলি ডাটাবেসে ধরা পড়ে। আমরা যদি এই পদ্ধতিতে দক্ষ পদ্ধতিতে অ্যাক্সেস না করতে পারি তবে আমরা ফলাফলগুলি দেখতে পাচ্ছি না।

  • নতুন পণ্য সক্ষম করুন

    সাম্প্রতিক সময়ে, ফেসবুকের মতো অনেকগুলি নতুন ওয়েব সংস্থা নতুন পণ্য লঞ্চ করার সমাধান হিসাবে বড় ডেটা ব্যবহার শুরু করেছে। আমরা সবাই জানি ফেসবুক কতটা জনপ্রিয় - এটি সফলভাবে বড় ডেটা ব্যবহার করে একটি উচ্চ-পারফরম্যান্স ব্যবহারকারীর অভিজ্ঞতা প্রস্তুত করেছে।

আসল মূল্য কোথায়?

বিভিন্ন বড় ডেটা সমাধানের পদ্ধতিতে তারা ডেটা সংরক্ষণ করে এমন পদ্ধতির মধ্যে পৃথক হয় তবে শেষ পর্যন্ত, তারা সবগুলি একটি ফ্ল্যাট ফাইলের কাঠামোর মধ্যে ডেটা সঞ্চয় করে। সাধারণভাবে, হ্যাডোপ ফাইল সিস্টেম এবং কিছু অপারেটিং-সিস্টেম-স্তরের ডেটা বিমূর্ততা নিয়ে গঠিত। এর মধ্যে একটি মানচিত্রার ইঞ্জিন এবং হ্যাডোপ বিতরণকারী ফাইল সিস্টেম (এইচডিএফএস) অন্তর্ভুক্ত রয়েছে। একটি সাধারণ হাদুপ ক্লাস্টারে একটি মাস্টার নোড এবং বেশ কয়েকটি কর্মী নোড অন্তর্ভুক্ত থাকে। মাস্টার নোড নিম্নলিখিতগুলি নিয়ে গঠিত:

  • টাস্ক ট্র্যাকার
  • জব ট্র্যাকার
  • নাম নোড
  • ডেটা নোড
কর্মী নোড নিম্নলিখিতটি নিয়ে গঠিত:
  • টাস্ক ট্র্যাকার
  • ডেটা নোড

কিছু বাস্তবায়নে কেবল ডেটা নোড থাকে। ডেটা নোড হ'ল আসল অঞ্চল যেখানে ডেটা থাকে। এইচডিএফএস একাধিক মেশিনে বিতরণ করা বড় ফাইলগুলি (টেরাবাইট থেকে পেটাবাইটের পরিসরে) সঞ্চয় করে। প্রতিটি নোডের ডেটার নির্ভরযোগ্যতা সমস্ত হোস্ট জুড়ে তথ্য প্রতিলিপি করে অর্জন করা হয়। সুতরাং, নোডগুলির একটি নিচে থাকলেও ডেটা উপলব্ধ। এটি প্রশ্নের বিরুদ্ধে দ্রুত প্রতিক্রিয়া অর্জনে সহায়তা করে। এই ধারণাটি ফেসবুকের মতো বিশাল অ্যাপ্লিকেশনগুলির ক্ষেত্রে খুব দরকারী। একজন ব্যবহারকারী হিসাবে, আমরা আমাদের চ্যাটের অনুরোধটির প্রতিক্রিয়া পাই, উদাহরণস্বরূপ, প্রায় অবিলম্বে। এমন একটি দৃশ্য বিবেচনা করুন যেখানে চ্যাট করার সময় কোনও ব্যবহারকারীকে দীর্ঘ সময়ের জন্য অপেক্ষা করতে হবে। যদি বার্তা এবং পরবর্তী প্রতিক্রিয়া অবিলম্বে সরবরাহ করা হয় না, তবে প্রকৃতপক্ষে কত লোক এই চ্যাটিং সরঞ্জামগুলি ব্যবহার করবে?

ফেসবুক বাস্তবায়নে ফিরে যাওয়া, যদি ক্লাস্টারগুলিতে ডেটাটির পুনরায় প্রতিলিপি না করা হয় তবে আবেদনময়ী বাস্তবায়ন সম্ভব হবে না। হাদুপ একটি বৃহত ক্লাস্টারে মেশিনে ডেটা বিতরণ করে এবং ফাইলগুলিকে ব্লকের ক্রম হিসাবে সংরক্ষণ করে। এই ব্লকগুলি শেষ ব্লক ব্যতীত অভিন্ন আকারের। প্রয়োজন অনুসারে ব্লক এবং প্রতিরূপ ফ্যাক্টরের আকার কাস্টমাইজ করা যায়। এইচডিএফএস-এ থাকা ফাইলগুলি একবারে লেখার পদ্ধতির কঠোরভাবে অনুসরণ করে এবং তাই কেবল একবারে কোনও ব্যবহারকারী লিখে বা সম্পাদনা করতে পারে। ব্লকগুলির প্রতিলিপি সংক্রান্ত সিদ্ধান্তগুলি নাম নোড দ্বারা নেওয়া হয়। নাম নোড প্রতিটি ডেটা নোড থেকে প্রতিবেদন এবং নাড়ি প্রতিক্রিয়া প্রাপ্ত করে। নাড়ি প্রতিক্রিয়াগুলি সম্পর্কিত ডেটা নোডের উপলভ্যতা নিশ্চিত করে। রিপোর্টে ডেটা নোডের ব্লকগুলির বিশদ রয়েছে contains


আরেকটি বড় ডেটা বাস্তবায়ন, ক্যাসান্দ্রাও একই ধরণের বিতরণ ধারণাটি ব্যবহার করে। কাসান্দ্রা ভৌগলিক অবস্থানের ভিত্তিতে ডেটা বিতরণ করে। অতএব, ক্যাসান্দ্রায়, ডেটা ব্যবহারের ভৌগলিক অবস্থানের ভিত্তিতে ডেটা পৃথক করা হয়।

কখনও কখনও ছোট ডেটা একটি বড় (এবং কম ব্যয়বহুল) প্রভাব তৈরি করে

ওপেন নলেজ ফাউন্ডেশনের রুফাস পোলক অনুসারে, বড় ডেটা ঘিরে হাইপ তৈরি করার কোনও মানে নেই যখন ছোট তথ্য এখনও সেই জায়গা যেখানে আসল মূল্য থাকে lies


নামটি যেমন বোঝায়, ছোট ডেটা হ'ল ডেটার একটি বৃহত সেট থেকে লক্ষ্যবস্তু সেট। ছোট ডেটা ডেটা ব্যবহার থেকে ফোকাস স্থানান্তর করতে ইচ্ছুক এবং এটি বড় ডেটার দিকে যাওয়ার প্রবণতা মোকাবিলারও লক্ষ্য করে। ক্ষুদ্র ডেটা পদ্ধতির কম প্রচেষ্টা ব্যবহার করে নির্দিষ্ট প্রয়োজনীয়তার উপর ভিত্তি করে ডেটা সংগ্রহ করতে সহায়তা করে। ফলস্বরূপ, ব্যবসায়ের বুদ্ধি প্রয়োগের সময় এটি আরও কার্যকর ব্যবসায়িক অনুশীলন।


এর মূল অংশে, ছোট ডেটা ধারণাগুলি ব্যবসায়ের চারদিকে ঘোরে যেগুলির জন্য আরও প্রয়োজনীয় পদক্ষেপের প্রয়োজন এমন ফলাফলের প্রয়োজন হয়। এই ফলাফলগুলি দ্রুত আনতে হবে এবং পরবর্তী ক্রিয়াটিও তাত্ক্ষণিকভাবে কার্যকর করা উচিত। সুতরাং, আমরা বড় ডেটা বিশ্লেষণে সাধারণত ব্যবহৃত ধরণের সিস্টেমগুলি দূর করতে পারি।


সাধারণভাবে, যদি আমরা বড় ডেটা অধিগ্রহণের জন্য প্রয়োজনীয় কয়েকটি নির্দিষ্ট সিস্টেম বিবেচনা করি তবে কোনও সংস্থার প্রচুর সার্ভার স্টোরেজ স্থাপন করতে, পরিশীলিত উচ্চ-শেষের সার্ভার এবং সর্বশেষ ডেটা মাইনিং অ্যাপ্লিকেশনগুলিকে বিভিন্ন বিট পরিচালনা করতে বিনিয়োগ করতে পারে, ব্যবহারকারীর ক্রিয়া তারিখ এবং সময় সহ, ডেমোগ্রাফিক তথ্য এবং অন্যান্য তথ্য। এই সম্পূর্ণ ডেটা সেটটি একটি কেন্দ্রীয় ডেটা গুদামে চলে আসে, যেখানে জটিল অ্যালগরিদমগুলি বিশদ প্রতিবেদনের আকারে প্রদর্শন করার জন্য ডেটা বাছাই এবং প্রক্রিয়া করার জন্য ব্যবহৃত হয়।


আমরা সকলেই জানি যে এই সমাধানগুলি স্কেল্যাবিলিটি এবং প্রাপ্যতার দিক থেকে অনেক ব্যবসায়কে উপকৃত করেছে; এমন সংস্থাগুলি রয়েছে যেগুলি আবিষ্কার করে যে এই পদ্ধতিগুলি অবলম্বন করার জন্য যথেষ্ট প্রচেষ্টা প্রয়োজন require এটিও সত্য যে কোনও কোনও ক্ষেত্রে, কম-শক্তিশালী ডেটা মাইনিং কৌশল ব্যবহার করে অনুরূপ ফলাফল অর্জন করা হয়।


সংক্ষিপ্ত ডেটা সংস্থাগুলিকে সর্বশেষ এবং সর্বাধিক প্রযুক্তিযুক্ত প্রযুক্তিগুলির সাথে একটি আবেশ থেকে ফিরে আসার একটি উপায় সরবরাহ করে যা আরও পরিশীলিত ব্যবসায়িক প্রক্রিয়াগুলিকে সমর্থন করে। যে সংস্থাগুলি ছোট ডেটা প্রচার করছে তারা যুক্তি দেখান যে ব্যবসায়ের দিক থেকে দক্ষতার সাথে তাদের সংস্থানগুলি ব্যবহার করা গুরুত্বপূর্ণ, যাতে প্রযুক্তির উপর অতিরিক্ত অর্থ ব্যয় একটি নির্দিষ্ট পরিমাণে এড়ানো যায়।


আমরা বড় ডেটা এবং ছোট ডেটা বাস্তবতা সম্পর্কে অনেক আলোচনা করেছি, তবে আমাদের অবশ্যই বুঝতে হবে যে সঠিক ব্যবহারের জন্য সঠিক প্ল্যাটফর্ম (বড় ডেটা বা ছোট ডেটা) নির্বাচন করা পুরো অনুশীলনের সবচেয়ে গুরুত্বপূর্ণ অঙ্গ। এবং সত্যটি হ'ল যখন বড় ডেটা প্রচুর উপকার সরবরাহ করতে পারে তবে এটি সর্বদা সেরা নয়।

বড় এবং ছোট ডেটা: আসল মানটি কোথায়?