বাড়ি প্রবণতা বড় ডেটা পরিচালনা করার বিষয়ে 6 টি বড় কল্পকাহিনী

বড় ডেটা পরিচালনা করার বিষয়ে 6 টি বড় কল্পকাহিনী

সুচিপত্র:

Anonim

২০১৪ সালের মে মাসে ফরেস্টার রিসার্চ দু'টি প্রতিবেদন জারি করেছে যে বড় ডেটার আশেপাশে হাইপ সম্পর্কে নির্দিষ্ট সিদ্ধান্ত নিয়েছে। গবেষণা সংস্থা আড়াই শতাধিক বিপণন ও ব্যবসায়-উন্নয়ন নির্বাহীদের জরিপ করেছে। প্রতিবেদনের লেখকগণের মতে, বড় ডেটা বাকবিতণ্ডা সর্বকালের উচ্চ পর্যায়ে রয়েছে এবং প্রযুক্তি বিক্রেতারা অবিশ্বাস্য দাবী বলে মনে হয় এমন পণ্যগুলির সাথে তাল মিলিয়ে যাচ্ছেন।


গার্টনার ফররেস্টার গবেষণার সাথে একমত; যথেষ্ট হাইপ চারপাশে বড় ডেটা। ২০১৪ সালের সেপ্টেম্বরের প্রতিবেদনে, গার্টনার সবচেয়ে বড় পাঁচটি ডেথলথার পুরাণকে অজ্ঞান করে তুলেছে এবং গার্ডনার বিশ্লেষকরা বড় ডেটা এবং এর হেরফের সম্পর্কে কী ভুল ধারণা রয়েছে সে সম্পর্কে তাদের মতামত উপস্থাপন করেছেন। তাহলে বড় ডেটার সবচেয়ে বড় মিথ কী? চল একটু দেখি.

পৌরাণিক কাহিনী: বড় ডেটা গ্রহণে প্রত্যেকেই আমাদের চেয়ে এগিয়ে।

গার্টনার বলেছেন যে বড় ডেটার প্রতি আগ্রহ একটি সর্বকালের উচ্চতায়। তা সত্ত্বেও, পোল্ট্রিগুলির মধ্যে একটি পোল্ট্রি 13 শতাংশের ওয়ার্কিং সিস্টেম রয়েছে। কারণ: বেশিরভাগ সংস্থাগুলির এখনও ডেটা বড় সংগ্রহস্থল থেকে কোনও মান কীভাবে উপার্জন করা যায় তা নির্ধারণ করতে পারেনি। এখানে, গার্টনার জরিপটি ফরেস্টার রিপোর্টের চেয়ে বেশি আশাবাদী, যেখানে দেখা গেছে যে জরিপ অংশগ্রহণকারীদের মধ্যে মাত্র 9 শতাংশ বলেছেন যে তারা পরের বছর ধরে বড়-ডেটা টেলিকনোলজিকে বাস্তবায়নের পরিকল্পনা করেছিলেন। (বিগ ডেটাতে প্রচুর অফার রয়েছে 5 টি রিয়েল-ওয়ার্ল্ড সমস্যাগুলি আরও জানুন বিগ ডেটা সমাধান করতে পারে))

পৌরাণিক কাহিনী: আমাদের কাছে এতগুলি ডেটা রয়েছে; আমাদের প্রতিটি সামান্য ডাটা ত্রুটি সম্পর্কে চিন্তা করার দরকার নেই।

গার্টনার আমাদের যে বোধগম্য সেগুলি নিয়ে চিন্তিত: "আমাদের এত কিছু আছে, যেটুকু খারাপই তা খারাপ লাগে না।" গার্ডনার ভাইস প্রেসিডেন্ট এবং বিশিষ্ট বিশ্লেষক টেড ফ্রেডম্যান বিশ্বাস করেন যে পরিস্থিতিটি দেখার জন্য এটিই ভুল উপায়।


"বাস্তবে, যদিও প্রতিটি তথ্য ত্রুটি কম ডাটা থাকাকালীন পুরো ডেটাসেটের তুলনায় অনেক ছোট প্রভাব ফেলেছিল, সেখানে আরও বেশি ত্রুটি রয়েছে কারণ সেখানে আরও ডেটা রয়েছে, " ফ্রেডম্যান বলেছিলেন। "অতএব, পুরো ডেটাসেটের উপর নিম্নমানের ডেটাগুলির সামগ্রিক প্রভাব একই রয়েছে" "


ফ্রাইডম্যান উদ্বেগের আরও একটি কারণ যুক্ত করেছেন। বড়-ডেটা ক্যাপচারে প্রায়শই ব্যবসায়ের বাইরের ডেটা অন্তর্ভুক্ত থাকে, তাই এটি অজানা কাঠামো এবং উত্স। এটি ত্রুটির সম্ভাবনা বৃদ্ধি করে।

মিথ: বড় ডেটা প্রযুক্তি তথ্য সংহতকরণের প্রয়োজনীয়তা দূর করবে।

দুটি বড় ডেটা বিশ্লেষণ কৌশল রয়েছে যা বড় ডেটাতে প্রয়োগ করা যেতে পারে: "লেখার উপর স্কিমা" বা "পড়ার জন্য স্কিমা"। সম্প্রতি অবধি লেখার জন্য স্কিমাটিই ছিল একমাত্র পদ্ধতি। পঠিত স্কিমা হ'ল ডেটাবেস পরিচালনার বর্তমান ক্রেজ। লেখার স্কিমা থেকে পৃথক, যার জন্য একটি কাঠামোগত বিন্যাস প্রয়োজন, ডেটা তার কাঁচা ফর্ম্যাটে স্কিমা-অন-রিড ডাটাবেসে লোড করা হয়। তারপরে বিকাশকারীরা - হ্যাডোপের মতো অরক্ষিত ডাটাবেস প্ল্যাটফর্ম ব্যবহার করে - পৃথক তথ্যটিকে ব্যবহারযোগ্য বিন্যাসে বাঁকান। পড়ার উপর স্কিমার সুস্পষ্ট সুবিধাগুলি রয়েছে তবে গার্টনার উল্লেখ করেছেন যে, ডেটা ইন্টিগ্রেশনটি এক পর্যায়ে ঘটতে হবে।

রূপকথা: উন্নত বিশ্লেষণের জন্য ডেটা গুদাম ব্যবহার করা অর্থহীন।

ডেটা গুদাম তৈরির জন্য সময় ব্যয় করা অনেক তথ্য পরিচালকদের কাছে অর্থহীন বলে মনে হয়, বিশেষত যখন সদ্য-ক্যাপচার করা ডেটা ডেটা গুদামের চেয়ে আলাদা হয়। তবে গার্টনার আবারও সতর্ক করে দিয়েছে এমনকি উন্নত ডেটা অ্যানালিটিক্স ডেটা গুদাম এবং নতুন ডেটা ব্যবহার করবে, যার অর্থ ডেটা ইন্টিগ্রেটারদের অবশ্যই:

  • নতুন ডেটা ধরণের বিশ্লেষণের জন্য উপযুক্ত করে তুলুন
  • কোন ডেটা প্রাসঙ্গিক এবং ডেটা কোয়ালিটির প্রয়োজনীয় স্তরের সিদ্ধান্ত নিন
  • কীভাবে ডেটা একত্রিত করবেন তা নির্ধারণ করুন
  • ডেটা গুদাম বাদে অন্য জায়গায় ডেটা পরিশোধন ঘটতে পারে তা বুঝুন

মিথ: ডেটা হ্রদ ডেটা গুদাম প্রতিস্থাপন করবে।

ডেটা হ্রদগুলি ডেটা গুদামগুলিতে যেখানে ডেটা কাঠামোগত বিন্যাসে থাকে তার বিপরীতে পৃথকীকরণের ডেটাগুলির সংগ্রহস্থল। ডেটা হ্রদ তৈরি করতে ডেটা গুদামগুলির তুলনায় সামান্য সামনের প্রচেষ্টা (ডেটা ফর্ম্যাট করার দরকার নেই) লাগে, এ কারণেই ডেটা হ্রদ আগ্রহী।


গার্টনার জোর দিয়ে বলেছেন যে ডেটা থাকা কোনও মূল বিষয় নয় - অবহিত সিদ্ধান্ত গ্রহণের জন্য ক্যাপচারিত ডেটাগুলি হেরফের করতে সক্ষম হওয়াই মূল বিষয়। তদুপরি, সিদ্ধান্ত গ্রহণের সুবিধার্থে ডেটা হ্রদ (কিছুটা অপ্রমাণিত) ব্যবহার করা সমস্যাযুক্ত।


"ডেটা গুদামগুলিতে ইতিমধ্যে একটি সংস্থা জুড়ে বিস্তৃত ব্যবহারকারীদের সমর্থন করার ক্ষমতা রয়েছে, " গার্টনার গবেষণা পরিচালক নিক হিউডেকার বলেছেন। "তথ্য-পরিচালনার নেতাদের ডেটা হ্রদগুলি ধরার জন্য অপেক্ষা করতে হবে না।" (দত্তক নেওয়ার আগে বিগ ডেটা সম্পর্কে আপনার অবশ্যই 7 টি বিষয়ে বড় ডেটা গ্রহণ সম্পর্কে আরও জানুন))

বড় ডেটা ওয়ার্কস - নতুন ডেটা ম্যানিপুলেশন পদ্ধতিগুলি নাও পারে

গার্টনার "বিগ-ডেটা মিথ" এর পরিবর্তে "সবচেয়ে বড় ডেটা পুরাণ" বলেছিলেন কারণটি প্রতিবেদনটি পড়ার পরে স্পষ্ট হয়ে যায়। গার্টনার বড় ডেটা ফাঁস করে না। গার্টনার তাদের উদাসীন যারা বড় ডেটা ম্যানিপুলেট করার নতুন পদ্ধতিগুলি "প্রাইম টাইম" এর জন্য প্রস্তুত বলে মনে করেন।

বড় ডেটা পরিচালনা করার বিষয়ে 6 টি বড় কল্পকাহিনী