সুচিপত্র:
সংজ্ঞা - এক্সট্রাকশন বলতে কী বোঝায়?
এক্সট্রাকশন হ'ল ডেটা গুদামজাতীয় পরিবেশে ব্যবহারের জন্য নির্দিষ্ট ধরণের তথ্য উত্স থেকে প্রাসঙ্গিক তথ্য আহরণের প্রক্রিয়া। এক্সট্রাকশন ডেটাতে অর্থ সংযোজন করে এবং ডেটা ট্রান্সফর্মেশন প্রক্রিয়ার প্রথম ধাপ। এক্সট্রাকশন বিভিন্ন উত্স থেকে আগত বিপুল পরিমাণ ডেটা সংগ্রহ থেকে একটি শর্ত বা বিভাগের সাথে খাপ খায় এমন নির্দিষ্ট ডেটা বের করে।
টেকোপিডিয়া এক্সট্রাকশন ব্যাখ্যা করে
ডেটা গুদামজাতকরণের পরিবেশে, বিভিন্ন কাঠামো এবং অ-কাঠামোগত উত্স থেকে আগত বিশাল বিশাল ডেটা সংগ্রহ করতে হবে, অর্থপূর্ণ সিদ্ধান্ত এবং ভবিষ্যদ্বাণীগুলি অর্জন করতে প্রক্রিয়াজাতকরণ, রূপান্তর এবং সংরক্ষণ করতে হবে। প্রাথমিক উত্স থেকে আগত ডেটা অবশ্যই নিয়মিত পদ্ধতিতে ডেটা ওয়্যারহাউজিং সিস্টেমে আমদানি করতে হবে যা ডেটাতে বিভিন্ন ক্রিয়াকলাপ সম্পাদন করা সহজ করে। এই প্রক্রিয়াটিকে এক্সট্রাকশন বলা হয়। নিষ্কাশন নির্দিষ্ট নিয়ম অনুসরণ করে অন্যথায় কাঠামোগত ডেটাতে কাঠামো যুক্ত করে। নিম্নলিখিত তথ্য উত্তোলনে ব্যবহৃত কিছু কৌশল রয়েছে:
- প্যাটার্ন ম্যাচিং
- টেবিল-ভিত্তিক পদ্ধতি
- পাঠ্য বিশ্লেষণ