অ্যামাজন রেডশিফ্ট ডেটাটাইপগুলি কী কী?

A Yamajana Redasiphta Detata Ipaguli Ki Ki



Amazon Redshift হল AWS দ্বারা অফার করা একটি ক্লাউড সমাধান যা ডেটা গুদামের উদ্দেশ্য পূরণ করে। একটি ডেটা গুদাম হল ক্লাউডের একটি বড় স্থান যা প্রচুর পরিমাণে ডেটা সঞ্চয় করে। একটি ডেটা গুদাম এবং একটি ডাটাবেসের মধ্যে পার্থক্য হল যে প্রাক্তন শুধুমাত্র বর্তমান ডেটা সংরক্ষণ করে না কিন্তু ডেটার সম্পূর্ণ ইতিহাসও সংরক্ষণ করে।

এই নিবন্ধটি AWS দ্বারা Amazon Redshift এবং এই পরিষেবাটি সমর্থন করে এমন ডেটা প্রকারগুলি সম্পর্কে শিখবে৷







Amazon RedShift কি?

এটি ডেটা গুদামজাতকরণের একটি ক্লাউড সমাধান যা ভিত্তি করে 'PostgreSQL' . এটি নামে একটি প্রযুক্তি ব্যবহার করে 'ম্যাসিভলি প্যারালাল প্রসেসিং (এমপিপি)' বিদ্যুতের গতিতে পেটাবাইট ডেটা প্রক্রিয়া করতে। এটি ঐতিহাসিক ডেটা এবং স্ট্রিমিং সমাধানের উপর ভিত্তি করে রিয়েল-টাইম ভবিষ্যদ্বাণীর জন্য একটি সহজ সমাধান প্রদান করে।



নিম্নলিখিত চিত্রটি অ্যামাজন রেডশিফ্টের কাজের প্রক্রিয়া দেখায়:







অ্যামাজন রেডশিফ্ট কীভাবে কাজ করে তার এই গ্রাফিকাল ব্যাখ্যাটি খুবই সহজ এবং স্পষ্ট। এটি আমাদের তথ্য দেয় কিভাবে ডেটা পুনরুদ্ধার করা হয় এবং আউটপুট তৈরি করতে এবং ডেটা-চালিত অ্যাপ্লিকেশন তৈরি করতে আরও প্রক্রিয়া করা হয়।

অ্যামাজন রেডশিফ্টের ডেটা গুদামের আর্কিটেকচারটি নীচের চিত্রটিতেও দেখা যেতে পারে:



এখন, আমরা এই পরিষেবাটির ব্যবহার এবং বৈশিষ্ট্যগুলি নিয়ে যাব।

বৈশিষ্ট্য

ইতিমধ্যে উল্লিখিত হিসাবে, Amazon Redshift PostgreSQL এর উপর ভিত্তি করে এবং ম্যাসিভলি প্যারালাল প্রসেসিং নামক একটি প্রযুক্তি ব্যবহার করে যা এটিকে কোনো সময়ের মধ্যে পেটাবাইট ডেটা প্রক্রিয়া করতে সক্ষম করে। অতএব, রেডশিফ্ট অনেকগুলি বৈশিষ্ট্য এবং ব্যবহার অফার করে। এই বৈশিষ্ট্যগুলির মধ্যে কয়েকটি নীচে দেওয়া হল:

  • ডেটা নিরাপত্তা এবং এনক্রিপশন।
  • বাণিজ্যিক বিশ্লেষণ.
  • ডেটা চালিত অ্যাপ্লিকেশন সমর্থন।
  • ভবিষ্যদ্বাণীমূলক বিশ্লেষণ।
  • স্বয়ংক্রিয় টাস্ক পুনরাবৃত্তি।
  • সমসাময়িক ডেটা স্কেলিং।
  • তথ্য গুদাম.

এই পরিষেবার কিছু অতিরিক্ত বৈশিষ্ট্য নীচের চিত্রে দেখা যাবে:

রেডশিফ্ট অফার করে এমন বেশিরভাগ বৈশিষ্ট্য ছিল এবং এখন আমরা এই পরিষেবা দ্বারা সমর্থিত ডেটা প্রকারগুলিতে চলে যাব।

তথ্যের ধরণ

অ্যামাজন রেডশিফ্ট হল একটি ডাটা গুদামজাতকরণ সমাধান যেখানে প্রচুর বৈশিষ্ট্য রয়েছে। এটি স্ট্রাকচার্ড এবং আনস্ট্রাকচার্ড উভয় ধরনের ডেটা টাইপ সমর্থন করে। যেহেতু এটি PostgreSQL এর উপর ভিত্তি করে, তাই সাধারণ SQL কোয়েরির মাধ্যমে ডেটা ম্যানিপুলেট করা যেতে পারে।

এখন, আরেকটি প্রশ্ন উঠছে, অর্থাৎ, এই ডেটা ফরম্যাটগুলি একে অপরের থেকে কীভাবে আলাদা? এই দুটি তথ্য বিন্যাস নিয়ে আলোচনা করা যাক।

স্ট্রাকচার্ড ডেটা

একটি উচ্চ ফর্ম্যাট করা ডেটা টাইপ যা মেশিন লার্নিং অ্যালগরিদম দ্বারা সহজেই অনুবাদ করা হয় তাকে স্ট্রাকচার্ড ডেটা বলা হয়। একটি SQL ডাটাবেস কাঠামোগত ডেটার সাথে কাজ করে। স্ট্রাকচার্ড ডেটা ট্যাবুলার আকারে থাকে যেমন রিলেশনাল ডেটাবেস দ্বারা ব্যবহৃত ডেটা

বহুল ব্যবহৃত SQL ডাটাবেস ম্যানেজমেন্ট সিস্টেমগুলির মধ্যে একটি হল MYSQL। প্রদত্ত চিত্রে এর স্থাপত্য নীচে দেখা যেতে পারে:

অসংগঠিত ডেটা

আনস্ট্রাকচার্ড ডেটা প্যাটার্ন কম এবং ফর্ম্যাট কম ডেটা যেমন অ-রিলেশনাল ডেটাবেসে ব্যবহৃত ডেটা। MongoDB একটি বিখ্যাত নন-রিলেশনাল ডাটাবেস। এসকিউএল কোয়েরিগুলি অ-রিলেশনাল ডেটাবেসে কাজ করে না, তাই এই ডেটাবেসগুলিকে NoSQL ডেটাবেসও বলা হয়।

ইতিমধ্যে উল্লিখিত হিসাবে, MongoDB হল একটি অ-কাঠামোহীন ডাটাবেস ম্যানেজমেন্ট সিস্টেম এবং এর আর্কিটেকচার নিচে দেওয়া চিত্রে দেখা যাবে:

আমরা ডাটাবেসে ব্যবহৃত দুটি মৌলিক ডেটা টাইপের মধ্য দিয়ে চলেছি এবং আমরা এখন আসল ডেটা টাইপের দিকে যাব যা Amazon Redshift দ্বারা সমর্থিত। এই ডেটা প্রকারগুলি হল:

  • সংখ্যাসূচক ডেটা
  • ক্যারেক্টার ডেটা
  • ডেটটাইম ডেটা
  • বুলিয়ান ডেটা
  • HLLSKETCH ডেটা
  • সুপার ডেটা
  • প্রতিস্থাপন ডেটা

আসুন এই ডেটা প্রকারগুলি নিয়ে আলোচনা করা যাক:

সংখ্যাসূচক ডেটা

এই ডেটা টাইপ স্ব-ব্যাখ্যামূলক। এটি পূর্ণসংখ্যা, দশমিক, ফ্লোটিং পয়েন্ট এবং অন্যান্য সাংখ্যিক ডেটা প্রকারের আকারে থাকা ডেটা সমর্থন করে।

পূর্ণসংখ্যা ডেটা টাইপের বৈশিষ্ট্যগুলি নীচের চিত্রে দেখা যেতে পারে:

দশমিক ডেটা টাইপ ব্যবহারকারীর কাছ থেকে নির্ভুলতার উপর ভিত্তি করে ডেটা সংরক্ষণ করে। এর বৈশিষ্ট্যগুলি নিম্নরূপ:

ক্যারেক্টার ডেটা

CHAR এবং VARCHAR ডেটা প্রকারগুলি অক্ষর-ভিত্তিক ডেটা প্রকারের বিভাগের অধীনে পড়ে। NCHAR এবং NVARCHAR এছাড়াও ক্যারেক্টার টাইপ ডেটা টাইপ। CHAR এবং VARCHAR এর বিপরীতে, এই দুটি ডেটা প্রকার নির্দিষ্ট দৈর্ঘ্য, ইউনিকোড অক্ষর সংরক্ষণ করে। আসুন এই ডেটা প্রকারের বৈশিষ্ট্যগুলি দেখি, যেমন:

  • CHAR, CHARACTER, NCHAR-এর রেঞ্জ 4KB।
  • VARCHAR, NVARCHAR এর রেঞ্জ 64KB।
  • BPCHAR এর 256 বাইট পরিসীমা রয়েছে।
  • TEXT-এর পরিসীমা 260 বাইট।

ডেটটাইম ডেটা

তারিখের ডেটা প্রকারগুলি হল DATE, TIME, TIMETZ, TIMESTAMP, TIMESTAMPTZ৷ এই ধরনের ডেটার কার্যকরী ক্ষমতা নিম্নরূপ:

  • DATE কেবল ক্যালেন্ডারের তারিখগুলি সঞ্চয় করে৷
  • TIME কোনো সময় অঞ্চলের উল্লেখ ছাড়াই সময় সঞ্চয় করে। এটি ডিফল্টরূপে ইউটিসি।
  • TIMETZ সময় অঞ্চলের রেফারেন্সে সময় সঞ্চয় করে। এটি ডিফল্টরূপে ব্যবহারকারীর টেবিল এবং সিস্টেম টেবিল উভয় ক্ষেত্রেই UTC।
  • টাইমস্ট্যাম্প শুধুমাত্র সময়ই অন্তর্ভুক্ত করে না, তারিখগুলিও অন্তর্ভুক্ত করে। এটি ডিফল্টরূপে ব্যবহারকারীর টেবিল এবং সিস্টেম টেবিল উভয় ক্ষেত্রেই UTC।
  • TIMESTAMPTZ শুধুমাত্র সময়ই নয় তারিখগুলিও অন্তর্ভুক্ত করে৷ এটি ডিফল্টরূপে শুধুমাত্র ব্যবহারকারী টেবিলে UTC।

বুলিয়ান ডেটা

বুলিয়ান ডেটা টাইপ হল একটি বাইনারি ডেটা টাইপ, যার মানে মাত্র দুটি মান আছে। বুলিয়ান ডেটা টাইপের বৈশিষ্ট্য টেবিলটি চিত্রে নীচে দেওয়া হয়েছে:

HLLSKETCH ডেটা

এই ডেটা টাইপ স্কেচ সংরক্ষণ করতে ব্যবহৃত হয়। রেডশিফ্ট স্কেচগুলিকে বিক্ষিপ্ত বা ঘন আকারে উপস্থাপন করতে পারে। স্কেচগুলি স্পার্স হিসাবে শুরু হয় এবং ধীরে ধীরে ঘন হয়ে যায় যখন একটি ঘন বিন্যাস লিঙ্কটি অনুসরণ করে আরও দক্ষতা প্রদান করে।

সুপার ডেটা

এই ডেটা টাইপ অসংগঠিত ডেটা নিয়ে কাজ করে যা অ্যারে, নেস্টেড স্ট্রাকচার বা JSON আকারে হতে পারে। ডেটার কোন মডেল বা বিন্যাস নেই। ব্যবহারকারীরা লিঙ্কটি নেভিগেট করে আরও তথ্য অন্বেষণ করতে পারেন।

প্রতিস্থাপন ডেটা

এই ডেটা টাইপ অক্ষর সংরক্ষণ করে। তবে দৈর্ঘ্য সীমিত। Amazon Redshift VARBYTE ডেটা যেকোন পূর্ণসংখ্যা টাইপ বা অক্ষর টাইপ ডেটাতে কাস্ট করার অনুমতি দেয়৷ এই ডেটাটাইপ সম্পর্কে আরও তথ্য পেতে, নীচের লিঙ্কটি অনুসরণ করুন।

অ্যামাজন রেডশিফ্ট এবং এটি যে ডেটা টাইপগুলি সমর্থন করে তার জন্য এটিই রয়েছে।

উপসংহার

Amazon Redshift হল একটি AWS পরিষেবা যা এর মৌলিক আকারে ডেটা গুদামের উদ্দেশ্য পূরণ করে কিন্তু বিশ্লেষণ এবং ভবিষ্যদ্বাণীর জন্য এটি একটি অত্যন্ত শক্তিশালী এবং বৈশিষ্ট্যপূর্ণ সমাধান। এই নিবন্ধটি Redshift এবং এটি সমর্থন করে এমন ডেটা প্রকারগুলি নিয়ে আলোচনা করেছে৷ এই ডেটা প্রকারগুলি তাদের বৈশিষ্ট্য সহ সংক্ষিপ্তভাবে ব্যাখ্যা করা হয়েছিল।