পান্ডাস ডেটাফ্রেম অনন্য

Pandasa Detaphrema Anan Ya



সবচেয়ে জনপ্রিয় পাইথন লাইব্রেরি যা ডেটা সায়েন্সে ব্যবহৃত হয় তাকে পান্ডাস বলা হয়। এটি পাইথন প্রোগ্রামারদের উচ্চ-পারফরম্যান্স, ব্যবহারকারী-বান্ধব, এবং ডেটা বিশ্লেষণ সরঞ্জাম সরবরাহ করে। একবার আপনি মৌলিক ফাংশন এবং কীভাবে সেগুলি ব্যবহার করবেন তা বুঝতে পারলে, পান্ডাস ডেটা পরিবর্তন করার জন্য একটি শক্তিশালী হাতিয়ার। 'পান্ডাস'-এ টেবুলার আকারে ডেটা সংরক্ষণের জন্য স্ট্যান্ডার্ড পদ্ধতি হল ডেটাফ্রেম। আমরা 'পান্ডা' ডেটাফ্রেমের কলামে অনন্য মান পাওয়ার জন্য কিছু 'পান্ডা' পদ্ধতি ব্যবহার করতে পারি। যখন আমাদের ডেটাফ্রেমের কলামগুলিতে অনন্য মান পেতে হবে এবং 'পান্ডা' ডেটাফ্রেমের কলামে মানগুলির অনুলিপি চাই না, তখন আমরা 'পান্ডা' এটি করার জন্য যে পদ্ধতিগুলি প্রদান করে তা ব্যবহার করতে পারি। কিছু উদাহরণ এবং আউটপুট সহ ডাটাফ্রেমের 'পান্ডাস' কলামে অনন্য মান পেতে এই গাইডে এই জাতীয় পদ্ধতিগুলি দেখুন।

'পান্ডা' ডেটাফ্রেমের কলামে অনন্য মান পাওয়ার পদ্ধতি

'পান্ডা' ডেটাফ্রেমের কলামে অনন্য মান পাওয়ার জন্য আমরা দুটি পদ্ধতি ব্যবহার করতে পারি। আমরা ডুপ্লিকেট মানগুলি বাদ দেই এবং শুধুমাত্র ডেটাফ্রেমের কলামগুলিতে অনন্য মানগুলি পাই৷ এই কাজটি করার জন্য 'পান্ডা' যে পদ্ধতিগুলি প্রদান করে তা হল:







  • অনন্য() পদ্ধতি ব্যবহার করে।
  • drop_dupliactes() পদ্ধতি ব্যবহার করে।

এখন, আমরা 'পান্ডা' ডেটাফ্রেমের কলামে অনন্য মান পাওয়ার জন্য 'পান্ডা' কোডের উভয় পদ্ধতিই ব্যবহার করব।



উদাহরণ # 01

'স্পাইডার' অ্যাপটি এখানে এই 'পান্ডা' কোডগুলি তৈরি করার জন্য ব্যবহার করা হয়েছে সেই পদ্ধতিগুলি ব্যবহার করার জন্য যা আমাদের 'পান্ডা' ডেটাফ্রেমের কলামগুলিতে অনন্য মান পেতে সাহায্য করে। ডেটাফ্রেম তৈরি করার আগে আমাদের অবশ্যই 'পান্ডা' মডিউলগুলি আমদানি করতে হবে, যা 'পান্ডা' কোডের জন্য প্রয়োজনীয়। 'আমদানি' শব্দটি ব্যবহার করে এবং 'pd হিসাবে পান্ডা' স্থাপন করে, আমরা এই মডিউলগুলি আমদানি করি।



এখন, 'pd' এর সাহায্যে, আমরা দ্রুত 'পান্ডা' ফাংশন বা পদ্ধতিগুলি পেতে পারি। তারপরে আমরা 'বিষয়_ডেটা' রাখি যেখানে আমরা 'নাম' যোগ করি এবং 'নাম'-এ আমরা নামের ডেটা যোগ করছি যা হল 'রোমান, উইলিয়াম, পিটার, স্মিথ, জন, মিলি, থমাস এবং জেমস'। তারপর, আমরা 'সাবজে' বিষয়ের ডেটা যোগ করি যা হল 'গণিত, অর্থনীতি, বিজ্ঞান, গণিত, পরিসংখ্যান, পরিসংখ্যান, পরিসংখ্যান, এবং কম্পিউটার'। তারপর, আমরা “pd.DataFrame()” পদ্ধতি ব্যবহার করে এই “Subject_data” কে “Subject_df” ডেটাফ্রেমে রূপান্তর করি। আমরা 'প্রিন্ট()' পদ্ধতিতে 'সাবজেক্ট_ডিএফ' রাখি যাতে এটি টার্মিনালে দেখায়।





এখন, আমরা 'পান্ডা' ডেটাফ্রেমের কলাম 'সাবজে'-এ অনন্য মান পেতে চাই। এই উদ্দেশ্যে, আমরা এখানে 'অনন্য()' পদ্ধতি ব্যবহার করছি এবং আমরা কলামের নাম এবং নীচে দেখানো ডেটাফ্রেমের নামও যোগ করছি। আমরা এই পদ্ধতিটি 'প্রিন্ট()' এ যোগ করি তাই ফলাফল টার্মিনালেও দেখাবে।



এখন, আমরা এই কোডের ফলাফল পাওয়ার জন্য 'Shift+Enter' টিপছি এবং এটি টার্মিনালে রেন্ডার হয় এবং এখানেও দেখানো হয়েছে, যেটিতে সমস্ত মান সহ ডেটাফ্রেম রয়েছে। এটি আসল ডেটাফ্রেম যা আমরা কোডে যোগ করেছি এবং এটির নীচে 'Subj' কলামের অনন্য মানগুলি প্রদর্শন করে। এটি ডুপ্লিকেট মানগুলি ফেলে দেয় এবং ডেটাফ্রেমের 'সাবজে' কলামের অনন্য মানগুলি প্রদর্শন করে।

উদাহরণ # 02

আমরা কিছু তথ্য ধারণ করে 'Sample_list' তৈরি করি। আমরা 'লায়লা, 21, 28, 31, 14, এবং 39' সন্নিবেশ করান যা প্রথম কলাম হিসাবে প্রদর্শিত হবে যখন আমরা এই তালিকাটিকে ডেটাফ্রেমে রূপান্তর করব। তারপর, আমরা ডেটাফ্রেমের দ্বিতীয় সারি হিসাবে 'লুসি, 31, 25, 34, 26 এবং 21' যোগ করি। এর পরে, আমাদের কাছে 'পিটার, 38, 20, 20, 35, এবং 24' এবং 'লায়লা 38, 23, 39 24, 23' রয়েছে যা ডেটাফ্রেমের তৃতীয় এবং চতুর্থ সারি হবে। আমরা আরও তিনটি ডেটা সন্নিবেশ করি যা হল 'স্টেলা, 21, 24, 24, 28, 31', 'লায়লা, 33, 32, 26, 30, 25' এবং এছাড়াও 'পিটার, 21, 21, 31, 21, 29' .

এখন, আমরা 'Pd.DataFrame()' ফাংশন বসিয়ে 'Sample_list' কে 'DF_Sample' এ রূপান্তর করছি যা ডেটাফ্রেমের নাম। এছাড়াও, আমরা এই ডেটাফ্রেমের কলামগুলির নাম সেট করি এবং এই নামগুলি হল 'Name, Ass_1, Ass_2, Ass_3, Ass_4 এবং Ass_5'। তারপর, আমরা 'প্রিন্ট()' ব্যবহার করি যা ডেটাফ্রেম 'DF_Sample' প্রদর্শন করতে সাহায্য করে। এখন, আমরা ডেটাফ্রেমের কলামে অনন্য মানগুলি পাওয়ার জন্য এই উদাহরণে আরেকটি পদ্ধতি ব্যবহার করছি। এই পদ্ধতিটি হল 'পান্ডা' এর 'ড্রপ_ডুপ্লিকেট()' পদ্ধতি।

'drop_duplicates()' পদ্ধতিতে, আমরা যে কলামের নাম সেট করি যেখানে আমরা DataFrame-এর কলামে অনন্য মান পেতে চাই। আমরা 'ড্রপ_ডুপ্লিকেট()' পদ্ধতির সাহায্যে এই কলামে ডুপ্লিকেট মানগুলি বাদ দিয়ে 'নাম' কলামের অনন্য মানগুলি পাচ্ছি এবং এখানে 'প্রিন্ট()' ফাংশন ব্যবহার করে এই অনন্য মানগুলি রেন্ডার করছি।

ডুপ্লিকেট করা নামগুলি বাদ দেওয়া হয় এবং 'ড্রপ_ডুপ্লিকেট()' পদ্ধতি প্রয়োগ করার পরে অনন্য মানগুলি রেন্ডার করা হয়। আপনি লক্ষ্য করতে পারেন যে 'লায়লা' নামটি 'নাম' কলামের তিনটি কক্ষে উপস্থিত হয়। কিন্তু যখন এই কলামে “drop_duplicates()” পদ্ধতি প্রয়োগ করা হয়, তখন সমস্ত সদৃশ মান বাদ দেওয়া হয় এবং একটি “লায়লা” নাম স্ক্রিনে উপস্থিত হয়। ডুপ্লিকেট মানগুলি বাদ দেওয়ার পরে, নতুন ডেটাফ্রেম উপস্থিত হয়েছে যা এই 'নাম' কলামে অনন্য মান ধারণ করে। এইভাবে, আমরা ডুপ্লিকেট মানগুলি বাদ দিতে পারি এবং 'ড্রপ_ডুপ্লিকেট()' পদ্ধতির সাহায্যে ডেটাফ্রেমের কলামে অনন্য মান পেতে পারি।

উদাহরণ # 03

একই DataFrame আবার ব্যবহার করা হয়েছে এবং এখন আমরা এখানে “unique()” পদ্ধতি প্রয়োগ করছি। 'অনন্য()' পদ্ধতির সাহায্যে আমরা কলামের নাম এবং সেইসাথে ডেটাফ্রেমের নাম রাখি যার উপর আমরা অনন্য মানগুলি পাওয়ার জন্য এই 'অনন্য()' পদ্ধতিটি প্রয়োগ করতে চাই। এটি শুধুমাত্র সেই কলামের অনন্য মানগুলি রেন্ডার করবে এবং ডেটাফ্রেমের আকারে এই মানগুলি দেখাবে না।

এখানে, ডেটাফ্রেমে 'নাম' কলামে সাতটি মান রয়েছে কিন্তু যখন আমরা এই কলামে 'অনন্য()' পদ্ধতি প্রয়োগ করি, তখন মাত্র চারটি মান উপস্থিত হয় এবং এটি সেই কলামের অনন্য মান। এটি ডুপ্লিকেট মান রেন্ডার করে না।

উদাহরণ # 04

এই উদাহরণে আমরা যে ডেটাফ্রেম তৈরি করি তা হল 'F_G_df'। আমরা এই ডেটাফ্রেমে 'My_fruits' এবং 'my_Vegs' সন্নিবেশ করি। 'My_fruits' কলামে 'Apple, Orange, Apple, Pear, Lichee, Apple, Apple, Pear, and Apple' আছে। এর পরে, আমাদের কাছে 'My_Vegs' রয়েছে যাতে সবজির নাম রয়েছে যা হল 'মরিচ, ব্রিংল, গাজর, আলু, আলু, গাজর, পেঁয়াজ, রসুন এবং আদা'। এই ডেটাফ্রেমে শুধুমাত্র দুটি কলাম রয়েছে।

এখন, আমরা “ইউনিক()” পদ্ধতির সাহায্যে উভয় কলামেই অনন্য মান পাচ্ছি। আমরা DataFrame এর নাম উল্লেখ করি। তারপর, কলামের প্রথম কলামের নাম রাখুন। এর পরে, আমরা append() পদ্ধতি ব্যবহার করি। এই পরিশিষ্টে, আমরা আবার ডেটাফ্রেমের নাম এবং দ্বিতীয় কলামের নাম রাখি এবং 'অনন্য()' পদ্ধতি রাখি। এটি উভয় কলামের অনন্য মান পাবে এবং তারপর উভয় কলামের অনন্য মান যুক্ত করবে এবং সেগুলি স্ক্রিনে প্রদর্শিত হবে।

ডেটাফ্রেমটি প্রথমে সমস্ত মান ধারণ করে রেন্ডার করা হয়। এর পরে, 'অনন্য()' পদ্ধতি প্রয়োগ করা হয় এবং উভয় কলামের অনন্য মান নীচে রেন্ডার করা হয়। এই কোডে, আমরা 'ইউনিক()' পদ্ধতি ব্যবহার করে ডেটাফ্রেমের একাধিক কলামে অনন্য মানগুলি পাই।

উপসংহার

ডেটাফ্রেমের কলামে অনন্য মান পাওয়ার সম্পূর্ণ ব্যাখ্যা এই নির্দেশিকায় পাওয়া যায়। আমরা 'অনন্য()' এবং 'drop_duplicates()' পদ্ধতি নিয়ে আলোচনা করেছি যা ডেটাফ্রেমের কলামের অনন্য মান পেতে আমাদের সাহায্য করে। আমরা এখানে আমাদের কোডগুলিতে এই পদ্ধতিগুলি ব্যবহার করে 'পান্ডাস' কোডে এই পদ্ধতিগুলি কীভাবে ব্যবহার করতে হয় তা অনুসন্ধান করেছি। আমরা এই নির্দেশিকায় বিভিন্ন উদাহরণ তুলে ধরেছি এবং আপনাকে দেখিয়েছি কিভাবে “অনন্য()” পদ্ধতির পাশাপাশি “drop_duplicates()” পদ্ধতি ব্যবহার করে একটি কলামের অনন্য মান পেতে হয়। এই নির্দেশিকায় “অনন্য()” পদ্ধতি ব্যবহার করে একাধিক কলামে কীভাবে অনন্য মান পেতে হয় তাও আমরা অনুসন্ধান করেছি।