পান্ডাস গ্রুপবাই গড়

Pandasa Grupaba I Gara



যখন আমরা দুই বা ততোধিক মান একসাথে যোগ করি এবং তাদের যোগফলকে একসাথে যুক্ত করা মোট মানের দ্বারা ভাগ করা হয়, ফলাফলটি গড় হয়। পান্ডাস গড় একটি প্রদত্ত অক্ষ বরাবর ডেটা বা মানের গড় প্রদান করে। একটি অক্ষ জুড়ে গড় সহ একটি সিরিজ পান্ডা দ্বারা ফেরত দেওয়া হবে যদি একটি ডেটাফ্রেমে গড়() পদ্ধতি প্রয়োগ করা হয়। পান্ডা একটি সংখ্যাসূচক মান (একক সংখ্যা) প্রদান করে যদি একটি সিরিজে 'মান ()' ব্যবহার করা হয়। বিভাগগুলির গ্রুপ তৈরি করার পরে ফাংশনগুলি বিভাগে প্রয়োগ করা যেতে পারে। এটি একটি সাধারণ ধারণা কিন্তু একটি অত্যন্ত কার্যকর কৌশল যা প্রায়শই ডেটা বিজ্ঞানে প্রয়োগ করা হয়। এটি আমাদের প্রতিটি গোষ্ঠীর জন্য ডেটার সারাংশ তৈরি করতে, গ্রুপ-নির্দিষ্ট পরিবর্তনগুলি প্রয়োগ করতে এবং ডেটা পরিস্রাবণ সম্পাদন করতে দেয়। groupby() ফাংশনের সাহায্যে অবজেক্টকে ভাগ করা যায়, একটি ফাংশন প্রয়োগ করা যায় এবং তারপর পণ্যগুলিকে একত্রিত করা যায়। এটির সাথে বড় ডেটাসেটগুলিকে গোষ্ঠীভুক্ত করা যেতে পারে এবং গোষ্ঠীগুলিতে অপারেশন করা যেতে পারে।

কিভাবে পান্ডাসে groupby.mean() পদ্ধতি ব্যবহার করবেন?

একটি ডেটাফ্রেমের গড় বা একটি ডেটাফ্রেমের নির্দিষ্ট কলামের গড় গণনা করতে, আমরা groupby.mean() ফাংশনটি ব্যবহার করতে পারি। আমরা নিম্নলিখিত উদাহরণগুলিতে এটি কীভাবে ব্যবহার করব তা প্রদর্শন করব।







উদাহরণ # 01: একটি একক কলামের ডেটা গোষ্ঠীবদ্ধ করে একটি একক পূর্ণসংখ্যা কলামের গড় নির্ধারণ করুন

pd.DataFrame() ফাংশন ব্যবহার করে, আমরা প্রথমে একটি ডেটাফ্রেম তৈরি করব যাতে আমরা ডেটাফ্রেমের কলাম বা কলামের ডেটাগুলিকে গ্রুপে ভাগ করতে পারি এবং তারপরে তাদের গড় মান খুঁজে বের করতে পারি। ডেটা ফ্রেম তৈরি করার আগে, আমাদের অবশ্যই নম্পি লাইব্রেরির সাথে পান্ডাস মডিউল আমদানি করতে হবে।





দেখা যায়, আমরা পান্ডা অভিধান ব্যবহার করে আমাদের ডেটাফ্রেম তৈরি করেছি। আমাদের ডিএফ ডেটাফ্রেমে 3টি কলাম রয়েছে, যেমন, 'আইটেম', 'উৎপাদক' এবং 'পরিমাণ'। 'আইটেম' কলামে, আমরা মান সংরক্ষণ করেছি ('শার্ট', 'টাই', 'প্যান্ট', 'শার্ট', 'টাই', 'প্যান্ট', 'শার্ট', 'প্যান্ট', 'প্যান্ট', ' টাই'), যখন  কলাম 'উৎপাদক' এবং  'পরিমাণ' যেখানে মান রয়েছে ('ইতালি', 'ফ্রান্স', 'চীন', 'ফ্রান্স',  'চীন', 'ইতালি', 'চীন', 'ইতালি', 'ফ্রান্স', 'চীন') এবং (13, 16, 21, 32, 26, 41, 24, 42, 12, 15) যথাক্রমে। আসুন প্রস্তুতকারকের কলামে মানগুলিকে গোষ্ঠীবদ্ধ করি এবং প্রতিটি স্বতন্ত্র প্রস্তুতকারকের জন্য গড় পরিমাণের মান নির্ধারণ করি।





প্রস্তুতকারকের মান 'চীন'-এর গড় পরিমাণের মান 21.5, 'ফ্রান্স'-এর গড় পরিমাণের মান হল 20.0, এবং 'ইতালি'-এর গড় পরিমাণের মান হল 32.0৷ আমরা groupby.mean() ফাংশনের সাথে reset_index ফাংশন ব্যবহার করে আউটপুটে একটি সূচক নির্দিষ্ট করতে পারি।



উদাহরণ # 02: একটি একক কলামের ডেটা গোষ্ঠীবদ্ধ করে একটি একক ফ্লোট কলামের গড় খুঁজুন

আমরা দেখেছি কিভাবে আমরা ডেটা গ্রুপ করার পরে পূর্ণসংখ্যা কলামের গড় খুঁজে পেতে পারি। এখন ফ্লোটের মতো আরেকটি ডেটাটাইপ কলাম চেষ্টা করা যাক। pd.DataFrame() ফাংশন ব্যবহার করে ফ্লোট মান সহ কমপক্ষে একটি কলাম সহ একটি ডেটাফ্রেম তৈরি করা হবে।

pd.DataFrame() এর ভিতরে একটি অভিধান রেখে আমরা তিনটি কলাম সহ একটি ডেটাফ্রেম তৈরি করেছি। 'নাম' কলামে কিছু এলোমেলো খেলোয়াড়ের নাম সংরক্ষণ করা হচ্ছে ('স্যাম', 'জে', 'লিও', 'মাইক', 'উইল', 'বিলি', 'জনি', 'লারা', 'হানা', 'টনি'), কলাম 'টিম' যে দলের প্রতিনিধিত্ব করে যে দলের প্রত্যেক খেলোয়াড় ('A', 'A', 'B',  'A', 'B', 'A', 'C', 'B' ', 'C', 'C'), এবং 'উচ্চতা' কলাম প্রতিটি প্লেয়ারের উচ্চতা একটি ফ্লোট মান হিসাবে সংরক্ষণ করছে (5.6, 5.4, 6.3, 5.2, 5.5, 6.4, 5.6, 5.8, 6.0, 5.2)। আসুন 'টিম' কলামে ডেটা গ্রুপ করি এবং প্রতিটি স্বতন্ত্র 'টিম' মানের জন্য গড় উচ্চতার মান নির্ধারণ করি।

আপনি দেখতে পারেন যে A দলের খেলোয়াড়দের গড় উচ্চতা 5.65, যেখানে B এবং C দলের খেলোয়াড়দের গড় উচ্চতা যথাক্রমে 5.866 এবং 5.6।

উদাহরণ # 03: groupby.mean() ফাংশন ব্যবহার করে একাধিক কলামের গড় নির্ধারণ করুন

পূর্ববর্তী উদাহরণে, আমরা একটি একক কলামের গড় নির্ধারণ করেছি। যাইহোক, প্রতিটি গ্রুপের জন্য অসংখ্য কলামের গড়ও নির্ধারণ করা যেতে পারে। পান্ডা এবং নম্পি মডিউলগুলি আমদানি করার পরে, একাধিক সংখ্যাসূচক কলাম সহ একটি ডেটাফ্রেম তৈরি করি।

নতুন তৈরি ডেটাফ্রেমে, 'নাম', 'স্কোর' এবং 'ম্যাচ' লেবেল সহ তিনটি কলাম রয়েছে। স্ট্রিং হিসাবে ডেটা মান সম্বলিত কলামের নাম  ('Ron', 'Jim', 'Dany', 'Jim', 'Jim', 'Dany', 'Ron', 'Ron', 'Dany', 'Jim' ), যেখানে 'স্কোর' এবং 'ম্যাচ' সংখ্যাসূচক ডেটা নিয়ে গঠিত যেমন (3, 4, 2, 4, 1, 5, 2, 3, 1, 2) এবং (2, 3, 1, 2, 1, 3) , 4, 1, 2, 1)। এখন কলাম 'নাম'-এর ডেটা গ্রুপ করার পরে কলাম 'স্কোর' এবং 'ম্যাচ'-এর গড় খুঁজে বের করা যাক। এর জন্য groupby.mean() ফাংশন ব্যবহার করা হবে।

এটি লক্ষ্য করা যায় যে গ্রুপ ‘ড্যানি’ এর 2.00 ম্যাচে গড় স্কোর 2.66। গ্রুপ জিমের গড় স্কোর 2.75 এবং খেলার গড় মান 1.75। যদিও গ্রুপ 'রন' এর গড় স্কোর মান 2.66 এবং খেলা ম্যাচগুলির গড় মান 2.33।

agg() পদ্ধতি ব্যবহার করে অবজেক্ট দ্বারা একটি গ্রুপের গড় গণনা করা যেতে পারে। আমরা agg() ফাংশনের আর্গুমেন্ট হিসাবে গড় সরবরাহ করব। প্রদত্ত অক্ষ জুড়ে একক বা একাধিক অপারেশন ব্যবহার করে একত্রিত করতে, আমরা agg() ফাংশন ব্যবহার করতে পারি।

আউটপুট আগের মতই আছে।

উদাহরণ # 04: একাধিক কলাম গ্রুপ করে নির্দিষ্ট কলামের গড় নির্ণয় করুন

উদাহরণ 1, 2, এবং 3, আমরা একটি একক কলামের মান বা ডেটা গ্রুপ করেছি। এখন আমরা groupby() ফাংশনের ভিতরে কলাম লেবেলের তালিকা ব্যবহার করে একাধিক কলাম গ্রুপ করব, এবং তারপর আমরা প্রতিটি গ্রুপের গড় মান খুঁজে পাব। ডেটাফ্রেম তৈরি করার জন্য একটি ইনপুট হিসাবে pd.Dataframe() ফাংশনের ভিতরে একটি অভিধান 'd' পাস করা হবে।

আমরা প্রয়োজনীয় ডেটাফ্রেম তৈরি করেছি। 'স্পোর্টস' কলামটি কিছু খেলার নাম সংরক্ষণ করছে ('ব্যাডমিন্টন', 'ফুটবল', 'টেনিস', 'বাস্কেটবল', 'ফুটবল', 'টেনিস', 'বাস্কেটবল', 'ফুটবল', 'ব্যাডমিন্টন', ' বাস্কেটবল', 'বাস্কেটবল', 'টেনিস'), দেশের নাম ('চীন', 'রাশিয়া', 'ইতালি', 'স্পেন', 'রাশিয়া', 'ইতালি', 'চীন', 'ইতালি', ' স্পেন', 'চীন', 'রাশিয়া', 'ইতালি') 'দেশ' কলামে সংরক্ষিত আছে। যেখানে 'জয়' কলামে আমরা প্রতিটি খেলায় প্রতিটি দেশের জয়ী ম্যাচের সংখ্যা সংরক্ষণ করেছি (13, 10, 6, 7, 10, 12, 7, 11, 8, 13, 11, 6)। আসুন groupby.mean() ফাংশনটি ব্যবহার করি কলাম 'sports' এবং 'country' কে গ্রুপ করে 'win' কলামের মান খুঁজে বের করতে।

এই ফাংশনটি সফলভাবে দেশের প্রতিটি খেলার জন্য 'জয়' কলামের মানের গড় নির্ধারণ করেছে। reset_index() ফাংশন ব্যবহার করে গোষ্ঠীবদ্ধ ডেটাফ্রেম পুনরায় সেট করা যেতে পারে, যা একটি উপযুক্ত ডেটাফ্রেম কাঠামো প্রদান করে একটি নতুন সূচক তৈরি করে।

প্রতিটি ডেটাফ্রেমের সারির জন্য একটি সূচক যুক্ত করা হয়। একটি আকর্ষণীয় টেবিলে ফলাফল সাজানোর জন্য, আমরা পিভট() ফাংশনটিও ব্যবহার করতে পারি।

উপসংহার

এই টিউটোরিয়ালে, আমরা আলোচনা করেছি সংখ্যার গড় বা গড় কী এবং কীভাবে একটি ডেটাফ্রেমের কলাম বা কলামগুলিকে গোষ্ঠীবদ্ধ করার পরে একটি নির্দিষ্ট কলামের গড় (এক বা একাধিক) খুঁজে বের করা যায়। কিভাবে একটি একক পূর্ণসংখ্যা বা ফ্লোট কলামের গড় নির্ণয় করা যায় তা শিখানোর জন্য আমরা এই নিবন্ধে কয়েকটি উদাহরণ প্রয়োগ করেছি; কিভাবে groupby.mean() ফাংশন ব্যবহার করে একাধিক কলামের গড় নির্ধারণ করতে হয়; এবং একাধিক কলামকে গোষ্ঠীবদ্ধ করে নির্দিষ্ট কলামের গড় নির্ণয় করতে হয়।