পান্ডাস রিইন্ডেক্স

Pandasa Ri Indeksa



'পান্ডাসে' আমরা অনেক তথ্য টেবুলার আকারে সঞ্চয় করতে পারি, যা ডেটাফ্রেম নামেও পরিচিত। ডাটাফ্রেম তৈরির জন্য 'পান্ডাস' আমাদেরকে 'ডেটাফ্রেম()' পদ্ধতির সাহায্য করে। ডেটাফ্রেমে সূচী রয়েছে এবং আমরা 'পান্ডা' ফাংশনগুলি ব্যবহার করে ডেটাফ্রেমের সূচীগুলিও পরিবর্তন করতে পারি। ডাটাফ্রেম রিইন্ডেক্স করার জন্য আমরা যে পদ্ধতিটি ব্যবহার করি সেটি হল 'রিইন্ডেক্স()' পদ্ধতি। এই পদ্ধতিটি সারির সূচকের মান পরিবর্তন করতে সাহায্য করে সেইসাথে কলামের সূচকের মান পরিবর্তন করতে। এই পদ্ধতিটি ব্যবহার করে, আমরা ডেটাফ্রেমের ডিফল্ট সূচী পরিবর্তন করতে পারি, এবং এছাড়াও, আমরা ডেটাফ্রেম তৈরি করার সময় যে সূচী সেট করেছিলাম তা পরিবর্তন করতে পারি। আমরা এই টিউটোরিয়ালে আমাদের 'পান্ডা' উদাহরণগুলিতে 'রিইন্ডেক্স()' পদ্ধতি ব্যবহার করব এবং এখানে এই ধারণাটি গভীরভাবে ব্যাখ্যা করব।'

উদাহরণ # 01

'স্পাইডার' টুলটি আমাদের এই টিউটোরিয়ালে এখানে 'পান্ডাস' কোড তৈরি করতে সাহায্য করে এবং আমরা আমাদের কোড 'ইমপোর্ট' কীওয়ার্ড দিয়ে শুরু করি যা 'পান্ডাস' ফাংশন ইম্পোর্ট করতে সাহায্য করবে। আমরা 'ইমপোর্ট' টাইপ করার পরে 'পান্ডাকে পিডি হিসাবে' রাখি। এর পরে, আমরা “pd.DataFrame()” লিখে ডেটাফ্রেম তৈরি করি। আমরা এখানে এই 'pd' লিখি কারণ 'DataFrame()' হল 'pandas' এর পদ্ধতি। 'value_df' হল ভেরিয়েবলের নাম যেখানে ডেটাফ্রেম সংরক্ষণ করা হয়। আমরা 'RandomName' যোগ করি যা কলামের নাম, এবং 'RandomName'-এ 'Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander, and Samuel' আছে।







তারপর, আমাদের কাছে 'মান_1' আছে, যেখানে আমরা '16, 29, 24, 35, 44, 50, 69, 74 এবং 88' সন্নিবেশিত করেছি। তারপর আসে 'মান_2' এবং আমরা যোগ করেছি '25, 38, 42, 56, 54, 65, 78, 89, এবং 99'। এখন, 'মান_3' এর পরে আসে, এবং আমরা এতে '36, 48, 52, 69, 74, 75, 87, 91, এবং 69' রাখি। এর পরে 'মান_4' কলামটি উপস্থিত রয়েছে, যেখানে আমরা '52, 64, 72, 88, 82, 95, 97, 21 এবং 39' সন্নিবেশিত করেছি। শেষ কলামটি এখানে 'মান_5' কলাম, এবং এই কলামে, আমরা যে মানগুলি যোগ করেছি তা হল '66, 78, 82, 99, 34, 45, 57, 61, এবং 89'। এর পরে, আমরা 'print()' ফাংশন ব্যবহার করি যেখানে 'Values_df' যোগ করা হয়। এটি টার্মিনালে প্রিন্ট করবে।




“Shift+Enter” চাপার পর, আমরা সহজেই “Spyder” অ্যাপে আমাদের কোডের ফলাফল পেতে পারি। এখানে, এই কোডটি ডিফল্ট সূচী সহ ডেটাফ্রেম প্রদান করে। এখন, আমরা এই ডেটাফ্রেমটিকে 'পান্ডাস'-এ পুনঃসূচীকরণের জন্য 'রিইন্ডেক্স()' পদ্ধতি প্রয়োগ করব।




'রিইন্ডেক্স()' ফাংশনটি এখানে সারির ইনডেক্স ভ্যালু রিইন্ডেক্স করার জন্য ব্যবহার করা হয়েছে। উপরের ডেটাফ্রেমে, আপনি দেখতে পাচ্ছেন যে সারির ডিফল্ট সূচক মানগুলি প্রদর্শিত হয়েছে, এবং এখন, আমরা সেই সারি সূচীগুলিকে পুনঃসূচীকরণের জন্য 'রিইন্ডেক্স()' পদ্ধতি প্রয়োগ করছি। আমরা ডেটাফ্রেমের নাম এবং তারপরে 'রিইন্ডেক্স()' পদ্ধতিটি রাখি যেখানে আমরা সেই সূচক মানগুলি রাখি যা আমরা উপরের ডেটাফ্রেমে যুক্ত করতে চাই। আমরা “reindex()” ফাংশনে “ind_A, ind_B, ind_C, ind_D, ind_E, ind_F, ind_G, ind_H, এবং ind_I” রাখি। সুতরাং, যখন আমরা এই কোডটি কার্যকর করব তখন এই সারিগুলির সূচীগুলি ডেটাফ্রেমে আপডেট করা হবে।






সারির সূচকের মানগুলি এই ফলাফলে প্রদর্শিত হয়, এবং আপনি লক্ষ্য করতে পারেন যে ডেটাফ্রেমের মানগুলি এখানে প্রদর্শিত হয় না এবং 'NaN' মানগুলি উপস্থিত হয়েছে৷ এর কারণ হল নতুন সূচক মানগুলি ডেটাফ্রেমের পূর্ববর্তী সূচক মানগুলির সাথে মেলে না। যখন নতুন সূচক এবং পুরানো সূচক মেলে না, তখন এটি সেখানে 'Nan' প্রদর্শন করে। এই 'NaN' মানগুলি ডিফল্টরূপে উপস্থিত হয় যখন আমরা সূচী পরিবর্তন করি এবং এটি পূর্ববর্তী সূচকের সাথে মেলে না।



উদাহরণ # 02

আমরা এখন “Value_df” এর কলামের সূচী মান পরিবর্তন করছি, যা আমরা পূর্বে উদাহরণ 1-এ তৈরি করেছি। “Value_df” প্রিন্ট করার পর, আমরা “কলাম” ভেরিয়েবল রাখি এবং এতে কিছু মান যোগ করি। আমরা 'a_1, b_1, c_1, d_1, এবং e_1' যোগ করি। এখন, আমরা কলামের সূচী হিসাবে এই মানগুলিকে সামঞ্জস্য করতে চাই, তাই, এর জন্য, আমরা 'রিইন্ডেক্স()' পদ্ধতি ব্যবহার করছি এবং পরিবর্তনশীল 'কলাম' এর নাম রাখছি যেখানে নতুন কলামের সূচকের মানগুলি সংরক্ষণ করা হয়েছে এবং এছাড়াও 'অক্ষ' কে 'কলাম' তে সেট করুন তাই, এটি কলাম অক্ষ সূচক আপডেট করবে। আমরা 'প্রিন্ট()' এ 'রিইন্ডেক্স()' পদ্ধতিটি রাখি, তাই এটি টার্মিনালেও রেন্ডার হবে।


যেহেতু আমরা 'রিইন্ডেক্স()' পদ্ধতি ব্যবহার করেছি, প্রথম ডেটাফ্রেমে উপস্থিত কলামের সূচকের মানগুলি আপডেট করা হয়েছে এবং আপডেট করা ডেটাফ্রেমে নতুন মান যুক্ত করা হয়েছে। আপনি আরও লক্ষ্য করতে পারেন যে ডেটাফ্রেমের সমস্ত মান 'NaN' এ রূপান্তরিত হয়েছে কারণ উভয় কলামের সূচকের মান আলাদা।

উদাহরণ # 03

এই কোডের 'প্রোগ্রামিং_ডেটা'-এ 'P_Languages' রয়েছে যেখানে আমরা 'JavaScript, CSS, Web Engineering, OOP, C#, AI, Java, এবং JavaScript' যোগ করেছি। তারপর, আমাদের 'ঘন্টা' আছে যেখানে আমরা '4_hrs, 2_hrs, 3_hrs, 7_hrs, 6_hrs, 5_hrs, 8_hrs, এবং 6_hrs' রাখি। এর পরে, 'P_Code' প্রবেশ করানো হয় এবং আমরা '11523, 12423, 12321, 11456, 11454, 12267, 13106 এবং 14123' সন্নিবেশ করি। আমরা 'p_index' ভেরিয়েবল যোগ করি এবং 'Pro_A, Pro_B, Pro_C, Pro_D, Pro_E, Pro_F, Pro_G, এবং Pro_H' রাখি।

এই মানগুলি সারিগুলির সূচক মান হিসাবে ব্যবহার করা হবে। আমরা 'প্রোগ্রামিং_ডিএফ' ডেটাফ্রেমে 'প্রোগ্রামিং_ডেটা' পরিবর্তন করি। এছাড়াও আমরা 'index' পদ্ধতি ব্যবহার করে এই ডেটাফ্রেমে 'p_index' যোগ করি। আমরা 'Programming_df' এবং তারপর 'index' মেথড রাখি এবং এর জন্য 'p_index' বরাদ্দ করি। এখন, উপরের সূচকের মানগুলি ডেটাফ্রেমে সারি সূচক মান হিসাবে যোগ করা হয়েছে। আমরা 'প্রোগ্রামিং_ডিএফ'ও প্রিন্ট করি।

এর পরে, আমরা 'new_index' ভেরিয়েবলে কিছু নতুন ইনডেক্স মান যোগ করি এবং সেগুলি হল 'P_1, P_2, P_3, P_4, P_5, P_6, P_7, এবং P_8'। যেহেতু আমরা সারিগুলির সূচকের মানগুলি আপডেট করতে চাই, আমরা 'reindex()' পদ্ধতি ব্যবহার করি এবং এই ফাংশনের প্যারামিটার হিসাবে 'new_index' রাখি এবং আপডেট করা ডেটাফ্রেমটিকে 'newProgramming_df'-এ সংরক্ষণ করি এবং 'newProgramming_df'-এ রাখি। প্রিন্ট()” প্রদর্শনের জন্য।


সূচকের মানগুলি আপডেট করা হয়েছে, এবং আমরা এটাও বলতে পারি যে আমরা যে ডেটাফ্রেম তৈরি করেছি তা পুনঃসূচীকরণ করেছি। ডেটাফ্রেমের সমস্ত মানও 'NaN' তে রূপান্তরিত হয় কারণ উভয় সূচকের মানই আলাদা।

উদাহরণ # 04

আমরা বর্তমানে কলামের 'Programming_df's' সূচক মান পরিবর্তন করছি, যা আমরা পূর্বে 3 উদাহরণে তৈরি করেছি। আমরা 'কলাম' ভেরিয়েবল রাখি এবং এতে নতুন মান সন্নিবেশ করি। 'P_Code, P_Languages, Hours এবং New' 'কলাম' ভেরিয়েবলে যোগ করা হয়েছে। তারপরে, আমরা আবার 'রিইন্ডেক্স()' পদ্ধতিটি ব্যবহার করি যেখানে আমরা 'কলাম' ভেরিয়েবল সেট করি, যা পূর্ববর্তী কলাম সূচক মানগুলি আপডেট করবে এবং ডেটাফ্রেমে এই নতুন কলাম সূচক মানগুলি যুক্ত করবে।

এখানে, আপনি লক্ষ্য করতে পারেন যে 'কলাম'-এ আমরা যে নতুন মানগুলি যোগ করেছি তা আমরা উপরের ডেটাফ্রেমে যোগ করেছি একই রকম, তবে ক্রমটি ভিন্ন, তাই এটি কলামগুলির ক্রম পরিবর্তন করবে এবং সমস্ত কলামকে সামঞ্জস্য করবে যেমন আমরা 'কলাম' ভেরিয়েবলে উল্লেখ করা হয়েছে। এছাড়াও, আমরা আরও একটি সূচক মান যোগ করি যা উপরের ডেটাফ্রেমে উপস্থিত নেই, যা এখানে 'নতুন', তাই এই কলামে 'NaN' মানগুলি উপস্থিত হবে।


কলামের ক্রম এখানে পরিবর্তিত হয়, এবং সমস্ত মানগুলি উপস্থিত হয় কারণ এটি মূল ডেটাফ্রেমের কলামগুলিতে উপস্থিত থাকে এবং আপডেট করা ডেটাফ্রেমের 'নতুন' কলামে সমস্ত 'NaN' মান রয়েছে কারণ এই কলামটি মূল ডেটাফ্রেমে উপস্থিত নয়।

উপসংহার

আমরা এই টিউটোরিয়ালটি উপস্থাপন করেছি যা আমাদের 'পান্ডাস রিইন্ডেক্স' ধারণাটি বিস্তারিতভাবে বুঝতে সাহায্য করে। আমরা আলোচনা করেছি কিভাবে আমরা ডেটাফ্রেমের কলামের পাশাপাশি সারির সূচকের মানগুলিকে পুনঃসূচীকরণ করতে পারি। আমরা ব্যাখ্যা করেছি যে 'পান্ডা' এর 'রিইন্ডেক্স()' ফাংশনটি এটি করার জন্য ব্যবহার করা হয়। আমরা বিভিন্ন উদাহরণ করেছি যেখানে আমরা ডেটাফ্রেমের সারির সূচী মান পরিবর্তন করেছি এবং ডাটাফ্রেমের কলাম সূচীর সূচকের মানও পরিবর্তন করেছি। আমরা এখানে এই টিউটোরিয়ালে করা সমস্ত কোডের ফলাফল রেন্ডার করেছি এবং সেগুলিকে গভীরভাবে ব্যাখ্যা করেছি।