পান্ডাস ফিল ন্যান ০ দিয়ে

Pandasa Phila N Yana 0 Diye



ডেটা সায়েন্স সাধারণত অনুপস্থিত ডেটা জড়িত। হয় পুরো সারিটি বাতিল করা যেতে পারে বা সারি-কলাম সংমিশ্রণে একটি মান যোগ করা যেতে পারে। সারি/কলাম বাদ দেওয়া অযৌক্তিক হবে কারণ এটি প্রতিটি সারির জন্য একটি নির্দিষ্ট মেট্রিক বাদ দেয়। NaN, যার অর্থ হল 'Not a Number', ডেটার সেট থেকে অনুপস্থিত একটি মান দেখানোর একটি সাধারণ উপায়। উদ্দিষ্ট ফলাফল পেতে, NaN পরিচালনা করা বেশ গুরুত্বপূর্ণ। তাহলে, আসুন জেনে নেওয়া যাক কিভাবে একটি পান্ডাস ডেটাফ্রেমের সারি বা কলামে NaN মানগুলিকে 0 এ পরিবর্তন করা যায়।

পান্ডাস NaN মান পূরণ করুন

যদি আপনার ডেটা ফ্রেমের একটি কলামে NaN বা None এর মান থাকে, তাহলে আপনি 'fillna()' বা 'replace()' ফাংশনগুলিকে শূন্য (0) দিয়ে পূরণ করতে ব্যবহার করতে পারেন।

পূরণ()







NA/NaN মানগুলি 'fillna()' ফাংশন ব্যবহার করে প্রদত্ত পদ্ধতিতে পূর্ণ হয়। নিম্নলিখিত সিনট্যাক্স বিবেচনা করে এটি ব্যবহার করা যেতে পারে:



আপনি যদি একটি একক কলামের জন্য NaN মানগুলি পূরণ করতে চান তবে সিনট্যাক্সটি নিম্নরূপ:




যখন আপনাকে সম্পূর্ণ ডেটাফ্রেমের জন্য NaN মানগুলি পূরণ করতে হবে, তখন সিনট্যাক্স দেওয়া হয়:






প্রতিস্থাপন()

NaN মানের একটি একক কলাম প্রতিস্থাপন করতে, প্রদত্ত সিনট্যাক্স নিম্নরূপ:




যেহেতু, পুরো ডেটাফ্রেমের NaN মানগুলি প্রতিস্থাপন করতে, আমাদের নিম্নলিখিত উল্লিখিত সিনট্যাক্স ব্যবহার করতে হবে:


এই লেখার অংশে, আমরা এখন আমাদের পান্ডাস ডেটাফ্রেমে NaN মান পূরণ করার জন্য এই উভয় পদ্ধতির ব্যবহারিক বাস্তবায়ন অন্বেষণ করব এবং শিখব।

উদাহরণ 1: পান্ডা 'ফিলনা()' পদ্ধতি ব্যবহার করে NaN মান পূরণ করুন

এই চিত্রটি প্রদত্ত ডেটাফ্রেমে NaN মানগুলি 0 দিয়ে পূরণ করতে পান্ডাস “DataFrame.fillna()” ফাংশনের প্রয়োগ প্রদর্শন করে। আপনি হয় একটি একক কলামে অনুপস্থিত মানগুলি পূরণ করতে পারেন অথবা আপনি পুরো ডেটাফ্রেমের জন্য সেগুলি পূরণ করতে পারেন। এখানে, আমরা এই দুটি কৌশল দেখব।

এই কৌশলগুলিকে অনুশীলনে রাখার জন্য, আমাদের প্রোগ্রামটি কার্যকর করার জন্য একটি উপযুক্ত প্ল্যাটফর্ম পেতে হবে। সুতরাং, আমরা 'স্পাইডার' টুল ব্যবহার করার সিদ্ধান্ত নিয়েছি। আমরা আমাদের পাইথন কোডটি প্রোগ্রামে 'পান্ডাস' টুলকিট ইম্পোর্ট করে শুরু করেছি কারণ ডাটাফ্রেম তৈরি করতে এবং সেই ডেটাফ্রেমে অনুপস্থিত মানগুলি পূরণ করতে আমাদের পান্ডাস বৈশিষ্ট্যটি ব্যবহার করতে হবে। 'পিডি' পুরো প্রোগ্রাম জুড়ে 'পান্ডা' এর উপনাম হিসাবে ব্যবহৃত হয়।

এখন, আমাদের কাছে পান্ডাস বৈশিষ্ট্যের অ্যাক্সেস আছে। আমরা প্রথমে আমাদের ডেটাফ্রেম তৈরি করতে এর “pd.DataFrame()” ফাংশন ব্যবহার করি। আমরা এই পদ্ধতিটি চালু করেছি এবং এটি তিনটি কলাম দিয়ে শুরু করেছি। এই কলামগুলির শিরোনাম হল “M1”, “M2”, এবং “M3”। “M1” কলামের মানগুলি হল “1”, “কোনোটিই নয়”, “5”, “9” এবং “3”। 'M2' এ এন্ট্রিগুলি হল 'কোনটি নয়', '3', '8', '4', এবং '6'। যখন “M3” ডেটা সংরক্ষণ করে “1”, “2”, “3”, “5”, এবং “None”। আমাদের একটি ডেটাফ্রেম অবজেক্ট প্রয়োজন যেখানে আমরা এই ডেটাফ্রেমটি সংরক্ষণ করতে পারি যখন “pd.DataFrame()” পদ্ধতিটি বলা হয়। আমরা একটি 'অনুপস্থিত' DataFrame অবজেক্ট তৈরি করেছি এবং 'pd.DataFrame()' ফাংশন থেকে যে ফলাফল পেয়েছি তার দ্বারা এটিকে বরাদ্দ করেছি। তারপর, আমরা পাইথন কনসোলে ডেটাফ্রেম প্রদর্শনের জন্য পাইথনের 'প্রিন্ট()' পদ্ধতি ব্যবহার করেছি।


যখন আমরা কোডের এই অংশটি চালাই, তখন টার্মিনালে তিনটি কলাম সহ একটি ডেটাফ্রেম দেখা যায়। এখানে, আমরা লক্ষ্য করতে পারি যে তিনটি কলামের সবকটিতেই শূন্য মান রয়েছে।


আমরা 0 দিয়ে অনুপস্থিত মান পূরণ করার জন্য Pandas “fillna()” ফাংশন প্রয়োগ করার জন্য কিছু নাল মান সহ একটি ডেটাফ্রেম তৈরি করেছি। আসুন আমরা কীভাবে এটি করতে পারি তা শিখি।

DataFrame প্রদর্শন করার পর, আমরা পান্ডাস “fillna()” ফাংশন চালু করেছি। এখানে, আমরা একটি কলামে অনুপস্থিত মানগুলি পূরণ করতে শিখব। এর জন্য সিনট্যাক্স টিউটোরিয়ালের শুরুতেই উল্লেখ করা হয়েছে। আমরা ডেটাফ্রেমের নাম দিয়েছি এবং নির্দিষ্ট কলামের শিরোনামটি “.fillna()” ফাংশন দিয়ে উল্লেখ করেছি। এই পদ্ধতির বন্ধনীর মধ্যে, আমরা মান প্রদান করেছি যা শূন্য স্থানে রাখা হবে। DataFrame নামটি 'অনুপস্থিত' এবং আমরা এখানে যে কলামটি বেছে নিয়েছি তা হল 'M2'। 'fillna()' এর বন্ধনীর মধ্যে প্রদত্ত মান হল '0'। সর্বশেষে, আপডেট করা ডেটাফ্রেম দেখার জন্য আমরা 'প্রিন্ট()' ফাংশনকে কল করি।


এখানে, আপনি দেখতে পাচ্ছেন যে ডেটাফ্রেমের “M2” কলামে এখন কোনো অনুপস্থিত মান নেই কারণ NaN মান 0 দিয়ে পূর্ণ।


একই পদ্ধতিতে পুরো ডেটাফ্রেমের জন্য NaN মান পূরণ করতে, আমরা 'fillna()' বলে ডাকি। এই বেশ সহজ. আমরা 'fillna()' ফাংশনের সাথে DataFrame নাম প্রদান করেছি এবং বন্ধনীর মধ্যে '0' ফাংশন মান নির্ধারণ করেছি। অবশেষে, 'প্রিন্ট()' ফাংশন আমাদের ভরা ডাটাফ্রেম দেখিয়েছে।


এটি আমাদের একটি ডেটাফ্রেম পায় যার কোনো NaN মান নেই কারণ সমস্ত মান এখন 0 দিয়ে পূরণ করা হয়েছে।

উদাহরণ 2: পান্ডা 'প্রতিস্থাপন()' পদ্ধতি ব্যবহার করে NaN মান পূরণ করুন

নিবন্ধের এই অংশটি ডেটাফ্রেমে NaN মান পূরণ করার জন্য অন্য একটি পদ্ধতি প্রদর্শন করে। আমরা একটি একক কলামে এবং একটি সম্পূর্ণ ডেটাফ্রেমে মান পূরণ করতে পান্ডাসের 'প্রতিস্থাপন()' ফাংশন ব্যবহার করব।

আমরা 'স্পাইডার' টুলে কোড লেখা শুরু করি। প্রথমত, আমরা প্রয়োজনীয় লাইব্রেরি আমদানি করেছি। এখানে, আমরা পাইথন প্রোগ্রামটিকে পান্ডাস পদ্ধতি ব্যবহার করতে সক্ষম করতে পান্ডাস লাইব্রেরি লোড করেছি। আমরা যে দ্বিতীয় লাইব্রেরিটি লোড করেছি তা হল NumPy এবং এটিকে 'np' বলা হয়। NumPy 'প্রতিস্থাপন()' পদ্ধতিতে অনুপস্থিত ডেটা পরিচালনা করে।

তারপর, আমরা তিনটি কলাম সহ একটি ডেটাফ্রেম তৈরি করেছি – “স্ক্রু”, “নেল” এবং “ড্রিল”। প্রতিটি কলামের মান যথাক্রমে দেওয়া হয়। 'স্ক্রু' কলামে '112', '234', 'কোনটিই নয়' এবং '650' মান রয়েছে। 'নখ' কলামে '123', '145', 'কোনটিই নয়' এবং '711' রয়েছে। সবশেষে, “ড্রিল” কলামে “312”, “কোনোটিই নয়”, “500” এবং “কোনটিই নয়” মান রয়েছে। DataFrame 'tool' DataFrame অবজেক্টে সংরক্ষণ করা হয় এবং 'print()' পদ্ধতি ব্যবহার করে প্রদর্শিত হয়।


রেকর্ডে চারটি NaN মান সহ একটি ডেটাফ্রেম নিম্নলিখিত আউটপুট ছবিতে দেখা যেতে পারে:


এখন, আমরা ডাটাফ্রেমের একক কলামে নাল মান পূরণ করতে পান্ডাস 'প্রতিস্থাপন()' পদ্ধতি ব্যবহার করি। টাস্কের জন্য, আমরা 'replace()' ফাংশন চালু করেছি। আমরা '.replace()' পদ্ধতির সাথে DataFrame নাম 'টুল' এবং কলাম 'স্ক্রু' সরবরাহ করেছি। এর ধনুর্বন্ধনীর মধ্যে, আমরা ডেটাফ্রেমে 'np.nan' এন্ট্রিগুলির জন্য '0' মান সেট করি। আউটপুট প্রদর্শনের জন্য 'প্রিন্ট()' পদ্ধতি ব্যবহার করা হয়।


ফলস্বরূপ DataFrame আমাদের প্রথম কলাম দেখায় যেখানে NaN এন্ট্রি 'স্ক্রু' কলামে 0 দিয়ে প্রতিস্থাপিত হয়েছে।


এখন, আমরা পুরো ডেটাফ্রেমে মান পূরণ করতে শিখব। আমরা DataFrame-এর নামের সাথে “replace()” পদ্ধতিকে বলেছি এবং np.nan এন্ট্রির সাথে যে মানটি প্রতিস্থাপন করতে চাই তা প্রদান করেছি। অবশেষে, আমরা 'প্রিন্ট()' ফাংশন সহ আপডেট করা ডেটাফ্রেম প্রিন্ট করেছি।


এটি কোন অনুপস্থিত রেকর্ড ছাড়াই ফলস্বরূপ ডেটাফ্রেম প্রদান করে।

উপসংহার

একটি ডেটাফ্রেমে অনুপস্থিত এন্ট্রিগুলির সাথে মোকাবিলা করা একটি মৌলিক এবং জটিলতা কমাতে এবং ডেটা বিশ্লেষণ প্রক্রিয়ায় ডেটাকে বিকৃতভাবে পরিচালনা করার জন্য একটি প্রয়োজনীয় প্রয়োজনীয়তা৷ এই সমস্যাটি মোকাবেলা করার জন্য পান্ডাস আমাদেরকে কয়েকটি বিকল্প সরবরাহ করে। আমরা এই গাইডে দুটি সহজ কৌশল নিয়ে এসেছি। আপনার জন্য জিনিসগুলিকে কিছুটা বোধগম্য এবং সহজ করার জন্য নমুনা কোডগুলি চালানোর জন্য আমরা 'স্পাইডার' টুলের সাহায্যে উভয় কৌশলই অনুশীলন করেছি। এই ফাংশনগুলির জ্ঞান অর্জন আপনার পান্ডাস দক্ষতাকে তীক্ষ্ণ করবে।