পান্ডাসে ডেটাফ্রেম সাফ করুন

Pandase Detaphrema Sapha Karuna



Pandas DataFrame থেকে একটি ডেটা অপসারণ করা হয় pandas.DataFrame.drop() ফাংশন ব্যবহার করে। এই ফাংশনটি ছাড়াও, আমরা কলাম/সারি বিবেচনা না করে ডেটাফ্রেম থেকে সারি নির্বাচন করতে পারি। এটি বর্গাকার বন্ধনী ব্যবহার করেও করা যেতে পারে। এই নির্দেশিকায়, আমরা 'ডেল' কীওয়ার্ড এবং পপ() ফাংশনটি ব্যবহার করব যাতে একটি 'ফর' লুপ ব্যবহার করে ডেটাফ্রেম পুনরাবৃত্তি করে সমস্ত সারি মুছে ফেলা হয়।

Pandas.DataFrame.Drop ব্যবহার করা

আমরা Pandas.DataFrame.drop() ফাংশনটি Pandas DataFrame থেকে নির্দিষ্ট সারি বা নির্দিষ্ট কলাম ড্রপ করতে ব্যবহার করি। সমস্ত সারি এবং কলাম ড্রপ করতে এই ফাংশনটি ব্যবহার করা যাক।

বাক্য গঠন :







নিচের pandas.DataFrame.drop() ফাংশনের সিনট্যাক্স। আমরা শুধুমাত্র তিনটি পরামিতি ব্যবহার করি এবং এই গাইডে শুধুমাত্র এই তিনটি নিয়ে আলোচনা করি। এই ফাংশনে একটি বিস্তারিত টিউটোরিয়াল বিদ্যমান:



পান্ডা ডেটাফ্রেম . ড্রপ ( লেবেল , অক্ষ , সূচক , কলাম , স্তর , জায়গায় , ত্রুটি )
  1. ডেটাফ্রেম থেকে সমস্ত সারি মুছে ফেলার জন্য আমাদের 'লেবেল' প্যারামিটারে সারি সূচকগুলির একটি তালিকা পাস করতে হবে। আমরা DataFrame.index অ্যাট্রিবিউটও পাস করতে পারি যা সমস্ত সারি সূচক নির্বাচন করে। একইভাবে, আমাদের এই প্যারামিটারে সমস্ত কলামের নাম পাস করতে হবে বা DataFrame.columns প্রপার্টি পাস করতে হবে।
  2. আপনি যদি 'লেবেল' প্যারামিটারে কলামগুলি পাস করেন তবে 'অক্ষ' প্যারামিটারটি 1 এ সেট করুন। ডিফল্টরূপে, অক্ষ = 0 যা সারিগুলিকে বোঝায়।
  3. আমরা বিদ্যমান ডেটাফ্রেমে অপারেশন (ডিলিট) করতে পারি। 'ইনপ্লেস' প্যারামিটারটিকে 'ট্রু' এ সেট করুন।

উদাহরণ 1:

চারটি সারি এবং দুটি কলাম সহ 'ক্যাম্পেইন1' ডেটাফ্রেমটি বিবেচনা করুন৷ প্রথমে, 'লেবেল' প্যারামিটারে সারি সূচকগুলি পাস করে সমস্ত সারি ড্রপ করুন এবং তারপর কলাম লেবেলগুলিকে 'লেবেল' প্যারামিটারে পাস করে সমস্ত কলাম ড্রপ করুন।



আমদানি পান্ডা

# ডেটাফ্রেম তৈরি করুন - 2টি কলাম এবং 4টি রেকর্ড সহ প্রচারাভিযান1
প্রচারণা ১ = পান্ডা ডেটাফ্রেম ( [ [ 'জাভা ক্যাম্প' , 'ভারত' ] , [ 'লিনাক্স ক্যাম্প' , 'আমেরিকা' ] , [ 'c/c++ ক্যাম্প' , 'ভারত' ] , [ 'পাইথন ক্যাম্প' , 'আমেরিকা' ] ] ,
কলাম = [ 'প্রচারাভিযান নাম' , 'অবস্থান' ] )
ছাপা ( প্রচারণা ১ , ' \n ' )

# সমস্ত সারি বাদ দিন
প্রচারণা ১. ড্রপ ( লেবেল = [ 0 , 1 , 2 , 3 ] , জায়গায় = সত্য )
ছাপা ( প্রচারণা ১ , ' \n ' )

# সমস্ত কলাম বাদ দিন
প্রচারণা ১. ড্রপ ( লেবেল = [ 'প্রচারাভিযান নাম' , 'অবস্থান' ] , জায়গায় = সত্য , অক্ষ = 1 )
ছাপা ( প্রচারণা ১ , ' \n ' )

আউটপুট :





সারি ড্রপ করার পরে, সারি মুছে ফেলা হয় কিন্তু কলাম বিদ্যমান। কলামগুলি সরানোর পরে, 'ক্যাম্পেইন1' খালি।



উদাহরণ 2:

আগের 'Campaign1' DataFrame ব্যবহার করুন এবং 'Campaign1.index' কে 'লেবেল' প্যারামিটারে পাস করে সারিগুলি ড্রপ করুন এবং তারপর 'লেবেল' প্যারামিটারে 'Campaign.columns' পাস করে কলামগুলি ফেলে দিন।

আমদানি পান্ডা

# ডেটাফ্রেম তৈরি করুন - 2টি কলাম এবং 4টি রেকর্ড সহ প্রচারাভিযান1
প্রচারণা ১ = পান্ডা ডেটাফ্রেম ( [ [ 'জাভা ক্যাম্প' , 'ভারত' ] , [ 'লিনাক্স ক্যাম্প' , 'আমেরিকা' ] , [ 'c/c++ ক্যাম্প' , 'ভারত' ] , [ 'পাইথন ক্যাম্প' , 'আমেরিকা' ] ] ,
কলাম = [ 'প্রচারাভিযান নাম' , 'অবস্থান' ] )
ছাপা ( প্রচারণা ১ , ' \n ' )

# সমস্ত সারি বাদ দিন
প্রচারণা ১. ড্রপ ( লেবেল = প্রচারণা ১. সূচক , জায়গায় = সত্য )

# সমস্ত কলাম বাদ দিন
প্রচারণা ১. ড্রপ ( লেবেল = প্রচারণা ১. কলাম , জায়গায় = সত্য , অক্ষ = 1 )
ছাপা ( প্রচারণা ১ )

আউটপুট :

সারি ড্রপ করার পরে, সারি মুছে ফেলা হয় কিন্তু কলাম বিদ্যমান। কলামগুলি সরানোর পরে, 'ক্যাম্পেইন1' খালি।

Iloc ব্যবহার করে[]

pandas.DataFrame.iloc[] প্রপার্টিটি ইনডেক্স পজিশনের উপর ভিত্তি করে ডাটা নির্বাচন করতে ব্যবহৃত হয়। আমরা ডেটাফ্রেম থেকে 0টি সারি এবং 0টি কলাম নির্বাচন করতে এই বৈশিষ্ট্যটি ব্যবহার করতে পারি। এখানে, আমরা প্রকৃত ডেটাফ্রেম মুছে দিচ্ছি না, তবে আমরা 0 রেকর্ড নির্বাচন করব।

বাক্য গঠন :

প্রথমে আমাদের কলাম এবং তারপর সারি মুছে ফেলতে হবে।

  1. 0টি কলাম নির্বাচন করুন - DataFrame.iloc[:,0:0]
  2. 0 সারি নির্বাচন করুন - DataFrame.iloc[0:0]

উদাহরণ :

একই DataFrame ব্যবহার করুন এবং iloc[] বৈশিষ্ট্য ব্যবহার করে খালি DataFrame নির্বাচন করুন।

আমদানি পান্ডা

# ডেটাফ্রেম তৈরি করুন - 2টি কলাম এবং 4টি রেকর্ড সহ প্রচারাভিযান1
প্রচারণা ১ = পান্ডা ডেটাফ্রেম ( [ [ 'জাভা ক্যাম্প' , 'ভারত' ] , [ 'লিনাক্স ক্যাম্প' , 'আমেরিকা' ] , [ 'c/c++ ক্যাম্প' , 'ভারত' ] , [ 'পাইথন ক্যাম্প' , 'আমেরিকা' ] ] ,
কলাম = [ 'প্রচারাভিযান নাম' , 'অবস্থান' ] )
ছাপা ( প্রচারণা ১ , ' \n ' )

# সমস্ত সারি বাদ দিন
প্রচারণা ১. ড্রপ ( লেবেল = [ 0 , 1 , 2 , 3 ] , জায়গায় = সত্য )
ছাপা ( প্রচারণা ১ , ' \n ' )

# সমস্ত কলাম বাদ দিন
প্রচারণা ১. ড্রপ ( লেবেল = [ 'প্রচারাভিযান নাম' , 'অবস্থান' ] , জায়গায় = সত্য , অক্ষ = 1 )
ছাপা ( প্রচারণা ১ , ' \n ' )

আউটপুট :

ডেল কীওয়ার্ড ব্যবহার করা

'ফর' লুপের ভিতরে সমস্ত সারি পুনরাবৃত্তি করে 'ডেল' কীওয়ার্ড ব্যবহার করে ডেটাফ্রেম থেকে সম্পূর্ণ ডেটা মুছে ফেলা হবে।

আমদানি পান্ডা

# ডেটাফ্রেম তৈরি করুন - 4টি কলাম এবং 4টি রেকর্ড সহ প্রচারাভিযান1
প্রচারণা ১ = পান্ডা ডেটাফ্রেম ( [ [ 'জাভা ক্যাম্প' , 'ভারত' ] , [ 'লিনাক্স ক্যাম্প' , 'আমেরিকা' ] , [ 'c/c++ ক্যাম্প' , 'ভারত' ] , [ 'পাইথন ক্যাম্প' , 'আমেরিকা' ] ] ,
কলাম = [ 'প্রচারাভিযান নাম' , 'অবস্থান' ] )
ছাপা ( প্রচারণা ১ , ' \n ' )

# ডেল কীওয়ার্ড ব্যবহার করা
জন্য i ভিতরে প্রচারাভিযান 1:
এর প্রচারণা ১ [ i ]
ছাপা ( প্রচারণা ১ )

আউটপুট :

এখন, DataFrame খালি।

Pop() ফাংশন ব্যবহার করে

pop() ফাংশন ব্যবহার করে 'for' লুপের ভিতরের সমস্ত সারি পুনরাবৃত্তি করে সমগ্র ডেটা ডেটাফ্রেম থেকে মুছে ফেলা হবে। এই ফাংশনটি 'ফর' লুপের ভিতরে নির্দিষ্ট করা আছে।

আমদানি পান্ডা

# ডেটাফ্রেম তৈরি করুন - 4টি কলাম এবং 4টি রেকর্ড সহ প্রচারাভিযান1
প্রচারণা ১ = পান্ডা ডেটাফ্রেম ( [ [ 'জাভা ক্যাম্প' , 'ভারত' ] , [ 'লিনাক্স ক্যাম্প' , 'আমেরিকা' ] , [ 'c/c++ ক্যাম্প' , 'ভারত' ] , [ 'পাইথন ক্যাম্প' , 'আমেরিকা' ] ] ,
কলাম = [ 'প্রচারাভিযান নাম' , 'অবস্থান' ] )
ছাপা ( প্রচারণা ১ , ' \n ' )

# পপ() ব্যবহার করে
জন্য i ভিতরে প্রচারাভিযান 1:
প্রচারণা ১. পপ ( i )
ছাপা ( প্রচারণা ১ )

আউটপুট :

এখন, DataFrame খালি।

উপসংহার

আমরা শিখেছি কিভাবে সারি এবং কলামগুলি সরিয়ে পান্ডাস ডেটাফ্রেম পরিষ্কার করতে হয়। প্রথমে, আমরা ড্রপ() ফাংশন ব্যবহার করে ডেটাফ্রেম থেকে সারিগুলি বাদ দিয়েছিলাম এবং তারপরে 0 সারি নির্বাচন করতে iloc[] বৈশিষ্ট্য ব্যবহার করার পরে কলামগুলি বাদ দিয়েছিলাম। সবশেষে, আমরা আলোচনা করেছি কিভাবে “del” কীওয়ার্ড এবং pop() ফাংশন ব্যবহার করে ডেটাফ্রেম থেকে রেকর্ড মুছে ফেলা যায়।