পাইথনে এক্সেল (xlsx) ফাইল কিভাবে পড়বেন

How Read Excel File Python



দ্য .xlsx এক্সেল ডকুমেন্টের এক্সটেনশন যা টেবুলার আকারে প্রচুর পরিমাণে ডেটা সংরক্ষণ করতে পারে এবং এক্সেল স্প্রেডশীটে অনেক ধরনের গাণিতিক এবং যৌক্তিক গণনা সহজেই করা যায়। কখনও কখনও প্রোগ্রামিং উদ্দেশ্যে পাইথন স্ক্রিপ্ট ব্যবহার করে এক্সেল ডকুমেন্ট থেকে ডেটা পড়তে হয়। এক্সেল ডকুমেন্ট পড়ার জন্য পাইথনে অনেক মডিউল বিদ্যমান। কিছু দরকারী মডিউল হল xlrd , openpyxl , এবং পান্ডা । পাইথনে এক্সেল ফাইল পড়ার জন্য এই মডিউলগুলি ব্যবহারের উপায়গুলি এই টিউটোরিয়ালে দেখানো হয়েছে।

পূর্ব প্রয়োজনীয়তা:

এই টিউটোরিয়ালের উদাহরণ পরীক্ষা করার জন্য .xlsx এক্সটেনশন সহ একটি ডামি এক্সেল ফাইল প্রয়োজন হবে। আপনি যে কোন বিদ্যমান এক্সেল ফাইল ব্যবহার করতে পারেন অথবা একটি নতুন ফাইল তৈরি করতে পারেন। এখানে, একটি নতুন এক্সেল ফাইল নামে sales.xlsx নিম্নলিখিত ডেটা দিয়ে ফাইল তৈরি করা হয়েছে। এই টিউটোরিয়ালের পরবর্তী অংশে বিভিন্ন পাইথন মডিউল ব্যবহার করে এই ফাইলটি পড়ার জন্য ব্যবহার করা হয়েছে।







sales.xlsx



বিক্রির তারিখ বিক্রয় ব্যক্তি পরিমাণ
05/12/18 সিলা আহমেদ 60000
12/06/19 আমি হোসেন 50,000
08/09/20 সারমিন জাহান 45000
04/07/21 মাহমুদুল হাসান 30000

উদাহরণ -1: xlrd ব্যবহার করে এক্সেল ফাইল পড়ুন

Xlrd মডিউলটি ডিফল্টভাবে পাইথনের সাথে ইনস্টল করা নেই। সুতরাং, এটি ব্যবহার করার আগে আপনাকে মডিউলটি ইনস্টল করতে হবে। এই মডিউলের সর্বশেষ সংস্করণটি .xlsx এক্সটেনশন সহ এক্সেল ফাইল সমর্থন করে না। সুতরাং, xlsx ফাইলটি পড়ার জন্য আপনাকে এই মডিউলের 1.2.0 সংস্করণটি ইনস্টল করতে হবে। এর প্রয়োজনীয় সংস্করণটি ইনস্টল করতে টার্মিনাল থেকে নিম্নলিখিত কমান্ডটি চালান xlrd



$পিপইনস্টল xlrd== 1.2.0

ইনস্টলেশন প্রক্রিয়া শেষ করার পরে, নিম্নলিখিত স্ক্রিপ্ট সহ একটি পাইথন ফাইল তৈরি করুন sales.xlsx ফাইল ব্যবহার করে xlrd মডিউল open_workbook () স্ক্রিপ্টে ফাংশন ব্যবহার করা হয় পড়ার জন্য xlsx ফাইলটি খুলুন। এই এক্সেল ফাইলটিতে শুধুমাত্র একটি শীট রয়েছে। তাহলে workbook.sheet_by_index () আর্গুমেন্ট মান 0. সহ স্ক্রিপ্টে ফাংশন ব্যবহার করা হয়েছে। পরবর্তী, নেস্টেড 'জন্য' লুপ সারি এবং কলামের মান ব্যবহার করে ওয়ার্কশীটের সেল মান পড়তে ব্যবহার করেছে। শীট ডেটার উপর ভিত্তি করে সারি এবং কলামের আকার নির্ধারণ করতে স্ক্রিপ্টে দুটি পরিসীমা () ফাংশন ব্যবহার করা হয়েছে। দ্য cell_value () ফাংশনটি লুপের প্রতিটি পুনরাবৃত্তিতে শীটের নির্দিষ্ট সেল মান পড়তে ব্যবহৃত হয়েছে। আউটপুটের প্রতিটি ক্ষেত্র একটি ট্যাব স্পেস দ্বারা আলাদা করা হবে।





# Xlrd মডিউল আমদানি করুন
xlrd আমদানি করুন

# ওয়ার্কবুক খুলুন
workbook = xlrd.open_workbook('sales.xlsx')

# ওয়ার্কশীট খুলুন
ওয়ার্কশীট = workbook.sheet_by_index(0)

# সারি এবং কলামগুলি পুনরাবৃত্তি করুন
জন্যআমিভিতরেপরিসীমা(0,5):
জন্যjভিতরেপরিসীমা(0,3):
# ট্যাব স্পেস দিয়ে ঘরের মান প্রিন্ট করুন
ছাপা(ওয়ার্কশীট.সেল_ভ্যালু(আমি, জে),শেষ=' টি')
ছাপা('')

আউটপুট:

উপরের স্ক্রিপ্টটি চালানোর পর নিম্নলিখিত আউটপুটটি প্রদর্শিত হবে।



উদাহরণ -২: openpyxl ব্যবহার করে এক্সেল ফাইল পড়ুন

দ্য openpyxl xlsx ফাইলটি পড়ার জন্য আরেকটি পাইথন মডিউল, এবং এটি ডিফল্টরূপে পাইথনের সাথে ইনস্টল করা নেই। এটি ব্যবহার করার আগে এই মডিউলটি ইনস্টল করতে টার্মিনাল থেকে নিম্নলিখিত কমান্ডটি চালান।

$পিপইনস্টলopenpyxl

ইনস্টলেশন প্রক্রিয়া শেষ করার পরে, নিম্নলিখিত স্ক্রিপ্ট সহ একটি পাইথন ফাইল তৈরি করুন sales.xlsx ফাইল Xlrd মডিউলের মত, openpyxl মডিউল আছে load_workbook () পড়ার জন্য xlsx ফাইলটি খুলতে ফাংশন। দ্য sales.xlsx ফাইলটি এই ফাংশনের আর্গুমেন্ট মান হিসাবে ব্যবহৃত হয়। এর বস্তু wookbook.active এর মান পড়ার জন্য স্ক্রিপ্টে তৈরি করা হয়েছে max_row এবং সর্বোচ্চ_কলম বৈশিষ্ট্য এই বৈশিষ্ট্যগুলি লুপগুলির জন্য নেস্টেডে ব্যবহার করা হয়েছে sales.xlsx ফাইল পরিসরের () ফাংশনটি শীটের সারি পড়ার জন্য ব্যবহার করা হয়েছে, এবং iter_cols () ফাংশনটি শীটের কলামগুলি পড়ার জন্য ব্যবহার করা হয়েছে। আউটপুটের প্রতিটি ক্ষেত্র দুটি ট্যাব স্পেস দ্বারা পৃথক করা হবে।

# ওপেনএক্সএল মডিউল আমদানি করুন
openpyxl আমদানি করুন

# Wookbook লোড করার জন্য পরিবর্তনশীল সংজ্ঞায়িত করুন
wookbook = openpyxl.load_workbook('sales.xlsx')

# সক্রিয় শীট পড়তে পরিবর্তনশীল সংজ্ঞায়িত করুন:
ওয়ার্কশীট = wookbook.active

# ঘরের মানগুলি পড়তে লুপটি পুনরাবৃত্তি করুন
জন্যআমিভিতরেপরিসীমা(0, worksheet.max_row):
জন্য সঙ্গে ভিতরেworksheet.iter_cols(, ওয়ার্কশীট.ম্যাক্স_কলাম):
ছাপা(সঙ্গে[আমি]মূল্য,শেষ=' টি টি')
ছাপা('')

আউটপুট:

উপরের স্ক্রিপ্টটি চালানোর পর নিম্নলিখিত আউটপুটটি প্রদর্শিত হবে।

উদাহরণ-3: পান্ডা ব্যবহার করে এক্সেল ফাইল পড়ুন

পান্ডাস মডিউলটি আগের মডিউলের মতো পাইথন দিয়ে ইনস্টল করা নেই। সুতরাং, যদি আপনি এটি আগে ইনস্টল না করেন, তাহলে আপনাকে এটি ইনস্টল করতে হবে। ইনস্টল করতে নিম্নলিখিত কমান্ডটি চালান পান্ডা টার্মিনাল থেকে।

$পিপইনস্টলপান্ডা

ইনস্টলেশন প্রক্রিয়া শেষ করার পরে, নিম্নলিখিত স্ক্রিপ্ট সহ একটি পাইথন ফাইল তৈরি করুন sales.xlsx ফাইল দ্য read_excel () পান্ডার ফাংশন xlsx ফাইল পড়ার জন্য ব্যবহৃত হয়। এই ফাংশনটি স্ক্রিপ্টে ব্যবহার করা হয়েছে sales.xlsx ফাইল দ্য ডেটাফ্রেম () ফাংশনটি ডাটা ফ্রেমে xlsx ফাইলের বিষয়বস্তু পড়তে এবং নামক ভেরিয়েবলে মান সংরক্ষণ করতে ব্যবহার করেছে তথ্য । ডেটার মান পরে মুদ্রিত হয়েছে।

# পান্ডা আমদানি করুন
আমদানি পান্ডাহিসাবেpd

# Xlsx ফাইল লোড করুন
excel_data = pd.read_excel('sales.xlsx')
# ডাটাফ্রেমে ফাইলের মান পড়ুন
data = pd.DataFrame(excel_data,কলাম=['বিক্রির তারিখ','বিক্রয় ব্যক্তি','পরিমাণ'])
# সামগ্রী মুদ্রণ করুন
ছাপা('ফাইলের বিষয়বস্তু হল:n', তথ্য)

আউটপুট:

উপরের স্ক্রিপ্টটি চালানোর পর নিম্নলিখিত আউটপুটটি প্রদর্শিত হবে। এই স্ক্রিপ্টের আউটপুট আগের দুটি উদাহরণ থেকে আলাদা। সারির সংখ্যাগুলি প্রথম কলামে মুদ্রিত হয়, যেখানে সারির মান 0 থেকে গণনা করা হয়েছে। তারিখের মানগুলি কেন্দ্রীয়ভাবে সংযুক্ত করা হয়। বিক্রেতাদের নামগুলি ঠিকভাবে সংযুক্ত করা হয়। পরিমাণ বাম প্রান্তিক করা হয়।

উপসংহার:

পাইথন ব্যবহারকারীদের বিভিন্ন প্রোগ্রামিং উদ্দেশ্যে xlsx ফাইলের সাথে কাজ করতে হবে। Xlsx ফাইল পড়ার তিনটি ভিন্ন উপায় এই টিউটোরিয়ালে তিনটি পাইথন মডিউল ব্যবহার করে দেখানো হয়েছে। Xlsx ফাইলটি পড়ার জন্য প্রতিটি মডিউলের বিভিন্ন ফাংশন এবং বৈশিষ্ট্য রয়েছে। এই টিউটোরিয়ালটি পাইথন ব্যবহারকারীদের এই টিউটোরিয়ালটি পড়ার পর সহজেই পাইথন স্ক্রিপ্ট ব্যবহার করে xlsx ফাইল পড়তে সাহায্য করবে।