পান্ডাস সিরিজ থেকে CSV

Pandasa Sirija Theke Csv



পান্ডাসে 'Series.to_csv()' পদ্ধতিটি একটি কমা-বিভাজিত মান (csv) নোটেশনে নির্দিষ্ট সিরিজ অবজেক্টকে আউটপুট করে। এই ফাংশনটি সহজভাবে একটি সিরিজ থেকে মান নেয় এবং সূচী এবং কলামের মানের পৃথকীকরণের জন্য কমা যোগ করে তাদের বিন্যাস পরিবর্তন করে।

এই ফাংশন নিযুক্ত করার জন্য, আমাদের নিম্নলিখিত সিনট্যাক্স ব্যবহার করতে হবে:









এই নিবন্ধটি আপনাকে একটি পাইথন প্রোগ্রামে এই পদ্ধতি ব্যবহার করার উপায়গুলি শিখতে দুটি ভিন্ন কৌশল প্রদান করবে।



উদাহরণ # 1: তারিখ-টাইম ইনডেক্স সহ একটি সিরিজকে কমা-বিভক্ত মানগুলিতে রূপান্তর করতে Series.to_csv() পদ্ধতি ব্যবহার করা

একটি সিরিজকে CSV ফরম্যাটে পরিবর্তন করতে, আমরা 'Series.to_csv()' ফাংশন ব্যবহার করব। এই চিত্রটি একটি DatetimeIndex সহ একটি সিরিজ তৈরি করবে এবং তারপর এটি একটি কমা-বিচ্ছিন্ন মান বিন্যাসে রূপান্তর করবে।





এই পদ্ধতিটি কার্যকর করার জন্য, আমাদের অবশ্যই এমন টুল থাকতে হবে যা পাইথন প্রোগ্রামিংকে সমর্থন করে। কোড কম্পাইল করার জন্য 'স্পাইডার' টুলটি বেছে নেওয়া হয়েছে। এটিতে স্ক্রিপ্ট লিখতে, আমরা প্রথমে আমাদের সিস্টেমে ইনস্টল করা টুলটি চালু করেছি। পাইথন প্রোগ্রামের প্রয়োজনীয় ফলাফল অর্জনের জন্য এর পদ্ধতিগুলি অনুশীলন করার জন্য একটি লাইব্রেরি প্রয়োজন। আমরা এখানে যে লাইব্রেরিটি লোড করেছি সেটি হল 'পান্ডাস'। কোডের একই লাইনে, এই লাইব্রেরির উপনামটিকে 'pd' হিসাবে চিহ্নিত করা হয়েছে। সুতরাং, প্রোগ্রাম যেখানেই হোক না কেন, একটি ফাংশন অ্যাক্সেস করার জন্য আমাদের 'পান্ডা' লিখতে হবে। আমরা পরিবর্তে লিখব 'pd'।

কোড দিয়ে শুরু করার প্রথম ধাপ হল একটি পান্ডাস সিরিজ তৈরি করা। পান্ডা থেকে সিরিজ তৈরির পদ্ধতি ব্যবহার করার জন্য আমাদের 'pd' লিখতে হবে। 'pd.Series()' ফাংশনটিকে বলা হয় নির্দিষ্ট মান সহ একটি সিরিজ তৈরি করতে। সিরিজের জন্য আমরা যে মানগুলি সরবরাহ করেছি তা হল “ইস্তাম্বুল”, “ইজমির”, “আঙ্কারা”, “আঙ্কারা”, “আন্তাল্যা”, “কোনিয়া” এবং “বুর্সা”। আপনি যদি মানগুলির এই অ্যারের একটি নাম দিতে চান, আপনি 'নাম' প্যারামিটার ব্যবহার করে তা করতে পারেন। এখানে, আমরা এই মানগুলির নামকরণ করেছি 'শহর' কারণ এটি 6টি শহরের নাম ধরে রেখেছে। এই সিরিজটি সংরক্ষণ করার জন্য, একটি সিরিজ অবজেক্ট 'তুরস্ক' তৈরি করা হয়েছে।



একটি DatetimeIndex তৈরি করতে, আমরা 'pd.date_range()' পদ্ধতি ব্যবহার করেছি। এই ফাংশনের বন্ধনীর মধ্যে, আমরা 4টি আর্গুমেন্ট পাস করেছি যেগুলো হল: “start”, “freq”, “periods”, এবং “tz”।

'শুরু' যুক্তিটি এটি থেকে একটি তারিখ পরিসর তৈরি করা শুরু করতে একটি তারিখ এবং সময় নেয়৷ এখানে, আমরা '2022-03-02 02:30' হিসাবে শুরুর তারিখ এবং সময় নির্দিষ্ট করেছি। 'freq' প্যারামিটারটি তারিখ পরিসরের ফ্রিকোয়েন্সি শ্রেণীবদ্ধ করছে। সুতরাং, আমরা 'D' মান দিয়ে এটি প্রদান করেছি। এখন, এটি দৈনিক ফ্রিকোয়েন্সিতে একটি তারিখ পরিসীমা তৈরি করবে। 'পিরিয়ড' আর্গুমেন্টটি '6' এ সেট করা হয়েছে যার মানে এটি 6 দিনের জন্য একটি তারিখ পরিসর তৈরি করবে। শেষ প্যারামিটার হল 'tz' যা নির্দিষ্ট এলাকার জন্য টাইমজোন নির্দিষ্ট করে। আমরা 'এশিয়া/ইস্তাম্বুল' এর জন্য সময় অঞ্চল নির্দিষ্ট করেছি৷

এই তারিখ পরিসীমা সংরক্ষণ করার জন্য, আমরা একটি পরিবর্তনশীল 'তারিখ সময়' ভেরিয়েবল তৈরি করেছি। DatetimeIndex সেট করতে, আমরা 'Series.index' প্রপার্টি ব্যবহার করেছি। 'তুরস্ক' সিরিজের নাম '.ইনডেক্স' বৈশিষ্ট্যের সাথে সরবরাহ করা হয়েছে এবং এটিকে 'তারিখ সময়' ভেরিয়েবলে সংরক্ষিত তারিখের সময়সীমা নির্ধারণ করা হয়েছে। এইভাবে, 'সূচী' বৈশিষ্ট্য 'তারিখ সময়' ভেরিয়েবল থেকে মান গ্রহণ করবে এবং তাদের 'তুরস্ক' সিরিজের সূচক তালিকা তৈরি করবে। সবশেষে, আউটপুট সিরিজ দেখার জন্য, আমরা 'প্রিন্ট()' পদ্ধতি ব্যবহার করেছি এবং এর বিষয়বস্তু প্রদর্শনের জন্য 'টার্কি' সিরিজকে ইনপুট হিসেবে পাস করেছি।

আমরা স্ক্রিপ্ট চালানোর জন্য 'রান ফাইল' বিকল্পটি টিপেছি। ফলস্বরূপ, আমরা '2022-03-02 02:30:00+03:00' থেকে শুরু করে '2022-03-07 02:30:00+03:00″ এ শেষ হওয়া তারিখের সূচক সহ একটি সিরিজ দেখতে পাচ্ছি। 6 দিনের। সিরিজের নীচে 'ফ্রিকে : ডি', অ্যারে তালিকার নাম 'শহর' এবং dtype 'অবজেক্ট'ও উল্লেখ করা হয়েছে।

এখন, আমরা এই সিরিজটিকে CSV ফরম্যাটে রূপান্তর করতে শিখব যা আমরা উপরের স্ন্যাপশটে দেখেছি। সিরিজটিকে কমা-বিচ্ছিন্ন মানগুলিতে পরিবর্তন করতে, আমাদের কাছে পান্ডাস মডিউল দ্বারা প্রদত্ত একটি পদ্ধতি রয়েছে যা 'Series.to_csv()'। এই পদ্ধতিটি প্রদত্ত সিরিজের মান নেয় এবং কলামের মানগুলির মধ্যে কমা যোগ করে।

'Series.to_csv()' ফাংশনটিকে বলা হয়। আমরা যে সিরিজটি রূপান্তর করতে চাই তার নামটি 'Turkey.to_csv()' হিসাবে পদ্ধতির সাথে উল্লেখ করা হয়েছে। কমা-বিচ্ছিন্ন মানগুলি সংরক্ষণ করার জন্য, আমরা একটি ভেরিয়েবল 'কমা_সেপারেটেড' তৈরি করেছি এবং তারপরে 'প্রিন্ট()' ফাংশনটি চালু করে আউটপুট উইন্ডোতে এর বিষয়বস্তু রেখেছি।

এখানে csv ফরম্যাটে আমাদের সিরিজ। আমরা স্ন্যাপশটে দেখতে পাচ্ছি যে তাদের মধ্যে কমা ব্যবহার করে সূচক এবং সিরিজের মানগুলি আলাদা করা হয়েছে।

উদাহরণ # 2: NaN মান সহ একটি সিরিজকে কমা-বিচ্ছিন্ন মানগুলিতে রূপান্তর করতে Series.to_csv() পদ্ধতি ব্যবহার করা

'Series.to_csv()' পদ্ধতিটি অনুশীলন করার দ্বিতীয় কৌশলটি হল একটি CSV বিন্যাসে কিছু শূন্য এন্ট্রি ধারণ করে এমন একটি সিরিজকে রূপান্তর করতে এই পদ্ধতিটি প্রয়োগ করা।

আমরা প্রাথমিকভাবে প্রয়োজনীয় প্যাকেজ আমদানি করেছি। 'pd' কে পান্ডাদের জন্য একটি উপনাম এবং নম্পির জন্য একটি উপনাম হিসাবে 'np' তৈরি করা হয়েছে। নম্পি টুলকিটটি এখানে লোড করা হয়েছে কারণ আমরা আমাদের সিরিজে কিছু নাল এন্ট্রি করব “np.NaN” ব্যবহার করে এটি তৈরি করার সময় পান্ডাস “pd.Series()” পদ্ধতি ব্যবহার করে।

'pd.Series()' ফাংশনটি এই মানগুলির সাথে একটি পান্ডাস সিরিজ তৈরি করার জন্য আহ্বান করা হয়েছে: 'নীল', 'Amazon', np.NaN, 'গঙ্গা', 'মিসিসিপি', 'np.NaN', 'ইয়াংটজে', 'ড্যানিউব', 'মেকং', 'np.NaN', এবং 'ভোলগা'। সিরিজটির জন্য মোট 21টি মান সংজ্ঞায়িত করা হয়েছে যার মধ্যে 3টি এন্ট্রিতে 'np.NaN' মান রয়েছে যার মানে সিরিজে 3টি মান অনুপস্থিত। 'নাম' বৈশিষ্ট্য এই মানগুলির জন্য নাম নির্দিষ্ট করে যা আমরা 'শিরোনাম' প্রদান করেছি। 'সূচী' বৈশিষ্ট্যটি ডিফল্ট তালিকার সাথে না গিয়ে ব্যবহারকারী-সংজ্ঞায়িত সূচক তালিকা সেট করতে ব্যবহার করা হয়।

এখানে, আমরা “10”, “11”, “12”, “13”, “14”, “16”, “17”, “18”, “19”, “20” মান সহ সূচক তালিকা চাই। এবং 21'। এখন, আমাদের সিরিজের সূচী তালিকা থাকবে '0' এর পরিবর্তে '10' থেকে শুরু হবে। এখন, এই সিরিজটি সংরক্ষণ করুন যাতে আমরা এটি পরবর্তীতে প্রোগ্রামে ব্যবহার করতে পারি। আমরা একটি সিরিজ অবজেক্ট 'রিভারস' শুরু করেছি এবং এটিকে 'pd.Series()' পদ্ধতিতে কল করার মাধ্যমে তৈরি আউটপুট সিরিজ বরাদ্দ করেছি। পাইথন দ্বারা “প্রিন্ট()” ফাংশন ব্যবহার করে ডিসপ্লেতে রেখে সিরিজটি দেখা যেতে পারে।

টার্মিনালে রেন্ডার করা আউটপুট একটি সিরিজ প্রিন্ট করে যার সূচী তালিকা 10 থেকে শুরু হয় এবং 21 এ শেষ হয় যার মানে সিরিজটির 21 টি মান রয়েছে।

সিরিজটিকে 'Series.to_csv()' পদ্ধতিতে একটি CSV ফর্ম্যাটে রূপান্তরিত করা হবে।

আমরা আমাদের সিরিজ 'তুরস্ক' এর সাথে 'Series.to_csv()' পদ্ধতি চালু করেছি। সুতরাং, এই পদ্ধতিটি 'তুরস্ক' সিরিজ থেকে মানগুলি গ্রহণ করবে এবং সেগুলিকে কমা দ্বারা পৃথক করা মান বিন্যাসে রূপান্তর করবে৷ ফলাফল 'Converted_csv' ভেরিয়েবলে সংরক্ষিত হয়। এবং শেষ পর্যন্ত, রূপান্তরিত সিরিজটি 'প্রিন্ট()' ফাংশনের সাহায্যে মুদ্রিত হয়।

নীচের ফলাফলের স্ন্যাপশটে, আপনি দেখতে পাচ্ছেন যে সিরিজের মানগুলি এখন এমনভাবে পরিবর্তিত হয়েছে যেখানে একটি কমা তাদের সূচক তালিকা থেকে আলাদা করতে ব্যবহার করা হয়। অধিকন্তু, যেখানে মানগুলি অনুপস্থিত, শুধুমাত্র সূচক নম্বরটি একটি কমা দিয়ে মুদ্রিত হয়।

উপসংহার

একটি CSV বিন্যাসে একটি পান্ডা সিরিজের পরিবর্তন একটি ব্যবহারিক পদ্ধতি। এটি পান্ডা 'Series.to_csv()' ফাংশন ব্যবহার করে অর্জন করা যেতে পারে। এই নির্দেশিকাটি এই পদ্ধতিটি ব্যবহার করার জন্য দুটি কৌশল প্রয়োগ করেছে। প্রথম দৃষ্টান্তে, আমরা একটি DatetimeIndex সহ একটি সিরিজকে কমা দ্বারা পৃথক করা মান বিন্যাসে রূপান্তর করতে এই পদ্ধতিটি ব্যবহার করেছি। 2য় উদাহরণটি একটি CSV ফর্ম্যাটে কিছু অনুপস্থিত এন্ট্রি সহ একটি সিরিজ সংশোধন করতে “Series.to_csv()” ফাংশন ব্যবহার করেছে৷ উভয় কৌশলই উইন্ডোজ অপারেটিং সিস্টেমে 'স্পাইডার' টুল ব্যবহার করে কার্যত প্রয়োগ করা হয়েছে।