JSON-এ পান্ডাস ডেটাফ্রেম

Json E Pandasa Detaphrema



'পান্ডা' ডেটা ম্যানিপুলেশনের পাশাপাশি ডেটা বিশ্লেষণের সুবিধা প্রদান করে। আধুনিক বিশ্বে, ডেটা বিশ্লেষণ একটি অত্যন্ত মূল্যবান হাতিয়ার। এই কাজটি সম্পন্ন করার জন্য, কম্পিউটার বিজ্ঞানে বিভিন্ন ডেটা স্ট্রাকচার পাওয়া যায়। 'পান্ডাস'-এ আমাদের ডেটাফ্রেম আছে, যা 'JSON'-এ রূপান্তরিত হয়। আমরা 'JSON' ব্যাখ্যা করতে পারি কারণ এটি একটি পাঠ্য যা জাভাস্ক্রিপ্ট অবজেক্ট নোটেশন ব্যবহার করে। সার্ভার এবং ওয়েব অ্যাপের মধ্যে ডেটা স্থানান্তর 'JSON' ব্যবহার করে। এই গাইডে, আমরা ডেটাফ্রেমের JSON ফর্ম্যাট রূপান্তর পরীক্ষা করব। DataFrame থেকে 'Json'-এ এই রূপান্তরের জন্য, 'পান্ডা' 'to_json()' পদ্ধতি প্রদান করে। যখনই আমাদের ডেটাফ্রেমকে 'JSON' ফরম্যাটে রূপান্তর করতে হবে, আমরা 'পান্ডাস' এর 'to_json()' পদ্ধতিটি ব্যবহার করি। 'পান্ডাস' এর ফাংশনটি কীভাবে ব্যবহার করবেন তা আরও ভালভাবে বোঝার জন্য যা 'to_json', আসুন এই নির্দেশিকায় এখানে 'পান্ডা' এর কয়েকটি কোড দেখি৷'

উদাহরণ # 01
আমরা অনুশীলনে দেখাব কিভাবে 'পান্ডা' এর 'to_json()' পদ্ধতিটি JSON ফর্ম্যাটে 'পান্ডাস' ডেটাফ্রেম পরিবর্তন করার জন্য ব্যবহার করা যায়। 'পান্ডা' প্যাকেজটি এখানে আমদানি করা হয়েছে, যা 'numpy' এবং আমরা এটি 'np' হিসাবে আমদানি করি। এখন, 'পান্ডা' কোড চালানোর জন্য, পান্ডার প্যাকেজগুলি আমদানি করা উচিত। সেই প্যাকেজটি আমদানি করতে, আমরা 'আমদানি' কীওয়ার্ডটি ব্যবহার করি। তারপর, আমরা 'pd হিসাবে pandas' সেট করি, যার মানে হল যে আমরা যেকোন 'পান্ডাস প্যাকেজ' সহজেই অ্যাক্সেস করতে বা ব্যবহার করতে পারি যা আমাদের প্রয়োজন শুধুমাত্র সেখানে 'pd' রেখে।

আমরা এখানে “np ব্যবহার করে নম্পি অ্যারে তৈরি করি। array', এই 'np' আমাদের নম্পি লাইব্রেরি ফাংশন অ্যাক্সেস করতে সাহায্য করে। এই numpy অ্যারেটি 'New_data' ভেরিয়েবলেও সংরক্ষিত আছে এবং আমরা এই numpy অ্যারেতে 'A, B, C, D' এবং 'E, F, G, H' রাখি। এই নম্পি অ্যারেটি এখন 'pd.DataFrame' পদ্ধতি ব্যবহার করে ডেটাফ্রেমে রূপান্তরিত হয়েছে। এটি হল 'পান্ডাস' পদ্ধতি যা আমরা এখানে 'pd' বসিয়ে অ্যাক্সেস করি। যখন আমরা এই নম্পি অ্যারেটিকে ডেটাফ্রেমে রূপান্তর করি, তখন আমরা কলামের নামগুলিও রাখি।







কলাম হেডার হিসাবে আমরা এখানে যে নামগুলি যোগ করি তা হল 'col1, col2, col3 এবং col4'। তারপর আপনি দেখতে পাচ্ছেন যে আমাদের নীচে 'প্রিন্ট' রয়েছে যেখানে আমরা ডেটাফ্রেমের নাম সেট করেছি, যা এই ক্ষেত্রে 'New_dataFrame', তাই এই কোডটি কার্যকর করার সময় এটি রেন্ডার করা হবে। এখন, আমরা “to_json()” পদ্ধতি ব্যবহার করে এই ডেটাফ্রেমটিকে JSON ফরম্যাটে রূপান্তর করছি। আমরা 'to_json()' পদ্ধতির সাথে DataFrame 'New_dataFrame' এর নাম সেট করি এবং এই পদ্ধতিটিকে 'New_json' ভেরিয়েবলে রাখি। এখানে, আমরা এই 'to_json()' পদ্ধতিতে কোনো প্যারামিটার পাস করিনি। ডেটাফ্রেমের JSON ফর্ম্যাটটি এখন 'প্রিন্ট' এ রাখা হয়েছে এবং এটি কনসোলেও রেন্ডার হবে।





এই কোডের সংকলন এবং সম্পাদনের জন্য, আমরা 'Shift+Enter' চাপি এবং যদি কোডটি ত্রুটি-মুক্ত হয়, তাহলে আউটপুট রেন্ডার হবে। এখানে আমরা এই কোডের ফলাফল পেস্ট করেছি যেখানে আমরা এই উদাহরণে তৈরি করা ডেটাফ্রেম এবং সেই ডেটাফ্রেমের JSON ফর্ম্যাটটি দেখিয়েছি।





উদাহরণ # 02
এখানে, আমরা শুধুমাত্র একটি লাইব্রেরি আমদানি করি, যা হল 'পান্ডা' এবং তারপরে 'AtoZ_Courses' তালিকা তৈরি করা হয়, এবং আমরা এতে কিছু তালিকা রাখি, যা হল 'Python, 29000, 35 days, এবং 1000.0', তারপরে আমরা রাখি ' JavaScript, 27000, 55 দিন, এবং 2300.0', এর পরে, আমরা 'HTMLCSS, 25000, 25 দিন এবং 1500.0' যোগ করি। এখন, আমরা 'ডেটাবেস, 24000, 45 দিন, এবং 1500.0', এবং 'OOP, 21000, 35 দিন, 1500.0' হিসাবে আরও দুটি ডেটা সন্নিবেশ করেছি। 'AtoZ_Courses' তালিকাটি এখন ডেটাফ্রেমে পরিবর্তিত হয়েছে, এবং আমরা এটির নাম দিয়েছি 'AtoZ_Courses_df'। ডাটাফ্রেমের কলামের নাম হিসাবে এখানে 'কোর্স_নাম, অর্থপ্রদান, সময়কাল এবং বোনাস' যোগ করা হয়েছে।



এখন, এই ধাপে DataFrame তৈরি হয়েছে, এবং আমরা এটাকে টার্মিনালে প্রদর্শনের জন্য 'print()' স্টেটমেন্টে যোগ করি। এখন, “to_json()” পদ্ধতি ব্যবহার করে, আমরা “AtoZ_Courses_df” ডেটাফ্রেমকে JSON ফরম্যাটে রূপান্তরিত করছি। এই 'to_json()' পদ্ধতিতে একটি প্যারামিটারও দেওয়া হয়েছে যা হল 'orient= column,' যা ডিফল্ট প্যারামিটারও। এটি '{কলামের নাম -> {ইনডেক্স মান -> কলাম মান}} ফর্ম্যাট' হিসাবে ডাটাফ্রেমকে ডিক্ট হিসাবে প্রদর্শন করে।

এখানে, JSON ফরম্যাটে, এটি কলামের নাম প্রদর্শন করে এবং তারপর সূচী মানের সাথে সেই কলামের সমস্ত মান রাখে। প্রথমে, এটি প্রথম কলামের নাম উল্লেখ করে, এবং তারপর প্রথম কলামের সমস্ত মান সূচী মানের সাথে রেন্ডার করা হয়, এবং তারপর এটি দ্বিতীয় কলামের নাম এবং সূচী সহ দ্বিতীয় কলামের সমস্ত মান রাখে।

উদাহরণ # 03
এই কোডে 'Bachelors_df' নামে ডেটাফ্রেম তৈরি করা হয়েছে। আমরা এই 'ব্যাচেলরস_ডিএফ'-এ পাঁচটি কলাম সন্নিবেশিত করেছি। আমাদের এখানে প্রথম কলামটি হল 'ছাত্র' কলাম, এবং আমরা এতে 'লিলি, স্মিথ, ব্রমলি, মিলি এবং আলেকজান্ডার' সন্নিবেশ করি। পরবর্তী কলামটি 'ডিগ্রী' কলাম, যেখানে 'IT, BBA, English, CS, এবং DVM' রয়েছে। তারপরে 'বছর_অফ_যোগদান' এগিয়ে আসে যেখানে আমরা শিক্ষার্থীদের যোগদানের বছরগুলি যোগ করি, যেগুলি হল '2015, 2018, 2017, 2015 এবং 2014'৷

এই কলামের পাশের কলামটি হল 'বছর_অফ_গ্রাজুয়েশন', যেটিতে সেই ছাত্রদের স্নাতকের বছরগুলি হল '2019, 2022, 2021, 2019 এবং 2018'৷ আমরা এখানে 'CGPA' কলাম যোগ করি যেখানে আমরা শিক্ষার্থীদের '3.3, 3.5, 3.6, 3.7 এবং 3.8' এর CGPA রাখি। টার্মিনালে 'Bachelors_df' প্রদর্শন করতে, আমরা এটিকে 'print()' এক্সপ্রেশনে অন্তর্ভুক্ত করি। এখন, আমরা 'to_json()' পদ্ধতি ব্যবহার করে ' Bachelors_df ' DataFrame কে JSON ফরম্যাটে রূপান্তর করছি।

“orient= records” প্যারামিটারটি একইভাবে এই কোডের এই “to_json()” পদ্ধতিতে পাস করা হয়েছে। এই “orient= records” JSON ফরম্যাটটিকে “[{column name -> column value}, … , {column name -> column value}]” ফর্ম হিসাবে প্রদর্শন করবে। ডেটাফ্রেমের JSON ফর্ম্যাটটি এখন 'প্রিন্ট'-এ সেট করা হয়েছে এবং এটি টার্মিনালেও প্রদর্শিত হবে।

DataFrame এখানে কেবল কলাম এবং সারি আকারে দেখানো হয়েছে, কিন্তু JSON বিন্যাসে, আপনি লক্ষ্য করতে পারেন যে এটি কলামের নাম রাখে এবং তারপর সেই কলামের মান প্রদর্শন করে; একটি কলামের মান প্রদর্শন করার পরে, এটি দ্বিতীয় কলামের নাম প্রিন্ট করে এবং তারপরে সেই কলামের মান রাখে এবং তারপরে তাই কারণ আমরা 'to_josn' পদ্ধতির প্যারামিটারটিকে 'orient= records' হিসাবে সেট করেছি।

উদাহরণ # 04
আমরা একটি নমপি অ্যারে তৈরি করি 'My_data' যাতে আমরা '2, 4' এবং '6, 8' সন্নিবেশ করি। তারপর ডাটাফ্রেম 'My_dataFrame' এ নম্পি অ্যারে পরিবর্তন করুন এবং এর কলামের নাম 'A1 এবং A2' হিসাবে সেট করুন। এখন, 'প্রিন্ট' ব্যবহার করে এখানে ডেটাফ্রেম প্রদর্শন করার পর। আমরা কোন প্যারামিটার ছাড়াই প্রথমে “to_json()” পদ্ধতিটি ব্যবহার করি এবং এটি প্রদর্শন করি। এর পরে, আমরা “to_json()” পদ্ধতির প্যারামিটারকে “orient=split”-এ সেট করি এবং এই বিন্যাসটিও প্রিন্ট করি। তারপরে আমরা “to_josn()” আবার “My_dataFrame”-এ প্রয়োগ করি এবং এইবার, আমরা এই ফাংশনের প্যারামিটার হিসাবে “orient=records” পাস করি।

এর নিচে, আমরা 'My_dataFrame' এর সাথে 'orient= index' রাখি এবং এই JSON ফরম্যাটটি রেন্ডার করি। এই প্যারামিটারের পরে, আমরা আবার 'to_json' ব্যবহার করি 'orient = column' প্যারামিটারের সাথে এবং এটিকেও রেন্ডার করি। তারপরে আমরা 'to_json()' পদ্ধতির প্যারামিটার হিসাবে 'orient= values' পাস করি এবং 'My_dataFrame' এ প্রয়োগ করি। আমরা এই ফাংশনের প্যারামিটারটিকে “orient= table”-এ সেট করি এবং আবার একই DataFrame-এর সাথে ব্যবহার করি এবং এই JSON ফর্ম্যাটটিও প্রদর্শন করি। এখন, আমরা এই কোডের আউটপুটে JSON ফরম্যাটের মধ্যে পার্থক্য লক্ষ্য করব।

এখানে, আপনি সহজেই JSON এর ফর্ম্যাটের মধ্যে পার্থক্য খুঁজে পেতে পারেন, যা আমরা একই ডেটাফ্রেমে প্রয়োগ করেছি। সমস্ত প্যারামিটার যা আমরা 'to_json' পদ্ধতিতে পাস করেছি তা এখানে বিভিন্ন ফরম্যাটে প্রদর্শিত হয়।

উপসংহার

এই গাইডটি JSON ফর্ম্যাট দেখায় এবং এই JSON ফর্ম্যাটটি বিস্তারিতভাবে ব্যাখ্যা করেছে এবং কীভাবে পান্ডা ডেটাফ্রেমকে JSON-এ রূপান্তর করতে হয়। আমরা ব্যাখ্যা করেছি যে 'to_json()' পদ্ধতিটি পান্ডা ডেটাফ্রেমকে JSON ফর্ম্যাটে রূপান্তর করার জন্য ব্যবহার করা হয়। আমরা বিভিন্ন প্যারামিটার নিয়েও আলোচনা করেছি, যা আমরা এখানে “to_json()” পদ্ধতিতে পাস করেছি। আমরা একটি সম্পূর্ণ নির্দেশিকা প্রদান করেছি যেখানে আমরা আমাদের 'পান্ডাস' কোডে এই 'to_json()' পদ্ধতিতে সমস্ত সম্ভাব্য প্যারামিটার রেখে 'to_json()' পদ্ধতিগুলি ব্যবহার করেছি এবং আউটপুটে দেখিয়েছি যে এই প্যারামিটারগুলি কীভাবে বিন্যাস পরিবর্তন করে JSON এর।