R-এ নমুনা() ফাংশন

R E Namuna Phansana



R-এ, আমরা স্যাম্পল() ফাংশন ব্যবহার করে ভেক্টর বা তালিকা থেকে এলোমেলোভাবে নমুনা মান পাই। এটি আমাদেরকে এলোমেলোভাবে ডেটার একটি উপসেট নির্বাচন করতে সক্ষম করে যা অনেক পরিসংখ্যানগত অ্যাপ্লিকেশনগুলিতে কার্যকর। যদি ইনপুটটি স্যাম্পল() ফাংশনের একটি তালিকা হয়, তবে আউটপুটটিও একই সংখ্যক উপাদানের একটি তালিকা হবে, তবে নির্বাচিত উপাদানগুলির সাথে। এই নিবন্ধটি বাস্তবায়নের সাথে R এর নমুনা() ফাংশন প্রদর্শন করে যা বিভিন্ন আর্গুমেন্ট সেট করে।

উদাহরণ 1: ডেটা আর্গুমেন্টের সাথে নমুনা() ফাংশন ব্যবহার করা

এলোমেলোভাবে একটি সংখ্যা তৈরি করতে R-এর স্যাম্পল() ফাংশন নমুনা ডেটার সাথে প্রদান করতে হবে। নমুনা ডেটা হল স্যাম্পল() ফাংশনের প্রয়োজনীয় আর্গুমেন্ট যার কোড নিম্নলিখিতটিতে দেওয়া হয়েছে:

ডেটাএক্স < - গ ( 10 , বিশ , 30 , 40 , পঞ্চাশ , 60 , 70 , 80 , 90 , 100 )

নমুনা ( ডেটাএক্স , 3 )

নমুনা ( ডেটাএক্স , 3 )

এখানে, আমরা প্রথমে 'dataX' ভেরিয়েবলের মধ্যে পূর্ণসংখ্যা উপাদানগুলির ভেক্টর তৈরি করি। এরপরে, আমরা স্যাম্পল() ফাংশনটিকে কোডে দুবার কল করি এবং 'ডেটাএক্স' ভেক্টরটি পাস করি যা আমরা পূর্বে এটিতে একটি যুক্তি হিসাবে তৈরি করেছি। নমুনার প্রথম ব্যবহার(dataX, 3) 'dataX' ভেক্টর থেকে তিনটি উপাদানের একটি এলোমেলো নমুনা নেয়। ফলাফল 'dataX' থেকে তিনটি উপাদানের একটি র্যান্ডম স্থানান্তর। এর পরে, আমরা আবার নমুনা(a, 5) ব্যবহার করি যা 'dataX' ভেক্টর থেকে তিনটি উপাদানের আরেকটি স্বাধীন এলোমেলো নমুনা নেয়। এবারের ফলাফল গতবারের থেকে সম্পূর্ণ আলাদা।







আউটপুট স্যাম্পল() ফাংশনকে দুইবার কল করার সময় বিভিন্ন উপাদান দেখায়। মনে রাখবেন যে প্রতিবার আমরা এলোমেলোভাবে নমুনা তৈরি করি, ভেক্টর থেকে বিভিন্ন উপাদান প্রাপ্ত হয়:





উদাহরণ 2: রিপ্লেস আর্গুমেন্টের সাথে Sample() ফাংশন ব্যবহার করা

উপরন্তু, আমাদের কাছে নমুনা() ফাংশনের 'প্রতিস্থাপন' আর্গুমেন্ট আছে যা লজিক্যাল মান নেয়। একটি অনুরূপ উপাদান একাধিকবার নির্বাচন করা যেতে পারে যদি উপাদানটি প্রতিস্থাপন বিকল্প, সত্যের সাথে নমুনা করা হয়। যাইহোক, যদি মানটি FALSE তে সেট করা থাকে, তবে প্রতিটি উপাদানের শুধুমাত্র একটি নির্বাচন হতে পারে যার কারণে উপাদানগুলিকে প্রতিস্থাপন ছাড়াই নমুনা করা হয়।





এলোমেলো_সংখ্যা = ( এগারো , 25 , 12 , ৮৯ , চার পাঁচ , 16 , 67 , 38 , 96 , 55 , 73 )

নমুনা ( এলোমেলো_সংখ্যা , 4 , প্রতিস্থাপন = সত্য )

নমুনা ( এলোমেলো_সংখ্যা , 5 , প্রতিস্থাপন = সত্য )

এখানে, আমরা প্রথমে “random_numbers” ভেরিয়েবলের কিছু সংখ্যাসূচক মান দিয়ে ভেক্টরকে সংজ্ঞায়িত করি। এর পরে, আমরা স্যাম্পল() ফাংশনটি চালু করি যেখানে 'র্যান্ডম_সংখ্যা' একটি আর্গুমেন্ট হিসাবে পাস করা হয়। “4”-এর মান স্যাম্পল() ফাংশনে নির্দিষ্ট করা হয়েছে যা ইঙ্গিত করে যে এটি শুধুমাত্র “random_numbers”-এ ভেক্টর থেকে চারটি র্যান্ডম মান নির্বাচন করে।

এরপর, স্যাম্পল() ফাংশনে replace=TRUE উল্লেখ করে যে প্রতিটি মান একাধিকবার নির্বাচন করা যেতে পারে। তারপর, আমরা স্যাম্পল() ফাংশনটি আবার স্থাপন করি যা এই সময় ভেক্টর থেকে '5' র্যান্ডম মান নির্বাচন করে। একইভাবে, আমরা প্রতি মানের জন্য একাধিক নির্বাচন বিকল্পের জন্য আগের মতই “TRUE” দিয়ে প্রতিস্থাপন আর্গুমেন্ট সেট করেছি।



আমরা দেখতে পাচ্ছি, প্রথম আউটপুট 'এলোমেলো_সংখ্যা' ভেক্টর থেকে 4টি এলোমেলোভাবে নির্বাচিত উপাদানের ভেক্টর প্রদর্শন করে। পরবর্তী আউটপুট, যাইহোক, এলোমেলোভাবে নির্বাচিত উপাদানগুলির '5' ভেক্টর প্রদর্শন করে:

উদাহরণ 3: সাইজ আর্গুমেন্টের সাথে নমুনা() ফাংশন ব্যবহার করা

পরবর্তী আর্গুমেন্ট যে নমুনা() ফাংশন পাস করে তা হল 'আকার'। 'আকার' একটি ঐচ্ছিক পরামিতি যা অঙ্কিত নমুনার মান নির্দেশ করে। 'আকার' পরামিতি সহ নমুনা() ফাংশনের কোডটি নিম্নলিখিতটিতে দেওয়া হয়েছে:

ভেক্টর < - 1 : 10

নমুনা ( ভেক্টর , আকার = 5 )

এখানে, একটি সাংখ্যিক ভেক্টরকে 'ভেক্টর' ভেরিয়েবলের 1 থেকে 10 পর্যন্ত পূর্ণসংখ্যার একটি ক্রম হিসাবে সংজ্ঞায়িত করা হয়েছে। স্যাম্পল() ফাংশনটি ভেক্টর থেকে এলোমেলো উপাদান নির্বাচনের জন্য নিযুক্ত করা হয়। আমরা দেখতে পাচ্ছি, স্যাম্পল() ফাংশন দুটি আর্গুমেন্ট নেয়। প্রথম যুক্তি হল ভেক্টর যা থেকে আমরা নমুনা পাই। পরবর্তী আর্গুমেন্ট হল মাপ যা '5' এর মান দিয়ে নির্দিষ্ট করা হয়েছে যা নির্দেশ করে যে ভেক্টর থেকে নির্বাচন করার জন্য শুধুমাত্র পাঁচটি উপাদান আছে।

সুতরাং, নির্বাচিত উপাদানগুলিকে নিম্নলিখিত আউটপুটে একটি নতুন ভেক্টর হিসাবে এলোমেলো ক্রমে ফিরিয়ে দেওয়া হয়:

উদাহরণ 4: R তালিকার জন্য নমুনা() ফাংশন ব্যবহার করা

তাছাড়া, স্যাম্পল() ফাংশনটি R-এ তালিকার জন্য ব্যবহার করা যেতে পারে। উদাহরণের এই বিভাগটি তালিকা থেকে এলোমেলো মান পায়।

আর_তালিকা < - তালিকা ( 1 : 4 ,

913 ,

( 'এক্স' , 'YYY' , 'ভাল' ) ,

'ZZZ' ,

5 )

ফলাফল < - আর_তালিকা [ নমুনা ( 1 : দৈর্ঘ্য ( আর_তালিকা ) , আকার = 4 ) ]

ফলাফল

এখানে, 'R_list' এর তালিকাটি বিভিন্ন ধরণের উপাদানের সাথে সংজ্ঞায়িত করা হয়েছে যার মধ্যে একটি সংখ্যার ভেক্টর, একটি একক সংখ্যা, একটি অক্ষর ভেক্টর, একটি স্ট্রিং এবং অন্য একটি সংখ্যা রয়েছে৷ এর পরে, আমরা একটি 'ফলাফল' ভেরিয়েবল তৈরি করি যেখানে স্যাম্পল() ফাংশনটি আহ্বান করা হয়।

স্যাম্পল() ফাংশনের ভিতরে, আমরা '1:দৈর্ঘ্য(R_list)' এক্সপ্রেশন সেট করি যা সূচকের ভেক্টরকে নমুনা করার জন্য নির্দেশ করে। এরপরে, আমাদের কাছে একটি 'আকার' আর্গুমেন্ট আছে যাতে নমুনা করা উপাদানের সংখ্যা উল্লেখ করা যায় যা '4'। অতএব, 'R_list' 'R_list' তালিকা থেকে তিনটি এলোমেলোভাবে নির্বাচিত উপাদান তৈরি করে। যেহেতু 'R_list' এর তালিকার উপাদানগুলি বিভিন্ন ধরণের, তাই 'ফলাফল' এর উপাদানগুলিও বিভিন্ন ধরণের হতে পারে।

আউটপুট নতুন তালিকা উপস্থাপন করে যা মূল তালিকার একটি এলোমেলো উপসেট ধারণ করে:

উদাহরণ 5: Prob আর্গুমেন্টের সাথে Sample() ফাংশন ব্যবহার করা

অতিরিক্তভাবে, আমাদের কাছে স্যাম্পল() ফাংশনের 'প্রব' প্যারামিটার আছে। 'সমস্যা' আর্গুমেন্টটি ভেক্টরে নির্বাচিত উপাদানটির সম্ভাব্যতা দেয়। মনে রাখবেন যে সমস্ত উপাদানের সমান সম্ভাবনা আছে বলে ধরে নেওয়া হয় যখন 'সমস্যা' আর্গুমেন্ট ব্যবহার করা হয় না।

আমার তথ্য = ( 31 , 99 , 5 , 24 , 72 )

নমুনা ( আমার তথ্য , আকার = 10 , প্রতিস্থাপন = সত্য ,

সমস্যা = ( 0.5 , খ্যাতি ( 0.1 , 4 ) ) )

এখানে, সংখ্যাসূচক ভেক্টরের উপাদানগুলিকে 'my_data' বলা হয়েছে। পরবর্তী ধাপে, আমরা স্যাম্পল() ফাংশনকে কল করি যেখানে 'my_data' এটি থেকে এলোমেলোভাবে নির্বাচিত 10টি উপাদানে পাস করা হয়। তারপর, 'আকার' আর্গুমেন্টটি সংজ্ঞায়িত করা হয় যা নির্দিষ্ট করে যে মানটি এলোমেলোভাবে নির্বাচন করার জন্য '10' আকারের হওয়া উচিত। এর পরে, আমরা 'প্রতিস্থাপন' আর্গুমেন্টে 'TRUE' বরাদ্দ করি যার অর্থ হল প্রতিটি নির্বাচিত উপাদান পরবর্তীটি নির্বাচন করার আগে ভেক্টরে প্রতিস্থাপিত হয়। স্যাম্পল() ফাংশনে সংজ্ঞায়িত তৃতীয় আর্গুমেন্ট হল 'prob' যা 'my_data' ভেক্টরের প্রতিটি এলিমেন্টের সম্ভাব্যতা নির্ধারণ করে। প্রথম উপাদানটির সম্ভাব্যতা '0.5' এ সেট করা হয়েছে। অবশিষ্ট চারটি ভেক্টর উপাদানের জন্য, সম্ভাব্যতা হল '0.1'।

নিম্নোক্ত আউটপুট প্রত্যাশিত ভেক্টরের প্রথম উপাদানের সর্বোচ্চ সম্ভাবনার সাথে পুনরুদ্ধার করা হয়েছে:

উদাহরণ 6: বারপ্লট রেন্ডার করতে Sample() ফাংশন ব্যবহার করা

সবশেষে, স্যাম্পল() ফাংশনটি একটি প্রদত্ত সম্ভাব্যতা বন্টনের সাথে একটি শ্রেণীগত পরিবর্তনশীলের বন্টন কল্পনা করতে R-এ বারপ্লট তৈরি করতে ব্যবহৃত হয়।

নমুনা তথ্য = ( 1 , 2 , 3 )

বারপ্লট ( টেবিল ( নমুনা ( নমুনা তথ্য , আকার = 500 , প্রতিস্থাপন = সত্য , সমস্যা = ( .30 , .60 , .10 ) ) ) )

এখানে, একটি পূর্ণসংখ্যা মানের ভেক্টর দিয়ে “sample_data” সংজ্ঞায়িত করার পরে, আমরা স্যাম্পল() ফাংশন স্থাপন করে বারপ্লট তৈরি করি। প্রথমত, আমরা বারপ্লটকে কল করি যা ফলাফলের নমুনার একটি ফ্রিকোয়েন্সি টেবিল তৈরি করতে table() ফাংশনকে আহ্বান করে। তারপর, আমরা টেবিল() ফাংশনের মধ্যে স্যাম্পল() ফাংশন নির্দিষ্ট করি যেখানে 1 থেকে 3 পূর্ণসংখ্যার ভেক্টর থেকে 1000 আকারের একটি এলোমেলো নমুনা আঁকা হয়। তারপর, প্রতিটি পূর্ণসংখ্যা নির্বাচনের সম্ভাব্যতা নির্দিষ্ট করতে “prob” আর্গুমেন্ট ব্যবহার করা হয় .

যেমনটি আমরা এখন দেখতে পাচ্ছি, বারপ্লটটি তিনটি বারের সাথে নিম্নোক্তভাবে রেন্ডার করা হয়েছে, প্রতিটি পূর্ণসংখ্যার জন্য একটি, এবং বারগুলির উচ্চতা নমুনায় যে পূর্ণসংখ্যাটি ঘটে তার সাথে প্রাসঙ্গিক:

উপসংহার

আমরা দেখেছি কিভাবে স্যাম্পল() ফাংশন বিভিন্ন উদাহরণ সহ কাজ করে। স্যাম্পল() ফাংশনটি বিভিন্ন আর্গুমেন্টের সাথে ব্যবহার করা হয় যেখানে নমুনা ডেটার প্রয়োজন হয় এবং অন্যান্য সমস্ত আর্গুমেন্ট ঐচ্ছিক এবং নির্দিষ্ট ক্ষেত্রে বলা হয়। যাইহোক, নমুনা() ফাংশন পরিসংখ্যানগত বিশ্লেষণে বা বড় ডেটাসেটের সাথে কাজ করার সময় উপযোগী।