সেলেনিয়াম দিয়ে কিভাবে বর্তমান ইউআরএল পাবেন

How Get Current Url With Selenium



সেলেনিয়াম ব্রাউজার টেস্টিং, ওয়েব অটোমেশন এবং ওয়েব স্ক্র্যাপিংয়ের জন্য একটি হাতিয়ার। আপনার সেলেনিয়াম প্রকল্পগুলিতে কাজ করার সময়, আপনার সেলেনিয়াম নিয়ন্ত্রিত ওয়েব ব্রাউজার যে পৃষ্ঠার প্রদর্শন করছে সেই পৃষ্ঠার URL জানতে হবে। এই তথ্যটি ইউআরএল -এর ট্র্যাক রাখার জন্য উপযোগী হতে পারে যেখান থেকে আপনি কিছু ডেটা বের করেছেন যাতে আপনি কিছু স্ক্রিপ্ট ব্যবহার করে স্বয়ংক্রিয়ভাবে ডেটা আপডেট করতে পারেন।

এই নিবন্ধে, আমি আপনাকে দেখাবো কিভাবে সেলেনিয়ামের সাথে ব্রাউজারের বর্তমান URL পেতে হয়। চল শুরু করা যাক.







পূর্বশর্ত:

এই নিবন্ধের কমান্ড এবং উদাহরণগুলি চেষ্টা করার জন্য, আপনার অবশ্যই থাকতে হবে,



1) আপনার কম্পিউটারে একটি লিনাক্স বিতরণ (বিশেষত উবুন্টু) ইনস্টল করা আছে।
2) আপনার কম্পিউটারে পাইথন 3 ইনস্টল করা আছে।
3) আপনার কম্পিউটারে PIP 3 ইনস্টল করা আছে।
4) পাইথন virtualenv আপনার কম্পিউটারে ইনস্টল করা প্যাকেজ।
5) আপনার কম্পিউটারে মোজিলা ফায়ারফক্স বা গুগল ক্রোম ওয়েব ব্রাউজার ইনস্টল করা আছে।
6) ফায়ারফক্স গেকো ড্রাইভার বা ক্রোম ওয়েব ড্রাইভার কিভাবে ইনস্টল করতে হবে তা অবশ্যই জানতে হবে।



প্রয়োজনীয়তা 4, 5 এবং 6 পূরণের জন্য, দয়া করে আমার নিবন্ধটি পড়ুন পাইথন 3 দিয়ে সেলেনিয়ামের পরিচিতি Linuxhint.com এ।





আপনি অন্যান্য বিষয়ে অনেক নিবন্ধ খুঁজে পেতে পারেন LinuxHint.com । আপনার কোন সহায়তার প্রয়োজন হলে সেগুলি পরীক্ষা করে দেখুন।

একটি প্রকল্প ডিরেক্টরি সেট আপ:

সবকিছু সংগঠিত রাখতে, একটি নতুন প্রকল্প ডিরেক্টরি তৈরি করুন সেলেনিয়াম- url/ নিম্নরূপ:



$mkdir -পিভিসেলেনিয়াম- url/ড্রাইভার

এ নেভিগেট করুন সেলেনিয়াম- url/ প্রকল্প নির্দেশিকা নিম্নরূপ:

$সিডিসেলেনিয়াম- url/

প্রকল্প ডিরেক্টরিতে একটি পাইথন ভার্চুয়াল পরিবেশ তৈরি করুন নিম্নরূপ:

$virtualenv .venv

নিম্নরূপ ভার্চুয়াল পরিবেশ সক্রিয় করুন:

$সূত্র.venv/আমি/সক্রিয় করুন

নিম্নরূপ PIP3 ব্যবহার করে আপনার ভার্চুয়াল পরিবেশে সেলেনিয়াম পাইথন লাইব্রেরি ইনস্টল করুন:

$ pip3 সেলেনিয়াম ইনস্টল করুন

সমস্ত প্রয়োজনীয় ওয়েব ড্রাইভার ডাউনলোড করুন এবং ইনস্টল করুন ড্রাইভার/ প্রকল্পের ডিরেক্টরি। আমি আমার নিবন্ধে ওয়েব ড্রাইভার ডাউনলোড এবং ইনস্টল করার প্রক্রিয়া ব্যাখ্যা করেছি পাইথন 3 দিয়ে সেলেনিয়ামের পরিচিতি । যদি আপনার কোন সাহায্যের প্রয়োজন হয়, অনুসন্ধান করুন LinuxHint.com সেই নিবন্ধের জন্য।

আমি এই নিবন্ধে প্রদর্শনের জন্য গুগল ক্রোম ওয়েব ব্রাউজার ব্যবহার করব। সুতরাং, আমি ব্যবহার করব ক্রোমড্রাইভার সেলেনিয়াম সহ বাইনারি। আপনি ব্যবহার করা উচিত গেকো ড্রাইভার বাইনারি যদি আপনি ফায়ারফক্স ওয়েব ব্রাউজার ব্যবহার করতে চান।

একটি পাইথন স্ক্রিপ্ট তৈরি করুন ex01.py আপনার প্রকল্পের ডিরেক্টরিতে এবং এতে কোডগুলির নিম্নলিখিত লাইনগুলি টাইপ করুন।

থেকেসেলেনিয়ামআমদানিওয়েবড্রাইভার
থেকেসেলেনিয়ামওয়েবড্রাইভারসাধারণচাবি আমদানিচাবি
বিকল্প=ওয়েবড্রাইভার।ChromeOptions()
বিকল্পমাথাহীন = সত্য
ব্রাউজার=ওয়েবড্রাইভার।ক্রোম(এক্সিকিউটেবল_পথ='./drivers/chromedriver',বিকল্প=বিকল্প)
ব্রাউজার।পাওয়া('https://duckduckgo.com/')
ছাপা(ব্রাউজার।current_url)
ব্রাউজার।বন্ধ()

একবার হয়ে গেলে, সংরক্ষণ করুন ex01.py পাইথন স্ক্রিপ্ট।

এখানে, লাইন 1 এবং লাইন 2 পাইথন সেলেনিয়াম লাইব্রেরি থেকে সমস্ত প্রয়োজনীয় উপাদান আমদানি করে।

লাইন 4 একটি ক্রোম অপশন অবজেক্ট তৈরি করে এবং লাইন 5 ক্রোম ওয়েব ব্রাউজারের জন্য হেডলেস মোড সক্ষম করে।

লাইন 7 একটি ক্রোম তৈরি করে ব্রাউজার বস্তু ব্যবহার করে ক্রোমড্রাইভার থেকে বাইনারি ড্রাইভার/ প্রকল্পের ডিরেক্টরি।

লাইন 9 ব্রাউজারকে duckduckgo.com ওয়েবসাইট লোড করতে বলে।

লাইন 10 ব্রাউজারের বর্তমান ইউআরএল প্রিন্ট করে। এখানে, browser.current_url ব্রাউজারের বর্তমান URL অ্যাক্সেস করার জন্য সম্পত্তি ব্যবহার করা হয়।

লাইন 12 ব্রাউজার বন্ধ করে দেয়।

পাইথন স্ক্রিপ্ট চালান ex01.py নিম্নরূপ:

$ python3 ex01।py

আপনি দেখতে পাচ্ছেন, বর্তমান URL ( https://duckduckgo.com ) কনসোলে মুদ্রিত হয়।

আগের উদাহরণে, আমি ওয়েবসাইট duckduckgo.com পরিদর্শন করেছি এবং কনসোলে বর্তমান URL মুদ্রণ করেছি। এটি আমাদের পরিদর্শন করা পৃষ্ঠার URL প্রদান করে। খুব অভিনব নয় কারণ আমরা ইতিমধ্যে পেজ ইউআরএল জানি। এখন, আসুন DuckDuckGo তে কিছু অনুসন্ধান করি এবং কনসোলে অনুসন্ধান ফলাফল পৃষ্ঠার URL মুদ্রণ করার চেষ্টা করি।

একটি পাইথন স্ক্রিপ্ট তৈরি করুন ex02.py আপনার প্রকল্পের ডিরেক্টরিতে এবং এতে কোডগুলির নিম্নলিখিত লাইনগুলি টাইপ করুন।

থেকেসেলেনিয়ামআমদানিওয়েবড্রাইভার
থেকেসেলেনিয়ামওয়েবড্রাইভারসাধারণচাবি আমদানিচাবি
বিকল্প=ওয়েবড্রাইভার।ChromeOptions()
বিকল্পমাথাহীন = সত্য
ব্রাউজার=ওয়েবড্রাইভার।ক্রোম(এক্সিকিউটেবল_পথ='./drivers/chromedriver',বিকল্প=বিকল্প)
ব্রাউজার।পাওয়া('https://duckduckgo.com/')
ছাপা(ব্রাউজার।current_url)
সার্চ ইনপুট=ব্রাউজার।find_element_by_id('search_form_input_homepage')
সার্চ ইনপুট।send_keys('সেলেনিয়াম এইচকিউ'+ কী।লিখুন)
ছাপা(ব্রাউজার।current_url)
ব্রাউজার।বন্ধ()

একবার হয়ে গেলে, সংরক্ষণ করুন ex02.py পাইথন স্ক্রিপ্ট।

এখানে, লাইন 1-10 একই হিসাবে ex01.py । সুতরাং, আমি তাদের আবার ব্যাখ্যা করছি না।

লাইন 12 সার্চ টেক্সটবক্স খুঁজে পায় এবং এটিতে সংরক্ষণ করে সার্চ ইনপুট পরিবর্তনশীল

লাইন 13 অনুসন্ধানের প্রশ্ন পাঠায় সেলেনিয়াম hq মধ্যে সার্চ ইনপুট টেক্সট বক্স এবং টিপুন কী ব্যবহার করে কেন্দ্র

একবার অনুসন্ধান পৃষ্ঠা লোড হয়, browser.current_url আপডেট করা বর্তমান ইউআরএল অ্যাক্সেস করতে ব্যবহৃত হয়।

লাইন 15 কনসোলে আপডেট করা বর্তমান ইউআরএল প্রিন্ট করে।

লাইন 17 ব্রাউজার বন্ধ করে দেয়।

চালান ex02.py পাইথন স্ক্রিপ্ট নিম্নরূপ:

$ python3 ex02।py

আপনি দেখতে পাচ্ছেন, পাইথন স্ক্রিপ্ট ex02.py 2 টি ইউআরএল প্রিন্ট করে।

প্রথমটি হল DuckDuckGo সার্চ ইঞ্জিনের হোমপেজ ইউআরএল।

দ্বিতীয়টি হল ক্যোয়ারী ব্যবহার করে DuckDuckGo সার্চ ইঞ্জিনে সার্চ করার পর আপডেট করা বর্তমান URL সেলেনিয়াম hq

উপসংহার:

এই নিবন্ধে, আমি আপনাকে দেখিয়েছি কিভাবে সেলেনিয়াম পাইথন লাইব্রেরি ব্যবহার করে ওয়েব ব্রাউজারের বর্তমান URL পেতে হয়। এখন, আপনি আপনার সেলেনিয়াম প্রকল্পগুলিকে আরো আকর্ষণীয় করে তুলতে সক্ষম হবেন।