ভিজ্যুয়ালজিপিটি কী - আপনার যা জানা দরকার

Bhijyuyalajipiti Ki Apanara Ya Jana Darakara



মাইক্রোসফটের ভিজুয়ালজিপিটি একটি নতুন প্রযুক্তি প্রকাশ করেছে ' ভিজ্যুয়ালজিপিটি 'এটি এআই-এর একটি অগ্রগতি এবং ভিজ্যুয়াল এবং ভাষার মধ্যে ব্যবধান পূরণ করে আরও আকর্ষণীয়, এবং ইন্টারেক্টিভ এআই অভিজ্ঞতার জন্য সম্ভাবনা উন্মোচন করে৷

VisualGPT কি?

VisualGPT হল ChatGPT-এর একটি বর্ধিত সংস্করণ যা NLP (Natural Language Processing) মডেলের উপর ভিত্তি করে, কিন্তু VisualGPT-এ VFMS ব্যবহার করা হয় যা টেক্সট কোয়েরিকে ইমেজ ফর্মে রূপান্তর করতে পারে। এটি এমন যে এটি পাঠ্য এবং চিত্রের প্রশ্নের সংমিশ্রণ/একত্রীকরণ।







VisualGPT এর উদ্দেশ্য

বাজারে চ্যাটজিপিটি প্রকাশের পর যেটি কেবলমাত্র পাঠ্য বিন্যাসে কাজ করছিল, পরবর্তী স্তরের অগ্রগতি অর্জনের জন্য একটি নিখুঁত সরঞ্জাম রয়েছে যা পাঠ্য থেকে গ্রাফিকাল বিন্যাসে কাজ করবে, এই সমস্ত কারণগুলি অনুসরণ করে এবং এআইয়ের দৌড়ে অগ্রগতি মাইক্রোসফ্ট ভিজ্যুয়ালজিপিটি প্রকাশ করেছে ভিজ্যুয়ালজিপিটির মূল উদ্দেশ্য হল ব্যবহারকারীর চাহিদার ভিত্তিতে এআই চিত্র তৈরি করা বা চিত্রটি বিশ্লেষণ করা



ভিজ্যুয়ালজিপিটির আর্কিটেকচার

ভিজুয়ালজিপিটি ব্যবহারকারীর ক্যোয়ারী, প্রম্পট ম্যানেজার, ভিজ্যুয়াল ফাউন্ডেশন মডেল (ভিএফএম), সিস্টেমের নীতি, সংলাপের ইতিহাস, যুক্তির ইতিহাস এবং মধ্যবর্তী উত্তর রয়েছে।



যদি আমরা বিশেষভাবে এর মডেল সম্পর্কে কথা বলি যেমন, “ ভিএফএম (ভিজ্যুয়াল ফাউন্ডেশন মডেল) ”, প্রায় 22টি VFM ব্যবহার করা হয়, যেমন BLIP (বুটস্ট্র্যাপিং ল্যাঙ্গুয়েজ-ইমেজ প্রি-ট্রেনিং), এবং স্থিতিশীল ডিফিউশন।





কিভাবে একটি ভিজ্যুয়াল চ্যাটজিপিটি চালাবেন?

একটি ভিজ্যুয়াল চ্যাটজিপিটি চালানোর জন্য, নিম্নলিখিত পদক্ষেপগুলি বিবেচনা করুন:

ধাপ 1: একটি পরিবেশ তৈরি করুন

প্রথমত, আপনাকে পাইথন সংস্করণ 3.8 এর একটি পরিবেশ তৈরি করতে হবে:



আমদানি sys

sys.path.append ( '/usr/local/lib/python3.8/site-packages' )

ধাপ 2: ভিজ্যুয়াল চ্যাটজিপিটি ফাইল ক্লোন করুন

এখন, নিম্নলিখিত কমান্ডটি ব্যবহার করে GitHub থেকে ভিজ্যুয়াল ChatGPT ফাইলটি ক্লোন করুন:

! git ক্লোন https: // github.com / deepanshu88 / visual-chatgpt.git

ধাপ 3: একটি নতুন ডিরেক্টরি সেটআপ করুন

এর পরে, নীচে বর্ণিত কমান্ডের মাধ্যমে একটি নতুন ডিরেক্টরি সেট আপ করুন:

% সিডি visual-chatgpt

ধাপ 4: প্রয়োজনীয় প্যাকেজ ইনস্টল করুন

এখন, ' ব্যবহার করে প্রয়োজনীয় প্যাকেজগুলি ইনস্টল করুন পিপ 'cmdlet:

! কার্ল https: // bootstrap.pypa.io / get-pip.py -ও get-pip.py

! python3.8 get-pip.py

! python3.8 -মি পিপ ইনস্টল -আর requirements.txt

ধাপ 5: OpenAI API অ্যাক্সেস করুন

প্রাথমিক প্যাকেজগুলি ইনস্টল করার পরে, “platform.openai.com” থেকে একটি API কী পেয়ে এবং প্রমাণীকৃত API কল করে OpenAI API অ্যাক্সেস করুন:

% env OPENAI_API_KEY =sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

ধাপ 6: মডেল নির্বাচন করুন

সবশেষে, Openai অ্যাক্সেস করার পর মডেল চয়ন করুন, ভিজ্যুয়ালজিপিটিতে 20টিরও বেশি মডেল ব্যবহার করা হয় যা আপনি আপনার প্রয়োজন অনুযায়ী বেছে নিতে পারেন:

! পাইথন3.8। / visual_chatgpt.py --বোঝা Text2Image_cuda: 0

উপরের কমান্ডে, ' Text2 Image ” ব্যবহার করা মডেলের সাথে মিলে যায়। আরও বিস্তারিত জানার জন্য এই Google Colab দেখুন নোটবই .

উপসংহার

যেকোন প্রশ্নের সুনির্দিষ্ট উত্তর পেতে চ্যাটজিপিটি চালু করা হয়েছিল এবং এখন মাইক্রোসফ্ট ভিজুয়ালজিপিটি চালু করেছে যা পাঠ্যের পাশাপাশি সচিত্র ডেটার সাথে মোকাবিলা করতে সক্ষম। এটি এমন যে ব্যবহারকারী কেবল তার প্রয়োজনীয়তা পাঠ্য আকারে যোগ করতে পারে এবং এর গ্রাফিকাল আউটপুট পেতে পারে।