বিজ্ঞান-প্রযুক্তি

জেমিনি AI লঞ্চ করল গুগল, চ্যাটজিপিটি-র থেকেও দক্ষতা আরও বেশি, মানুষের থেকেও বুদ্ধিমান, দাবি সংস্থার

এখন বহু সংস্থার আশা ও ভরসা আর্টিফিশিয়াল ইন্টেলিজেন্স। চোখ ধাঁধিয়ে দেওয়া সেই প্রযুক্তিকে কাজে লাগিয়ে নতুন এআই টুল জেমিনি এআই লঞ্চ করল গুগল। চ্যাটজিপিটির প্রথম বর্ষপূর্তির কিছু দিন না যেতেই বড় চমক নিয়ে হাজির হলেন সুন্দর পিচাই। সংস্থার দাবি, মানুষের থেকেও বুদ্ধিমান জেমিনি। সুন্দর পিচাই জানান, এখনও অবধি কোম্পানির সবথেকে বড় বিজ্ঞান ও ইঞ্জিনিয়ারিং কীর্তি এই জেমিনি। ৮ বছর ধরে এই প্রযুক্তি নিয়ে কাজ করছি আমরা। মানুষের থেকেও বেশি বুদ্ধিমান গুগল জেমিনি। জেমিনি বানানোর ক্ষেত্রে, গুগলের পেরেন্ট সংস্থা অ্যালফাবেটের কৃত্রিম বুদ্ধিমত্তা বিভাগ ডিপমাইন্ডের বড় অবদান রয়েছে।

তিন ধাপে কাজ করবে এই আর্টিফিশিয়াল ইন্টেলিজেন্স টুল – আল্ট্রা, প্রো এবং ন্যানো। তিন মোডে ভিন্ন দক্ষতা পাওয়া যাবে বলে জানিয়েছে সার্চ ইঞ্জিন।এআই সংক্রান্ত নানা কাজ করার জন্য আল্ট্রা মোডে লার্জ ল্যাঙ্গুয়েজ মডেল বা LLM ব্যবহার করা হবে। প্রো মোডে তুলনামূলক ছোট ল্যাঙ্গুয়েজ মডেল ব্যবহার করা হবে এবং ন্যানো মোডে থাকবে সবথেকে ছোট ল্যাঙ্গুয়েজ মডেল। এই ন্যানো মোড কম্পিউটার এবং ফোনেও চালানো যাবে।গুগল ক্লাউড এআইয়ের ভাইস প্রেসিডেন্ট জানান, এই ধরনের এআই মডেলকে সাধারণত প্রশিক্ষণ দেওয়া হয়। তারপরই সে তার দক্ষতা সামনে আনতে পারে। এই টুলকে প্রশিক্ষণ দেওয়ার জন্য গুগল তাদের বিশেষ টেনসর প্রসেসিং ইউনিট (TPU), একটি বিশেষ হার্ডওয়্যার সিস্টেম ব্যবহার করবে।পাশাপাশি থাকবে গ্রাফিক্স প্রসেসিং ইউনিটও (GPU)। জানা গিয়েছে, জিপিইউয়ের জন্য Nvidia’র বিখ্যাত H100 চিপ ব্যবহার করবে গুগল। যা মূলত জেনারেটিভ এআইয়ের জন্য তৈরি করা হয়েছে। ডেটা সেন্টার থেকে মোবাইল সবেতেই কাজ করতে পারবে জেমিনি।

জানা গিয়েছে, জেমিনি এআইয়ের ন্যানো মোড গুগল পিক্সেল 8 স্মার্টফোনে ব্যবহার করা যাবে। প্রতিদিনের বিভিন্ন টাস্ক করা যাবে এখানে। ধীরে ধীরে সার্চ, ক্রোম এবং অন্যান্য জায়গাতেও যোগ হবে জেমিনি। অন্যদিকে এটির প্রো মোড ব্যবহার করতে পারবেন ডেভেলপার এবং এন্টারপ্রাইস গ্রাহকেরা। ১৩ ডিসেম্বর থেকে এটি রোল আউট করা হবে গুগল এআই স্টুডিও এবং গুগল ক্লাউড ভারটেক্স-এ। অ্যান্ড্রয়েড ব্যবহারকারীরা AICore-এর মাধ্যমে জেমিনি ন্যানো ব্যবহার করতে পারবেন। তবে, আল্ট্রা মডেল কোন কোন ক্ষেত্রে ব্যবহার করা যাবে তা এখনও জানা যায়নি।

গুগল জানিয়েছে, জেমিনি একটি মাল্টিমডেল জেনারেটিভ এআই। অর্থাৎ ছবি, ভিডিয়ো, অডিও, ডকুমেন্ট, ইনফোগ্রাফিক, রিজনিং-সহ একাধিক বিষয় বোঝার ক্ষমতা রয়েছে জেমিনির। যদিও একই জিনিস চ্যাটজিপিটিও করতে পারে, শুধু ফারাক রয়েছে দক্ষতার। জেমিনির অডিও স্পিচ ট্রান্সলেশনের দক্ষতা ৪০.১ শতাংশ। চ্যাটজিপিটির সেখানে ২৯ শতাংশ। ইংরেজি ভিডিয়ো ক্যাপশন এবং ভিডিয়ো প্রশ্নোত্তরে জেমিনির দক্ষতা ৬২ শতাংশ এবং ৫৪ শতাংশ। সেখানে চ্যাটজিপিটির দক্ষতা ৫৬ শতাংশ এবং ৪৬ শতাংশ।