স্বয়ংক্রিয় কৌশলগুলি এআই বিকাশ করা সহজ করে তুলতে পারে

বাহরামি বলেছেন, “BERT-এর কয়েক মাস গণনা লাগে এবং এটি অত্যন্ত ব্যয়বহুল-এক মিলিয়ন ডলারের মতো সেই মডেল তৈরি করতে এবং সেই প্রক্রিয়াগুলি পুনরাবৃত্তি করতে৷ “সুতরাং সবাই যদি একই জিনিস করতে চায়, তবে এটি ব্যয়বহুল – এটি শক্তি সাশ্রয়ী নয়, বিশ্বের জন্য ভাল নয়।”

যদিও ক্ষেত্রটি প্রতিশ্রুতি দেখায়, গবেষকরা এখনও অটোএমএল কৌশলগুলিকে আরও গণনাগতভাবে দক্ষ করার উপায়গুলি অনুসন্ধান করছেন। উদাহরণস্বরূপ, নিউরাল আর্কিটেকচার অনুসন্ধানের মতো পদ্ধতিগুলি বর্তমানে সেরা ফিট খুঁজে পেতে বিভিন্ন মডেল তৈরি এবং পরীক্ষা করে এবং এই সমস্ত পুনরাবৃত্তিগুলি সম্পূর্ণ করতে যে শক্তি লাগে তা উল্লেখযোগ্য হতে পারে।

অটোএমএল কৌশলগুলি মেশিন-লার্নিং অ্যালগরিদমগুলিতেও প্রয়োগ করা যেতে পারে যা নিউরাল নেটওয়ার্কগুলিকে জড়িত করে না, যেমন র্যান্ডম ডিসিশন ফরেস্ট তৈরি করা বা ডেটা শ্রেণীবদ্ধ করার জন্য সমর্থন-ভেক্টর মেশিন তৈরি করা। যারা তাদের প্রকল্পে অটোএমএল কৌশলগুলিকে অন্তর্ভুক্ত করতে চান তাদের জন্য ইতিমধ্যেই উপলব্ধ অনেক কোডিং লাইব্রেরি সহ এই অঞ্চলগুলিতে গবেষণা আরও রয়েছে।

পরবর্তী ধাপ হল অটোএমএল ব্যবহার করে অনিশ্চয়তা পরিমাপ করা এবং অ্যালগরিদমগুলিতে বিশ্বস্ততা এবং ন্যায্যতার প্রশ্নগুলি সমাধান করা, হুটার বলেছেন, একজন সম্মেলন সংগঠক৷ সেই দৃষ্টিভঙ্গিতে, বিশ্বস্ততা এবং ন্যায্যতার চারপাশের মানগুলি নির্ভুলতার মতো অন্য কোনও মেশিন-লার্নিং সীমাবদ্ধতার অনুরূপ হবে। এবং autoML ক্যাপচার করতে পারে এবং স্বয়ংক্রিয়ভাবে সেই অ্যালগরিদমগুলিতে পাওয়া পক্ষপাতগুলি মুক্তি পাওয়ার আগে সংশোধন করতে পারে।

অনুসন্ধান চলতে থাকে

কিন্তু গভীর শিক্ষার মতো কিছুর জন্য, অটোএমএল-এর এখনও অনেক দূর যেতে হবে। চিত্র, নথি এবং রেকর্ড করা বক্তব্যের মতো গভীর-শিক্ষার মডেলগুলিকে প্রশিক্ষণের জন্য ব্যবহৃত ডেটা সাধারণত ঘন এবং জটিল হয়। এটি পরিচালনা করার জন্য প্রচুর গণনা শক্তি লাগে। এই মডেলগুলির প্রশিক্ষণের জন্য ব্যয় এবং সময় গভীর-পকেটযুক্ত প্রাইভেট কোম্পানিগুলিতে কাজ করা গবেষকদের ব্যতীত অন্য কারও জন্য নিষিদ্ধ হতে পারে।

সম্মেলনের একটি প্রতিযোগিতা অংশগ্রহণকারীদের নিউরাল আর্কিটেকচার অনুসন্ধানের জন্য শক্তি-দক্ষ বিকল্প অ্যালগরিদম বিকাশ করতে বলে। এটি একটি যথেষ্ট চ্যালেঞ্জ কারণ এই কৌশলটির কুখ্যাত গণনাগত চাহিদা রয়েছে। এটি স্বয়ংক্রিয়ভাবে অগণিত গভীর-শিক্ষার মডেলের মাধ্যমে চক্রাকারে ঘুরে বেড়ায় যাতে গবেষকরা তাদের আবেদনের জন্য সঠিকটি বেছে নিতে পারেন, তবে প্রক্রিয়াটি কয়েক মাস সময় নিতে পারে এবং এক মিলিয়ন ডলারের বেশি খরচ হতে পারে।

এই বিকল্প অ্যালগরিদমগুলির লক্ষ্য, যাকে শূন্য-খরচ নিউরাল আর্কিটেকচার সার্চ প্রক্সি বলা হয়, তা হল গণনার ক্ষুধাকে উল্লেখযোগ্যভাবে হ্রাস করে নিউরাল আর্কিটেকচার অনুসন্ধানকে আরও অ্যাক্সেসযোগ্য এবং পরিবেশ বান্ধব করা। ফলাফলটি চালানোর জন্য কয়েক সেকেন্ড সময় নেয়, মাসের পরিবর্তে। এই কৌশলগুলি এখনও বিকাশের প্রাথমিক পর্যায়ে রয়েছে এবং প্রায়শই অবিশ্বস্ত হয়, কিন্তু মেশিন-লার্নিং গবেষকরা ভবিষ্যদ্বাণী করেন যে তাদের মডেল নির্বাচন প্রক্রিয়াটিকে আরও দক্ষ করে তোলার সম্ভাবনা রয়েছে।