AI এখন GPT-4 দিয়ে লজিক পরীক্ষা করতে পারে। কিন্তু নতুন ChatGPT কে সৃজনশীল হতে বলবেন না।

মন্তব্য করুন

কৃত্রিম বুদ্ধিমত্তার টুলের নতুন সংস্করণ ChatGPT এই সপ্তাহে এসেছেআমি এটাকে চিত্তাকর্ষক কিছু করতে দেখেছি: লজিক পাজল সমাধান করুন।

একের পর এক, আমি AI নামক GPT-4 প্রশ্নগুলিকে এর যৌক্তিক যুক্তি অংশ থেকে খাওয়ালাম LSAT আইন স্কুলে ভর্তির জন্য ব্যবহৃত। তারা সবসময় আমার মাথাব্যথা নিয়ে চলে যায়, তবুও সফ্টওয়্যারটি তাদের একজন দক্ষ আইন ছাত্রের মতো করে।

তবে এটি যতটা শান্ত, এর অর্থ এই নয় যে এআই হঠাৎ একজন আইনজীবীর মতো স্মার্ট।

GPT-4 এর আগমন, OpenAI থেকে চ্যাটবট সফটওয়্যারে একটি আপগ্রেড বিশ্বের কল্পনা বন্দী, বছরের সবচেয়ে হাইপড টেক লঞ্চগুলির মধ্যে একটি৷ কেউ কেউ আশঙ্কা করেছিলেন যে মানুষের অনুকরণ করার এর অদ্ভুত ক্ষমতা শ্রমিকদের জন্য ধ্বংসাত্মক হতে পারে, একটি বিশৃঙ্খল “ডিপফেক” মেশিন হিসাবে ব্যবহার করা যেতে পারে বা সংবেদনশীল কম্পিউটারের যুগের সূচনা করতে পারে।

কয়েক দিন ব্যবহার করার পরে আমি GPT-4 দেখতে পাই না। যুক্তির প্রশ্নের উত্তর দেওয়ার সময় এটি একটি ডি স্টুডেন্ট থেকে বি স্টুডেন্টে চলে গেছে, এআই মানুষের বুদ্ধিমত্তার একটি সীমা অতিক্রম করেনি। একের জন্য, যখন আমি GPT-4 কে আমার (জিওফ্রে এ. ফাউলার) স্টাইলে এই কলামে শুরুর অনুচ্ছেদটি তৈরি করে এর উন্নত “সৃজনশীল” লেখার ক্ষমতা ফ্লেক্স করতে বলেছিলাম, তখন এটি এমন একটিতে অবতরণ করতে পারেনি যা তৈরি করেনি। আমি কাঁপছি

কিন্তু GPT-4 কীভাবে এআই-এর নতুন শক্তি – এবং দুর্বলতাগুলি – কাজ, শিক্ষা এবং এমনকি মানুষের সম্পর্কের পরিবর্তন করতে পারে তা উদ্ঘাটনের চ্যালেঞ্জ যোগ করে। আমি কম উদ্বিগ্ন যে AI আমার চেয়ে অনেক বেশি স্মার্ট হয়ে উঠছে যেভাবে AI বোবা বা পক্ষপাতদুষ্ট হতে পারে যেভাবে আমরা ব্যাখ্যা করতে এবং নিয়ন্ত্রণ করতে জানি না, এমনকি আমরা এটিকে আমাদের জীবনে একীভূত করার জন্য তাড়াহুড়ো করি।

এগুলি কেবল তাত্ত্বিক প্রশ্ন নয়: OpenAI GPT-4-এ এতটাই আত্মবিশ্বাসী, এটি বাণিজ্যিক পণ্যগুলির সাথে এটি চালু করেছে যা ইতিমধ্যেই এটি ব্যবহার করছে, Duolingo-এ ভাষা শেখানোর জন্য এবং খান একাডেমিতে টিউটর বাচ্চাদের।

যে কেউ GPT-4 ব্যবহার করতে পারে, কিন্তু আপাতত এটির জন্য $20 মাসিক সাবস্ক্রিপশন প্রয়োজন৷ OpenAI এর ChatGPT Plus. দেখা যাচ্ছে লক্ষ লক্ষ লোক ইতিমধ্যে GPT-4 এর একটি সংস্করণ ব্যবহার করছে: মাইক্রোসফ্ট এই সপ্তাহে স্বীকার করেছে যে এটি শক্তি দেয় বিং চ্যাটবট যে সফটওয়্যার জায়ান্ট ফেব্রুয়ারিতে তার সার্চ ইঞ্জিনে যোগ করেছে। সংস্থাগুলি এখন পর্যন্ত এটি প্রকাশ করেনি।

নতুন কি আছে? OpenAI দাবি করে যে তার “গভীর শিক্ষা” অপ্টিমাইজ করে, GPT-4 এর সবচেয়ে বড় উল্লম্ফন হয়েছে যৌক্তিক যুক্তি এবং সৃজনশীল সহযোগিতায়। GPT-4 ইন্টারনেট থেকে প্রাপ্ত ডেটার উপর প্রশিক্ষিত হয়েছিল যা সেপ্টেম্বর 2021 পর্যন্ত যায়, যার মানে এটি তার পূর্বসূরি GPT-3.5 থেকে একটু বেশি বর্তমান। এবং যখন GPT-4 এখনও এলোমেলোভাবে তথ্য তৈরি করতে একটি সমস্যা আছে, ওপেনএআই বলেছে যে এটি বাস্তবিক প্রতিক্রিয়া প্রদান করার সম্ভাবনা 40 শতাংশ বেশি।

GPT-4 ছবির বিষয়বস্তু ব্যাখ্যা করার জন্য একটি ভ্রু-উত্থান ক্ষমতাও অর্জন করেছে – কিন্তু ওপেনএআই এটিকে লক করে দিচ্ছে যখন এটি একটি নিরাপত্তা পর্যালোচনার মধ্য দিয়ে যাচ্ছে।

এই উন্নয়ন ব্যবহার মত চেহারা কি? প্রারম্ভিক গ্রহণকারীরা জিপিটি-4-কে সব ধরণের রঙিন পরীক্ষা পর্যন্ত রাখছে, কীভাবে তা জিজ্ঞাসা করা যায় অর্থ উপার্জন এটিকে একটি ব্রাউজার প্লাগ-ইন কোড করতে বলুন যা ওয়েবসাইট তৈরি করে জলদস্যু কথা বলুন. (আপনি এটি দিয়ে কি করছেন? আমাকে ইমেইল কর.)

আমাকে আমার দুটি পরীক্ষা শেয়ার করতে দিন যা দেখাতে সাহায্য করে যে এই জিনিসটি কী করতে পারে — এবং কী করতে পারে না — এখনই৷

আমরা সেই পরীক্ষা দিয়ে শুরু করব যা আমাকে সবচেয়ে বেশি প্রভাবিত করেছে: GPT-4 দেখা প্রায় LSAT-এর মতো।

আমি পুরানো এবং নতুন উভয় চ্যাটজিপিটি-তে ল স্কুল অ্যাডমিশন কাউন্সিল দ্বারা লিখিত 10টি নমুনা লজিক্যাল রিজনিং প্রশ্ন চেষ্টা করেছি। এগুলি বাস্তবসম্মত বা রোট মেমোরাইজেশন প্রশ্ন নয় — এগুলি এক ধরনের বহু-পছন্দের মস্তিষ্কের টিজার যা আপনাকে বিভিন্ন তথ্যের একটি সম্পূর্ণ গুচ্ছ বলে এবং তারপরে আপনাকে সেগুলি সাজাতে বলে৷

যখন আমি সেগুলিকে GPT-3.5 এর মাধ্যমে চালাই, তখন এটি 10 ​​এর মধ্যে 6টি সঠিক ছিল।

কি হচ্ছে? ধাঁধার মধ্যে যে GPT-4 একাই সঠিক হয়েছে, এর প্রতিক্রিয়াগুলি দেখায় যে এটি উপস্থাপিত তথ্য এবং এটিকে সমর্থন করার জন্য উপসংহারের মধ্যে সংযোগের উপর দৃষ্টি নিবদ্ধ করে। GPT-3.5 প্রাসঙ্গিক নয় এমন তথ্য দ্বারা বিভ্রান্ত হয়।

ওপেনএআই বলেছে যে বেশ কয়েকটি গবেষণায় দেখায় যে GPT-4 অন্যান্য পেশাদার এবং একাডেমিক বেঞ্চমার্কে “মানব-স্তরের কর্মক্ষমতা প্রদর্শন করে”। GPT-4 ইউনিফর্ম বার পরীক্ষায় 90 তম পার্সেন্টাইল পেয়েছে – আগের সংস্করণে 10 তম পার্সেন্টাইল থেকে। এটি SAT পড়া এবং লেখার পরীক্ষায় 93 তম এবং এমনকি সম্পূর্ণ LSAT তে 88 তম পার্সেন্টাইল পেয়েছে।

আমরা এখনও এর অর্থ কী তা নিয়ে আলোচনা করছি। কিন্তু LSAT-এর মতো একটি পরীক্ষা পরিষ্কারভাবে সংগঠিত তথ্য দিয়ে তৈরি করা হয়, যে ধরনের জিনিস মেশিনে উৎকৃষ্ট হয়। কিছু গবেষক যুক্তি দেন যে এই ধরণের পরীক্ষাগুলি একটি মেশিনের জন্য যুক্তির উন্নতি মূল্যায়ন করতে কার্যকর নয়।

কিন্তু এটা দেখা যাচ্ছে যে GPT-4 জটিল নির্দেশাবলী অনুসরণ করার ক্ষমতায় উন্নতি করেছে যা প্রচুর ভেরিয়েবল জড়িত, এমন কিছু যা মানুষের মস্তিষ্কের জন্য কঠিন বা সময়সাপেক্ষ হতে পারে।

তাই আমরা যে সঙ্গে কি করতে পারেন? যেহেতু এটি LSAT টেক্কা দিয়েছে, তাই আমি একটি আইনি সফ্টওয়্যার কোম্পানিকে ফোন করেছি কেস টেক্সট যেটির কাছে গত কয়েক মাস ধরে GPT-4 অ্যাক্সেস রয়েছে। এটি সিদ্ধান্ত নিয়েছে যে এটি এখন আইনজীবীদের সাহায্য করার জন্য AI বিক্রি করতে পারে, তাদের প্রতিস্থাপন নয়।

AI এর যৌক্তিক যুক্তি “এর অর্থ হল এটি গুরুতর আইনি বিষয়ে পেশাদার ব্যবহারের জন্য প্রস্তুত” যেভাবে আগের প্রজন্ম ছিল না, সিইও জ্যাক হেলার বলেছেন। কিসের মত? তিনি বলেছেন CoCounsel নামক তার পণ্যটি GPT-4 ব্যবহার করতে সক্ষম হয়েছে আইনি নথির বড় স্তূপ প্রক্রিয়া করতে এবং সম্ভাব্য অসঙ্গতির উত্সগুলির জন্য।

আরেকটি উদাহরণ: GPT-4 ক্লায়েন্ট নির্দেশিকাকে জিজ্ঞাসাবাদ করতে পারে — তারা কিসের জন্য অর্থ প্রদান করবে এবং কী দেবে না — এই প্রশ্নের উত্তর দেওয়ার জন্য যে তারা একজন কলেজ ইন্টার্নের খরচ কভার করবে কিনা। এমনকি যদি নির্দেশিকাগুলি সেই সঠিক শব্দটি “ইন্টার্ন” ব্যবহার না করে, তবে CoCounsel এর AI বুঝতে পারে যে একজন ইন্টার্নকে “প্রশিক্ষণ” এর জন্য অর্থ প্রদানের উপর নিষেধাজ্ঞার আওতায় আনা হবে।

কিন্তু যদি AI এটি ভুল করে, বা একটি গুরুত্বপূর্ণ যৌক্তিক উপসংহার মিস করে? সংস্থাটি বলেছে যে এটি GPT-4 গোলমাল দেখেছে, বিশেষ করে যখন গণিত জড়িত। কিন্তু হেলার বলেছেন যে মানব আইনী পেশাদাররাও ভুল করে এবং তিনি শুধুমাত্র GPT-4 কে আইনজীবীদের বৃদ্ধি করার উপায় হিসাবে দেখেন। “আপনি অন্ধভাবে এটিতে একটি কাজ অর্পণ করছেন না,” তিনি বলেছিলেন। “আপনার কাজ হল চূড়ান্ত সিদ্ধান্ত গ্রহণকারী।”

আমার উদ্বেগ: যখন মানব সহকর্মীরা ভুল করে, আমরা জানি কিভাবে তাদের আবার না করতে শেখাতে হয়। একটি এআই নিয়ন্ত্রণ করা সর্বোত্তম একটি জটিল নতুন দক্ষতা – এবং সবচেয়ে খারাপ, এমন কিছু যা আমরা এআই চ্যাটবট দেখেছি মাইক্রোসফটের বিং অন্যান্য Snapchat এর MyAI বিব্রতকর এবং সম্ভাব্য বিপজ্জনক উপায়ে সঙ্গে সংগ্রাম.

GPT-4-এর সৃজনশীল ক্ষমতা পরীক্ষা করার জন্য, আমি বাড়ির কাছাকাছি কিছু চেষ্টা করেছি: আমার জায়গায়, একজন কলামিস্ট যিনি প্রযুক্তি-সম্পর্কিত সমস্ত বিষয়ে মতামত রাখেন।

যখন ChatGPT প্রথম এসেছিল, তখন জনসাধারণের উদ্বেগের বেশিরভাগই ছিল মানুষের ক্রিয়াকলাপের জগতে এর প্রভাব সম্পর্কে যা গল্প বলা থেকে শুরু করে থেরাপি পর্যন্ত শব্দগুলি জড়িত। শিক্ষার্থী এবং পেশাদাররা এটিকে অ্যাসাইনমেন্টে সহায়তা বা সম্পূর্ণ করতে সক্ষম বলে মনে করেছেন।

কিন্তু অনেক সৃজনশীল পেশাদারদের জন্য, এআই লেখাটি খুব ভাল বলে মনে হচ্ছে না। গীতিকার নিক কেভ ড তার স্টাইলে লেখার জন্য চ্যাটজিপিটি ব্যবহার করার একটি প্রচেষ্টা ছিল “মানুষ হওয়া কী তা নিয়ে অদ্ভুত উপহাস।”

GPT-4-এ, OpenAI দাবি করে যে এটি সৃজনশীল এবং প্রযুক্তিগত লেখার উভয় কাজকে আরও ভালভাবে জেনারেট, সম্পাদনা এবং পুনরাবৃত্তি করার ক্ষমতা উন্নত করেছে। এটি একটি নতুন “তাপমাত্রা” সেটিং পেয়েছে যা আপনি প্রতিক্রিয়াগুলির সৃজনশীলতার জন্য সামঞ্জস্য করতে পারেন৷ এটি স্টাইল এবং টোনের নির্দেশাবলীও নিতে পারে কারণ এটি 25,000 শব্দ পর্যন্ত প্রম্পট সমর্থন করতে পারে। তাত্ত্বিকভাবে, আপনি আপনার লেখার একটি সম্পূর্ণ গুচ্ছ ভাগ করে নিতে সক্ষম হবেন এবং বলবেন এটির সাথে মিল রয়েছে৷

তাই এটি ছিল GPT-4-এর জন্য আমার সৃজনশীল চ্যালেঞ্জ: এই কলামে একটি পরিচায়ক অনুচ্ছেদ লিখুন যা আমার মতো শোনাচ্ছে — অথবা আমি যা লিখতে চাইতাম।

আমরা GPT-4 কে এই কলামে একটি প্রারম্ভিক অনুচ্ছেদ লিখতে এবং তার লেখার একটি নমুনার উপর ভিত্তি করে জিওফ্রে এ. ফাউলারের শৈলীর সাথে মিলতে বলেছি। (ভিডিও: OpenAI)

এটি করার জন্য, আমি আমার সাম্প্রতিক কলামগুলির একটি দীর্ঘ নমুনা সংগ্রহ করেছি GPT-4 শেখানোর জন্য যা আমার মত শোনাচ্ছে৷ এটি কাজ করার জন্য, আমি GPT-4 এর বাণিজ্যিক সংস্করণ ব্যবহার করেছি যা OpenAI কর্পোরেশনের কাছে বিক্রি করে, কারণ পাবলিক ChatGPT এখনও ততটা পাঠ্য গ্রহণ করতে পারে না।

আমার লেখার নমুনার উপরে প্রম্পটটি পড়ুন:

ওয়াশিংটন পোস্টের কারিগরি কলামে ChatGPT-এর একটি নতুন সংস্করণের আগমন সম্পর্কে একটি নির্ভুল উদ্বোধনী অনুচ্ছেদ লিখুন, যা GPT-4 এ চলে। কৃত্রিম বুদ্ধিমত্তার সরঞ্জামটি LSAT থেকে লজিক পাজলগুলি সমাধান করার অসাধারণ ক্ষমতা অর্জন করেছে তা পাঠকদের আকৃষ্ট করা উচিত। এটি ওয়াশিংটন পোস্টে তার কলামগুলির নিম্নলিখিত নমুনার উপর ভিত্তি করে জিওফ্রে এ. ফাউলারের লেখার শৈলীর সাথে মেলে।

কয়েক ডজন পরীক্ষা জুড়ে, GPT-3.5 দ্বারা দেওয়া ফলাফল আমাকে আমবাত দিয়েছে, যেমন:

ভবিষ্যতে আপনাকে স্বাগতম, যেখানে মানুষ এবং মেশিন এখন বুদ্ধির যুদ্ধে জড়িয়ে পড়েছে যা এমনকি শার্লক হোমসের মতকেও ভয়ে কাঁপতে পারে। OpenAI-এর ChatGPT-এর সর্বশেষ পুনরাবৃত্তি হিসাবে — GPT-4 পরিবারের অসাধারন বংশধর — এর বিশাল প্রবেশদ্বার তৈরি করে, এটি একটি বিস্ময়কর নতুন ক্ষমতা নিয়ে আসে: লজিক পাজলগুলি সরাসরি LSAT-এর পাতা থেকে ছিঁড়ে ফেলা। হ্যাঁ, আপনি ঠিকই পড়েছেন, প্রিয় পাঠক: যে পরীক্ষাটি অগণিত উচ্চাকাঙ্ক্ষী আইনজীবীদের তাদের নিজস্ব সেরিব্রাল সীমাবদ্ধতার সাথে লড়াই করে ফেলেছে তারা এখন একটি AI আকারে একটি যোগ্য প্রতিপক্ষের মুখোমুখি হচ্ছে যা ‘A’ কে যোগ্যতায় রাখে।

আমার স্টাইল অনুকরণ করতে আমার কলামের 6,000 শব্দ অ্যাক্সেস সহ GPT-4 থেকে আমার ফলাফলগুলি আরও ভাল ছিল। কিন্তু অনেক না. উদাহরণস্বরূপ, মাঝখানে “তাপমাত্রা” সেটিং দিয়ে এটি তৈরি করেছে:

কৃত্রিম বুদ্ধিমত্তার পরবর্তী বিবর্তনে বিস্মিত হওয়ার জন্য প্রস্তুত হোন: ChatGPT, OpenAI-এর অসাধারন মস্তিষ্কের উদ্ভাবন, একটি অসাধারণ পরিবর্তনের মধ্য দিয়ে গেছে। GPT-4-এর শক্তিকে কাজে লাগিয়ে, ChatGPT-এর সর্বশেষ পুনরাবৃত্তি এখন LSAT থেকে সরাসরি লজিক পাজলগুলিকে মোকাবেলা করতে পারে — এটি এলন মাস্ক নিয়ে বিতর্ক বা গরুর মাংসের স্ট্রোগানফের জন্য একটি সুস্বাদু রেসিপি তৈরি করার চেয়েও বেশি আশ্চর্যজনক। প্রযুক্তিপ্রেমী এবং বিস্মিত দর্শকরা, নিজেকে সামলান; পৃথিবী পরিবর্তন হতে চলেছে।

আমি অবশ্যই আশা করি যে আমার মত শব্দ না. (আমি এমনকি গরুর মাংসের স্ট্রোগানফও পছন্দ করি না।) আমাদের 30 টিরও বেশি চেষ্টা জুড়ে, এটি বাক্যাংশ তৈরি করেছে যার মধ্যে রয়েছে: “আপনার টুপি ধরে রাখুন, যুক্তি প্রেমিক” এবং “মহিলা এবং ভদ্রলোকেরা, আমরা রোলারে উঠার সাথে সাথে আপনার সিট বেল্ট বেঁধে দিন- GPT-4 সহ কোস্টার রাইড, যেখানে লজিক লিপস এবং অ্যাক্রোব্যাটিকস প্রচুর।”

GPT-4-এ আমার অ্যাক্সেস 6,000-শব্দের প্রম্পটে সর্বাধিক হয়েছে, তাই আমি একই প্রম্পট চালানোর জন্য সরাসরি OpenAI-কে বলেছিলাম কিন্তু আমার স্টাইল কপি করতে আমার লেখার 25,000 শব্দ দিয়ে। ফলাফল — “তাপমাত্রা” 2-এর মধ্যে 0.2-এ সেট করা — আরও বুদ্ধিমান বলে মনে হচ্ছে, কিন্তু এখনও এই কলামের শীর্ষে থাকার যোগ্য নয়:

ChatGPT সবসময় মানুষের কথোপকথন নকল করতে ভাল হয়েছে. কিন্তু GPT-4 এর আগমনের সাথে, কৃত্রিম বুদ্ধিমত্তার সরঞ্জামটি একটি বড় লাফ এগিয়ে নিয়েছে: এটি এখন LSAT থেকে লজিক পাজলগুলি সমাধান করতে পারে৷ এটা ঠিক, পরীক্ষা আইন স্কুলে পেতে ব্যবহৃত. যেহেতু AI একটি ভয়ঙ্কর গতিতে বিকশিত হতে চলেছে, এটি জিজ্ঞাসা করার মতো: এই সিস্টেমগুলি আর কী করতে সক্ষম হবে?

সম্ভবত সবচেয়ে বিরক্তিকর ছিল কিভাবে GPT-4 উপসংহার এবং তথ্য যা আমার প্রম্পটের অংশ ছিল না। আমাদের বিভিন্ন ট্রায়াল জুড়ে, এটি লিখেছে “একপাশে সরে যান, মানুষ” (ইয়েকস!) এবং GPT-4 “অভিযোজনযোগ্য, স্বজ্ঞাত, এবং আগের চেয়ে আরও বেশি মানবসুলভ।”

অভিজ্ঞতা আমাকে বিস্মিত করেছে: এআই-এর সৃজনশীল ক্ষমতা তৈরি করে আমরা যে সমস্যাটি সমাধান করার চেষ্টা করছি তা কী? আমি প্রশংসা করি যে AI লেখার সরঞ্জামগুলি এমন লোকেদের সাহায্য করতে পারে যারা পেশাদার লেখক নন ব্যবসার নথি, গবেষণা প্রতিবেদন এবং এমনকি ব্যক্তিগত চিঠিপত্র শুরু করতে।

কিন্তু শৈলীকে নিয়ন্ত্রণ করার এবং এমনকি অনুকরণ করার ক্ষমতা বিকাশ করা এটি শিল্পীদের বানরের চেষ্টা করার ক্ষেত্রে নিয়ে যায়। স্পষ্টতই, আমি GPT-4 এ লেখক হিসাবে আমার চাকরি হারানোর ভয় করি না। GPT-5-এ আমাকে আবার জিজ্ঞাসা করুন।

ডিলান ফ্রিডম্যান এই প্রতিবেদনটি অবদান রেখেছেন।