AI ইমেজার মিডজার্নি v5 ফটোরিয়ালিস্টিক ইমেজ-এবং 5-আঙ্গুলের হাত দিয়ে স্তব্ধ করে

এআই ইমেজ জেনারেটর মিডজার্নি v5-এ আলো এবং ত্বকের প্রভাবের উদাহরণ।
বড় করা / এআই ইমেজ জেনারেটর মিডজার্নি v5-এ আলো এবং ত্বকের প্রভাবের উদাহরণ।

বুধবার, মিডজার্নি ঘোষণা এর বাণিজ্যিক AI ইমেজ সংশ্লেষণ পরিষেবার সংস্করণ 5, যা কিছু AI শিল্প অনুরাগীরা যে মানের স্তরে ফটোরিয়ালিস্টিক ছবি তৈরি করতে পারে ভয়ঙ্কর এবং “খুব নিখুঁতমিডজার্নি v5 এখন এমন গ্রাহকদের জন্য একটি আলফা পরীক্ষা হিসাবে উপলব্ধ যারা মিডজার্নি পরিষেবাতে সদস্যতা নিয়েছেন, যা ডিসকর্ডের মাধ্যমে উপলব্ধ।

গ্রাফিক ডিজাইনার জুলি উইল্যান্ড বলেন, “MJ v5 বর্তমানে আমার কাছে মনে হচ্ছে যে, কিছুক্ষণের জন্য খারাপ দৃষ্টি উপেক্ষা করার পর অবশেষে চশমা পেয়েছি।” প্রায়ই শেয়ার করে টুইটারে তার মিডজার্নি সৃষ্টি। “হঠাৎ আপনি 4k তে সবকিছু দেখতে পান, এটি অদ্ভুতভাবে অপ্রতিরোধ্য কিন্তু আশ্চর্যজনকও মনে হয়।”

Wieland তার কিছু মিডজার্নি v5 জেনারেশন Ars Technica এর সাথে শেয়ার করেছেন (নীচে একটি গ্যালারিতে এবং উপরের প্রধান ছবিতে দেখা গেছে), এবং তারা অবশ্যই চিত্রের বিস্তারিতভাবে একটি অগ্রগতি দেখায় যেহেতু মিডজার্নি মার্চ 2022-এ প্রথম এসেছিল। সংস্করণ 3 আগস্টে আত্মপ্রকাশ করেছে এবং সংস্করণ 4 নভেম্বরে আত্মপ্রকাশ করেছে. প্রতিটি পুনরাবৃত্তি উত্পন্ন ফলাফলে আরও বিশদ যুক্ত করেছে, যেমন আমাদের পরীক্ষাগুলি দেখায়:

প্রম্পটের সাথে মিডজার্নি v3 (বাম), v4 (মাঝে), এবং v5 (ডান) থেকে আউটপুটের মধ্যে একটি তুলনা
বড় করা / মিডজার্নি v3 (বাম), v4 (মাঝে), এবং v5 (ডান) থেকে আউটপুটের মধ্যে একটি তুলনা “একটি পেশীবহুল বর্বর যার সাথে একটি CRT টেলিভিশন সেট, সিনেমাটিক, 8K, স্টুডিও লাইটিং এর পাশে অস্ত্র রয়েছে।”

আরস টেকনিকা

মিডজার্নি ইমেজ সিন্থেসাইজারের মতো একইভাবে কাজ করে স্থিতিশীল বিস্তার অন্যান্য DALL-E এতে এটি প্রশিক্ষিত একটি AI মডেল ব্যবহার করে “প্রম্পট” নামক পাঠ্য বর্ণনার উপর ভিত্তি করে চিত্র তৈরি করে লক্ষ লক্ষ কাজ মানুষের তৈরি শিল্পের। সম্প্রতি, মিডজার্নি একটি হৃদয় ছিল কপিরাইট বিতর্ক একটি কমিক বই সম্পর্কে যা পরিষেবার পূর্ববর্তী সংস্করণগুলি ব্যবহার করে৷

একদিনের জন্য v5 নিয়ে পরীক্ষা করার পর, Wieland উন্নতির কথা উল্লেখ করেছেন যার মধ্যে “অবিশ্বাস্যভাবে বাস্তবসম্মত” ত্বকের গঠন এবং মুখের বৈশিষ্ট্য রয়েছে; আরো বাস্তবসম্মত বা সিনেমাটিক আলো; আরও ভাল প্রতিফলন, দীপ্তি এবং ছায়া; একটি দৃশ্যের আরও অভিব্যক্তিপূর্ণ কোণ বা ওভারভিউ, এবং “চোখ যা প্রায় নিখুঁত এবং এখন আর অস্বস্তিকর নয়।”

এবং, অবশ্যই, হাত।

গত এক বছরে, এআই আর্ট জেনারেটরগুলি সঠিকভাবে হাত দিতে পারে না এমন ধারণাটি একটি বিষয় হয়ে উঠেছে সাংস্কৃতিক ট্রপ. উল্লেখযোগ্যভাবে, Midjourney v5 বাস্তবসম্মত মানুষের হাত মোটামুটি ভালোভাবে তৈরি করতে পারে। “হাত বেশির ভাগ সময় সঠিক থাকে, এক হাতে 7-10টির পরিবর্তে 5টি আঙ্গুল দিয়ে,” উইল্যান্ড বলেন।

পরিষেবার ডিসকর্ড রিলিজ নোটগুলিতে, মিডজার্নি আরও উল্লেখ করেছে যে v5 এখন সংস্করণ 4 এর তুলনায় “অনেক বিস্তৃত শৈলীগত পরিসর” সহ সাড়া দেয়, পাশাপাশি প্রম্পট করার জন্য আরও সংবেদনশীল, কম অবাঞ্ছিত পাঠ্য তৈরি করা এবং চিত্র রেজোলিউশনে 2x বৃদ্ধির প্রস্তাব দেয়।

যদি এআই শিল্প অনুরাগীদের জন্য মিডজার্নি আপগ্রেডের একটি ভিজ্যুয়াল নেতিবাচক দিক থাকে, তবে এটি সম্ভবত এমন চিত্রগুলি থেকে আসে যা এতটাই বাস্তবসম্মত এবং “নিখুঁত” হতে পারে যে মডেলটির নির্ভুলতা একটি উপযুক্ত ফলাফল খুঁজে পেতে বারবার এআই চিত্র তৈরি করার কিছু রোমাঞ্চ কেড়ে নেয়, কী? কেউ একটি “স্লট মেশিন প্রভাব” বলতে পারে। যদিও ফিলিপ লেন্সেন নামে এক টুইটার ব্যবহারকারী উল্লেখ্য“যদি আপনার মনে একটি নির্দিষ্ট চিত্রের বিষয় থাকে, তবে এটি এখনও কিছুটা লটারির মতো। তবে v4 এর চেয়ে বেশি জেতার সম্ভাবনা রয়েছে।”