هوش مصنوعی DALL-E 2 چیست و چگونه میتوان با آن کار کرد؟
دیگر مانعی برای خلاقیت نیست، هر ایدهای را میتوانیم زنده کنیم!
تصورش را بکنید که خودمان قادر باشیم هر محتوای تصویریای را خلق کنیم یا هر ایدهای را روی کاغذ بیاوریم؛ هرچقدر عجیبوغریب، غیرواقعی و محال. اصلاً ممکن است به جزئیات چیزی که میخواهیم واقف نباشیم و فقط طرحی کلی از آن در پس ذهنمان نقش بسته باشد؛ اما فقط با یک توصیف ساده از آن، تصاویری با تمام جزئیات و در زاویههای مختلف، پیش روی ما قرار گیرند.
این دقیقاً کاری است که هوش مصنوعی DALL-E 2 انجام میدهد: «زندهکردن ایدهها».
اما این سیستم چیست؟ چگونه کار میکند؟ چرا تحولی بزرگ در حوزۀ خلق محتوا و بازاریابی محتوایی به حساب میآید؟ و چرا عدهای آن را برای بشر خطرناک میدانند؟ در این مطلب از ویپدیا به تمام این سؤالات پاسخ میدهیم.
هوش مصنوعی DALL-E 2 چیست؟
DALL-E 2، یک سیستم هوش مصنوعی است که میتواند هر متنی را به تصاویر هنری تبدیل کند. مهم نیست که متن ما حاوی یک مفهوم ساده یا پیچیده، یک سبک، اسم خاص یا ارتباطات عجیبوغریب باشد، این سیستم بهخوبی آن را درک میکند و به تصویر میکشد. در ژانویۀ ۲۰۲۱، شرکت تحقیقاتی OpenAI که درزمینۀ هوش مصنوعی فعالیت میکند، از سیستمی با نام DALL-E رونمایی کرد. نام آن، از ترکیب اسمهای سالوادور دالی (Salvador Dalí) که نقاش فراواقعگرای اسپانیایی بود و انیمیشن علمی-تخیلی WALL-E پیکسار گرفته شده بود.
DALL-E نوعی شبکۀ عصبی و سیستم محاسباتی محسوب میشود که روی نورونهای متصل به یک مغز بیولوژیکی مدل شده است. این سیستم هوشمند را طوری آموزش دادهاند که توضیحات متنی و رابطۀ بین عناصر را درک کند و بتواند ترکیبهای مختلفی از الگوهای تصویری بسازد.
نسخۀ اول این هوش آموزشدیده متنها را به تصویر تبدیل میکرد، اما عملکردی بسیار ضعیف داشت. یک سال بعد، در آوریل ۲۰۲۲، نسخۀ دوم آن یعنی DALL-E 2 با قدرت و قابلیتهایی بهتر ارائه شد. این ورژن از AI سرعت پردازش بالاتر و دقت بیشتری در کار دارد. همچنین، تصاویر را با کیفیت فوقالعاده بالا و ۴ برابر بهتر از ورژن قبلی خود عرضه میکند.
این سیستم بهطرز هوشمندانهای تمامی موجودات، اشیا و عناصر موجود در متن ما را تشخیص میدهد و ارتباط بین آنها را میفهمد. وقتی در آن مینویسیم: «کوآلایی که دوچرخهسواری میکند»، او بهسرعت اجزا و مفاهیم کوآلا، دوچرخه، فیگور روی دوچرخه یا کلاه ایمنی را به هم ربط میدهد. سپس تصویرش را همانطور که باید، خلق میکند. در اثر نهایی، نکات و جزئیات ریزی مثل سایه، بافت، بازتاب نور یا زاویۀ عناصر هم از توجه و ذرهبین او دور نمیماند.
نمونهکارهایی از هوش مصنوعی دالی
در صفحۀ اینستاگرام DALL-E 2، میتوانیم نمونهکارهایی از آن را ببینیم:
- ظرف سوپی که شبیه یک هیولای پشمی است؛
- کلمبروکلیای که از وضعیت بد آبوهوا خسته شده است؛
- دایناسورهایی که به مهدکودک میروند؛
- تصاویر ماکرو از چالهای ریز در خیابان بزرگراه یا بافت یک توپ؛
- نقاشی کوبیسم از نگهبان یک قلعه؛
- و کلی چیزهای نادر و شگفتانگیز دیگر.
۵ قابلیت دیگر سیستم هوشمند DALL-E 2
همانطور که گفته شد، هوش مصنوعی دالی به افکار انسانها تصویر، بعد و زندگی میبخشد؛ درنتیجه ما را در معرفی خلاقانۀ تواناییها و پیادهسازی ایدههایمان توانمند میسازد. با این ابزار، دیگر به تخصص خاصی نیاز نیست و میتوانیم هر محتوای بصری دلخواهی را برای تبلیغات، بازاریابی محتوایی، صفحات شبکههای اجتماعی یا دیگر رسانههای آنلاین و آفلاین خود تولید کنیم.
کارایی این سیستم فقط به تصویرسازی از متنها ختم نمیشود و قابلیتهای پیشرفتۀ دیگری را هم در اختیارمان میگذارد. با استفاده از آنها، حسابی دستمان برای بازی با ایدهها و رسیدن به اثری که میخواهیم باز خواهد بود. برخی از این ویژگیها به اینصورت هستند:
- برای هر متنی که دریافت میکند چند تصویر جایگزینِ مختلف میسازد.
- امکان روتوش یا ویرایش تصاویر دریافتی را داریم.
- میتوان تصویری را به دلخواه در آن بارگذاری کرد، سپس از سیستم خواست که از این تصویر الهام بگیرد و ورژنها و حالات مختلف از آن را به ما ارائه دهد.
- قابلیت In-Painting را در دست خواهیم داشت. با این ویژگی قادر خواهیم بود که فقط بخش یا بخشهایی از یک تصویر را ویرایش کنیم، عناصری را حذف یا به آن اضافه کنیم یا به اجزای اثر، بافت، سایه یا بازتاب نور بدهیم.
- تصاویر خود را در زوایای مختلف دریافت کنیم؛ تصویر افراد از جهتهای مختلف یا مبلمانمان در زاویههای متفاوت و در گوشههای مختلف خانه.
چگونه از هوش مصنوعی DALL-E 2 استفاده کنیم؟
برای استفاده از این هوش مصنوعی و ترفندهای تولید تصویر آن میتوان طبق این مراحل پیش رفت:
- وارد سایت OpenAI شویم و یک حساب کاربری ایجاد کنیم. ساخت آن رایگان و راحت است و فقط به یک شمارهموبایل یا ایمیل نیاز دارد. بااینحال، سختترین بخش کار برای ما ایرانیان به حساب میآید؛ چون شمارۀ ایران را نمیپذیرد و بهشدت در تشخیص آیپی کشور حساس و دقیق عمل میکند.
با تکمیل ثبتنام، در پنجرهای جداگانه dall-e چیست و راهنمای استفاده از آن نشان داده میشود و برای شروع کار آن را رد میکنیم.
نکتۀ مهم این است که کاربران جدید (کسانی که برای اولین بار ثبتنام میکنند) در ماه اول میتوانند تا ۵۰ بار بهصورت رایگان از DALL-E 2 درخواست تولید تصویر داشته باشند. پس از آن هم ماهیانه ۱۵ اعتبار رایگان خواهیم داشت، اما برای اعتبارهای اضافی باید حق اشتراک پرداخت کرد. در حال حاضر با ۱۵ دلار مجوز ۱۱۵ درخواست برای کاربران صادر میشود.
- در صفحۀ اصلی این ابزار، برای تصویرسازی ایدهها چند گزینۀ مختلف پیش رویمان قرار میگیرد:
- باکسی که در آن با حداکثر ۴۰۰ کاراکتر شرح چیزی را که در نظر داریم مینویسیم و بعد بر آیکون Generate کلیک میکنیم تا سیستم تصویر آن را خلق کند؛
- گزینهای برای آپلود فایل وجود دارد که با استفاده از آن تصویر دلخواه خود را در آن بارگذاری و سیستم براساس دستورالعمل ما آن را ویرایش میکند؛
- میتوان گزینۀ Surprise me را انتخاب کرد که در این صورت هوش مصنوعی بهطور خودکار و طبق سلیقۀ خود، محتوای جدید را تولید میکند.
آیا قوانین محدودکنندهای در استفاده از هوش مصنوعی DALL-E 2 وجود دارد؟
تنها خطمشی و محدودیت فعلی OpenAI در هنگام خلق تصاویر این است که نباید تصاویر خشونتآمیز، نژادپرستانه و سیاسی تولید شود. برای نظارت بر رعایت آن هم فیلترها و سیستمهای نظارتی خودکار و انسانی در نظر گرفته است. ضمناً این سیستم به کاربران اجازۀ بازی با چهرۀ شخصیتهای واقعی و شناختهشده را نمیدهد؛ البته فقط اشخاص مطرحی مثل رهبران و رؤسای جمهور کشورها.
اگر درخواست ما شامل هیچیک از موارد بالا نباشد، محتوای آن توسط DALL-E 2 ساخته میشود. اگر تصویر دریافتی مورد پسندمان نبود میتوانیم به عقب برگردیم و عبارت توصیفی یا دستورالعمل خود را تغییر دهیم. همچنین میتوانیم تصویری را انتخاب و Variations را بزنیم تا این بار محتوای خروجی، با الهام از آن باشد.
حواسمان باشد که انتخابهای رایگان محدودی داریم و بحث صرفهجویی در هزینه هم مطرح است. باید درخواستهای خود را کوتاه، دقیق و مؤثر بنویسیم؛ بهخصوص اگر نما، زاویه، فاصله، نور و تکنیک عکاسی خاصی را در نظر داریم، در شرح بیاوریم.
مزایا و معایب هوش مصنوعی DALL-E 2
هوش مصنوعی DALL-E 2 بهمنظور توانمندسازی انسانها، کمک به رشد خلاقیتشان و هلدادن کسبوکارها به پلههای بالاتر ساخته شده است. این تکنولوژی، تحولی عظیم در حوزۀ تولید محتوای بصری ایجاد کرده که همینالان هم شاهد تأثیر و تغییرات حاصل از آن هستیم.
میتوان با استفاده از آن برای برند و کسبوکار خود لوگو طراحی کرد. همچنین میتوانیم تصاویر شخصیسازیشده و جذابتر از محصولاتمان تولید کنیم، بنرهای تبلیغاتی بسازیم و برای صفحات اجتماعی، سایت یا بلاگ خود تصاویر و عکسهای مناسب خلق کنیم. با اینکه این ابزار رایگان نیست اما به باکیفیتترشدن و خلاقانهترشدن محتواهایمان کمک زیادی میکند.
باوجوداین، هیچکس حتی خود این شرکت هم معایب و خطرات ناشی از این هوش مصنوعی را انکار نمیکند. این سیستم بهتنهایی در ایجاد محتوا موفق نیست و باید در توضیح و توصیف چیزی که میخواهیم مهارت کسب کنیم. تصاویری که تولید میشوند برمبنای منابع موجود در پایگاه دادۀ آن است و اگر متوجه نشویم، ممکن است جعل و کپی از اثر اصلی تلقی شود. هرچند هنوز قانون مشخصی برای آن وجود ندارد، اما ممکن است گرفتار عواقب حقوقی آن شویم.
با این شرایط، راه برای بسیاری از سوگیریها، جعلها و سوءاستفادهها باز است و از این به بعد، بهوفور شاهد تولید محتواهای دروغین، دیپفیک، نقض شدید قوانین کپیرایت و ازبینرفتن قدرت تشخیص آثار اصلی و جعلی خواهیم بود. در این بین، هنوز تکلیف نیروهای انسانی بازار کار مشخص نیست. تعداد بسیار زیادی از جایگاههای شغلی فعلی در حال نابودی هستند و برخی شرکتها تعدیل نیروهای خود را شروع کردهاند. ضمن اینکه قرار است از این سیستم (که مفاهیم و ارتباطات را درک میکند) برای ساخت رباتهای هوشمند استفاده کنند؛ رباتهایی که مثل انسان، پیچیده فکر کنند و از عهدۀ وظایف سخت غیرخطی هم برآیند.
آینده به کدام سو میرود؟
هوش مصنوعی DALL-E 2 فرصتهای خلاقانۀ بیشماری را در اختیارمان میگذارد و منبع الهام خوبی برای همه به حساب میآید. اما سیستم کاملی نیست و اثرات مخربی را هم در زندگی و حرفۀ ما انسانها به بار آورده و میآورد. شاید از پسِ بهتصویرکشیدهشدن ایدههایی که هیچوقت به زبان نیامده یا دیده نشدهاند، شاخههای جدیدی در علم پدیدار شود و در پی آن هم نیازها و سمتوسوی جدیدی در بازار کار به وجود آید. پیشبینی شما دراینباره چیست؟ خوشحال میشویم نظرات خود را با ما در میان بگذارید.
سؤالات متداول
هوش مصنوعی DALL-E 2 چیست؟
هوش مصنوعی DALL-E 2 نوعی ماشین یادگیرنده است که توسط شرکت OpenAIطراحی شده و میتواند هر متن یا دادهای را که به آن میدهیم، با کیفیت و جزئیات فوقالعاده به تصویر تبدیل کند.
آیا استفاده از هوش مصنوعی DALL-E 2 رایگان است؟
کاربران در بدو ورود به تعداد ۵۰ درخواست، اعتبار رایگان دریافت میکنند و بعد از آن هم هر شخص ۱۵ اعتبار در ماه خواهد داشت. اما برای درخواستهای بیشتر لازم است حق اشتراک به شرکت OpanAI بپردازند.
آیا همه میتوانند از هوش مصنوعی DALL-E 2 استفاده کنند؟
بله، این سیستم در حال حاضر در اختیار همه قرار دارد و برای استفاده از آن کافی است در سایت OpenAI حساب کاربری بسازیم.