خداحافظ فتوشاپ؟ گوگل با هوش مصنوعی جدیدش امکان ویرایش تصاویر را فقط با یک درخواست فراهم می نماید

به گزارش زندگی در ترکیه، هوش مصنوعی در حال تغییر چهره ویرایش تصاویر است. حالا دیگر نیازی نیست ساعت ها با ابزارهای پیچیده فتوشاپ کار کنید. گوگل با جمینای 2.0 فلش (Gemini 2.0 Flash)، قابلیت جدیدی معرفی نموده که به کاربران اجازه می دهد فقط با نوشتن یک درخواست، تصاویر را به دلخواه خود ویرایش نمایند.

خداحافظ فتوشاپ؟ گوگل با هوش مصنوعی جدیدش امکان ویرایش تصاویر را فقط با یک درخواست فراهم می نماید

این مدل، یک گام فراتر از مدل های متنی معمولی است و خروجی چندرسانه ای (Multimodal Output) ارائه می دهد، یعنی می تواند همزمان متن، تصویر و حتی محتوای تعاملی فراوری کند. برای مثال، می توان با یاری آن، بازی های گرافیکی یا داستان هایی با تصاویر هماهنگ ایجاد کرد، به طوری که کاراکترها و محیط در چندین تصویر ثابت بمانند.

ویرایش تصویر از زاویه های مختلف: یک تجربه نو

یکی از ویژگی های شگفت انگیز این مدل، امکان مشاهده تصاویر از زوایای دیگر است. در یک آزمایش، این مدل تصویری را که به آن داده شده بود، از زاویه ای متفاوت بازسازی کرد! چنین قابلیتی نه تنها برای ویرایش تصویر، بلکه برای طراحی سه بعدی، فیلم سازی و حتی واقعیت مجازی کاربرد دارد.

تبدیل متن به تصویر: قدمی رو به جلو، اما هنوز نه عالی

یکی از چالش های قدیمی مدل های هوش مصنوعی، درج متن درون تصاویر (In-image Text Rendering) است. گوگل ادعا می نماید که مدل نوش عملکرد بهتری نسبت به رقبای دیگر دارد. اما طبق آنالیز های اولیه، نتیجه ها هنوز به کیفیت ایده آل نرسیده اند.

آینده ای نزدیک به هولودک!

این دستاورد، نوید آینده ای را می دهد که در آن، هوش مصنوعی قادر خواهد بود هر نوع محتوایی را در لحظه فراوری کند؛ از متن و تصویر گرفته تا صدا، ویدیو، گرافیک سه بعدی و حتی اشیای فیزیکی قابل چاپ با پرینتر سه بعدی (3D Printing). به زبان ساده، چیزی شبیه هولودک (Holodeck) در مجموعه علمی تخیلی پیشتازان فضا (Star Trek)، البته بدون توانایی تکثیر ماده.

چالش ها و محدودیت ها: هنوز در ابتدای راهیم

گوگل تأکید می نماید که این مدل هنوز در مرحله اولیه است. برخلاف مدل های حجیم تر، این نسخه کوچک تر برای اجرای سریع تر و مقرون به صرفه تر طراحی شده است. به همین علت، تمام اینترنت را در خود جای نداده و اطلاعات تصویری اش هنوز محدود است. داده های آموزشی این مدل ترکیبی از اطلاعات عمومی و داده های مصنوعی هدفمند (Targeted Synthetic Data) است که برای بهبود کیفیت فراوریات آن استفاده شده اند.

البته با پیشرفت روش های آموزش مدل های هوش مصنوعی و کاهش هزینه های پردازشی، انتظار می رود که این فناوری خیلی سریع رشد کند. همان طور که مدل های تصویری مثل استیبل دیفیوژن (Stable Diffusion) و میدجِرنی (Midjourney) در مدت کوتاهی جهش بزرگی داشتند، مدل های چندرسانه ای مانند جمینای 2.0 فلش هم می توانند در آینده ای نزدیک، کیفیتی حیرت انگیز پیدا نمایند.

دنیای که در آن، واقعیت و تخیل یکی می شوند

تحقیقات در این حوزه نشان می دهند که ما در آستانه تحولی بزرگ در رسانه های دیجیتال هستیم. زمانی نه چندان دور، هر فرد می تواند با چند کلمه، دنیا هایی نو خلق کند، تصاویری از هیچ بسازد، داستان هایی با تصاویر هماهنگ فراوری کند و دنیای دیجیتال را با تخیلش شکل دهد.

حالا سوال اینجاست: آیا این شروع سرانجام روش های سنتی طراحی و ویرایش تصویر است؟ آیا به زودی احتیاج به فتوشاپ و ابزارهای مشابه از بین می رود؟ شاید نه به این زودی، اما یک چیز قطعی است: آینده گرافیک دیجیتال، دیگر هرگز مانند گذشته نخواهد بود.

منبع: arstechnica

منبع: یک پزشک
انتشار: 28 اسفند 1403 بروزرسانی: 28 اسفند 1403 گردآورنده: mylifeturkey.com شناسه مطلب: 92

به "خداحافظ فتوشاپ؟ گوگل با هوش مصنوعی جدیدش امکان ویرایش تصاویر را فقط با یک درخواست فراهم می نماید" امتیاز دهید

امتیاز دهید:

دیدگاه های مرتبط با "خداحافظ فتوشاپ؟ گوگل با هوش مصنوعی جدیدش امکان ویرایش تصاویر را فقط با یک درخواست فراهم می نماید"

* نظرتان را در مورد این مقاله با ما درمیان بگذارید