با استفاده از روشی جدید، هوش مصنوعی میتوانند اشیاء و چهرههایی را تصور کند که قبلا هرگز ندیده است.
هوش مصنوعی (AI) در انجام وظایفی مثل ابداع چهرههای انسانی که وجود خارجی ندارند یا برندهشدن در بازیهای پوکر عملکرد بسیار خوبی داشته است؛ اما شبکههای هوش مصنوعی هنوز در مهمترین مهارت طبیعی انسان، یعنی تصور کردن، مشکلاتی دارند.
ازآنجاکه انسان میداند گربه چیست، بهراحتی میتواند گربهای با رنگی متفاوت یا حتی در حالت و محیطی متفاوت را درک کند. برای شبکههای هوش مصنوعی تشخیص گربه حتی با وجود دیدنش کاری دشوار است. این شبکهها فقط در صورتی که آموزش ببینند، میتواند گربه را تشخیص دهند.
پژوهشگران برای آزمایش و رمزگشایی از ظرفیت هوش مصنوعی روش تازهای را ابداع کردند. براساس این روش سیستمهای هوش مصنوعی میتوانند ظاهر شیئی را تخمین بزنند؛ حتی اگر قبلا هرگز آن را ندیده باشند. یونهائو جی، دانشمند کامپیوتر دانشگاه کالیفرنیای جنوبی (USC)، دراینباره میگوید:
تحتتأثیر قابلیتهای تعمیم بصری انسان سعی کردیم تصور و خیالپردازی را برای ماشینها شبیهسازی کنیم. انسان میتواند دانش دریافتی خود را براساس مشخصههایی مثل شکل، حالت، موقعیت و رنگ تفکیک و سپس این مشخصهها را مجددا برای تصور شئ جدید ترکیب کند. مقاله ما تلاش میکند این فرایند را با استفاده از شبکههای عصبی شبیهسازی کند.
کلید حل مسئله، برونیابی است. برونیابی بهمعنی استفاده از بانک بزرگی از دادههای آموزشی (مانند تصاویر خودرو) و سپس فرارفتن از موارد دیده شده است. این کار برای هوش مصنوعی دشوار است؛ زیرا هوش مصنوعی معمولا براساس الگوهای مشخصی آموزش میبیند تا مشخصات گسترده و تعمیمپذیر. پژوهشگران به روشی به نام «یادگیری بازنمایی تفکیک کنترلپذیر» رسیدند که رویکردش مشابه روش ساخت دیپفیکها است؛ بدینمعنی که بخشهای مختلف یک نمونه تفکیک میشوند (مانند جداسازی حرکت چهره و هویت چهره در ویدئو دیپفیک). برای مثال، اگر هوش مصنوعی خودرویی قرمز و موتوری آبی را ببیند، میتواند موتور قرمز را تصور کند؛ حتی اگر قبلا آن را ندیده باشد.
پژوهشگران این قابلیت را در چهارچوبی به نام یادگیری تحت نظارت گروهی گردآوری کردند. یکی از نوآوریهای اصلی این روش پردازش نمونهها بهصورت گروهی است. سپس روابط بین نمونهها ایجاد میشود و درادامه هوش مصنوعی شباهتها و تفاوتهایی را بین نمونههای دیدهشده تشخیص میدهد و با استفاده از این اطلاعات نمونهای کاملا جدید را تولید میکند. لاورنت ایتی، دانشمند کامپیوتر USC میگوید: «رویکرد جدید گرهزدایی اولینبار مفهومی جدید از تصور را در سیستمهای هوش مصنوعی ارائه میدهد و این سیستمها را به انسان و درک دنیای او نزدیک میکند.»
ایدههای یادشده کاملا جدید نیستند؛ اما پژوهشگران در این بررسی مفاهیم را یک قدم فراتر برده و انعطاف و سازگاری روش با انواع دادهها را افزایش دادهاند. آنها چهارچوبی متنباز ایجاد کردهاند؛ بهطوریکه دانشمندان دیگر بتوانند بهراحتی از آن استفاده کنند. سیستم توسعهیافته یادشده میتواند در آینده با حذف ویژگیهای حساس از انحرافهای هوش مصنوعی جلوگیری کند. برای مثال، اجازه نمیدهد شبکههای عصبی جنسیتزده یا نژادپرست باشند. پژوهشگران معتقدند هوش مصنوعی میتواند با تصور داروها یا سناریو جادهای جدید، روش مشابهی در حوزه پزشکی و خودروهای خودران اعمال کند.
ایتی در ادامه میافزاید: «یادگیری عمیق در بسیاری از حوزهها عملکرد موفقی از خود نشان داده و امیدبخش ظاهر شده است؛ اما این عملکرد مطلوب را مدیون تقلیدی سطحی است و به درکی عمیق از مشخصههای جداگانه هر شئ منحصربهفرد نرسیده.» پژوهش مذکور در کنفرانس بینالمللی بازنماییهای یادگیری ۲۰۲۱ ارائه شد.