گوگل اطلاعاتی را درباره یک مدل هوش مصنوعی به اشتراک گذاشته که اولین گام مهم برای حرکت در مسیر دستیابی به این هدف بزرگ است.
گوگل در پست جدیدی در وبلاگ خود اطلاعاتی را درباره مدل گفتار جهانی (USM) به اشتراک گذاشته که درواقع خانوادهای از پیشرفتهترین مدلهای گفتاری با بیش از ۲ میلیارد پارامتر است. این مدل با ۱۲ میلیون ساعت داده گفتاری و ۲۸ میلیارد جمله از ۳۰۰ زبان آموزش داده شده و فعلاً میتواند ۱۰۰ زبان را متوجه شود.
مدل گفتار جهانی که یوتوب هم برای تولید زیرنویس از آن استفاده میکند، از فناوری تشخیص گفتار خودکار (ASR) بهره میبرد. این فناوری قادر است زبانهایی مثل انگلیسی، ماندارین، امهری، سبوانو، آسامی و … را شناسایی و ترجمه کند.
مدل USM بهعنوان زیربنایی برای ساخت یک سیستم گستردهتر استفاده خواهد شد که هدف نهایی گوگل است. در گزارشها پیشبینی شده که این شرکت در کنفرانس توسعهدهندگان آتی خود از ۲۰ محصول با هوش مصنوعی پرده بردارد و این مدل هم میتواند بخشی از این محصولات جدید باشد.
بااینحال، یکی از مقاصد احتمالی برای استفاده از مدلهای زبانی به حوزه عینکهای واقعیت افزوده مربوط میشود. این شرکت در رویداد I/O قبلی خود دمویی از یک عینک هوشمند را به نمایش گذاشت که قادر بود بهصورت آنی حرفهای طرف مقابل را به زبان قابلفهم برای کاربر ترجمه کند.
البته از آن زمان تاکنون خبر دیگری در این رابطه منتشر نشده است و بهنظر میرسد که هنوز فاصله زیادی تا عرضه این ویژگی در دنیای واقعی داشته باشیم. گفتنی است که متا هم روی ابزارهای مشابهی برای ترجمه با هوش مصنوعی کار میکند که هنوز در مراحل اولیه توسعه قرار دارند.