ارتقای کیفیت شناسایی تصاویر برای نابینایان در فیسبوک و اینستاگرام

پنج سالی از اضافه شدن فناوری شناسایی تصاویر به پست های فیسبوک می گذرد. قابلیتی که به طور خاص برای نابینایان طراحی شده است و کارش این است که عکس هایی را که کاربران در صفحات شخصی شان به اشتراک می گذارند، با چند کلمه ساده توصیف می کند. اما این قابلیت چیست و از کجا می آید؟

فیسبوک در سال ۲۰۱۶ توانست با استفاده از فناوری بینایی ماشین و تلفیق آن با هوش مصنوعی، برای عکس هایی که کاربران به اشتراک می گذارند، متنِ جایگزینِ خودکار اضافه کند. (AAT)، نام فناوری تازه ای بود که فیسبوک در آن زمان به پلتفرم خود اضافه کرد. برای روشن تر شدن ماجرا بهتر است اول ببینیم «متن جایگزین عکس» دقیقاً چیست؟ فرض کنید وب سایتی را اداره می کنید و قصد دارید یک عکس را در آن با مخاطبانتان به اشتراک بگذارید. از طرفی برایتان مهم است که کاربران اینترنت با جستجو در گوگل هم بتوانند عکسی را که به اشتراک می گذارید پیدا کنند. در این صورت چطور می توانید محتوای عکس را برای گوگل مشخص کنید؟ چاره کار در استفاده از «متن جایگزین تصویر» است. متنی که در صفحه نمایش داده نمی شود اما موتور های جستجو نظیر گوگل می توانند آن را بخوانند. استفاده از «متن جایگزین تصویر» علاوه بر بهینه سازی عکس ها برای گوگل، یک کاربرد دیگر هم دارد و آن این است که صفحه نمایش می توانند آن را بخوانند و به این ترتیب، کاربر نابینا هم می تواند به کمک متنی که صاحب عکس نوشته از جزئیات عکس مطلع شود.

در سال های اخیر شاهد بودیم که توییتر امکان نوشتن «متن جایگزین عکس» را در اختیار کاربران قرار داده است؛ اما تعداد کاربرانی که از این امکان استفاده می کنند و عکس هایشان را برای کاربران نابینا توضیح دار می کنند بسیار اندک است و عملاً می توان گفت این قابلیت کمک چندانی به کاربران نابینا نکرده است. فیسبوک هم دقیقاً به همین علت، از مختار کردن کاربرانش برای نوشتن «متن جایگزین عکس» صرف نظر کرده و به جای سپردن این وظیفه به خودِ کاربران، آن را به عهده فناوری «بینایی ماشینی» و «هوش مصنوعی» گذاشته است. این فناوری سه سال پیش در اینستاگرام هم تعبیه شده است. حالا فیسبوک جزئیات تازه ای منتشر کرده که نشان از پیشرفت کیفیِ چشمگیر در این قابلیت دارد.

فیسبوک خبر می دهد از ۲۰۱۶ تاکنون تعداد اشیایی که می تواند در عکس ها شناسایی کند، به ۱۲۰۰ شیء رسیده است. این یعنی ده برابر شدنِ اشیای قابل شناسایی در طول پنج سال. این شرکت همچنین گزارش داده حالا می تواند علاوه بر اشیا، حالت ها، رفتار ها یا برخی شرایط محیطی را هم شناسایی کند. به عنوان مثال حالا فیسبوک می تواند تشخیص دهد کاربری در حال لبخند زدن است یا اخم کرده یا دستش را به سمتی دراز کرده است. فیسبوک همچنین می تواند مکان و چگونگی قرارگیری اشیا در یک عکس را هم به کاربر گزارش دهد؛ مثلاً حالا کاربر با جملاتی مثل این مواجه می شود که «پنج نفر در تصویر هستند که دو نفرشان در مرکز عکس و سه تا در حاشیه های عکس دیده می شوند.» فیسبوک وعده داده به زودی امکانات و قابلیت های بیشتری هم به این سرویس خواهد افزود. درصورتی که فیسبوک بتواند محتوای عکسی را شناسایی کند، کاربران اندرید می توانند با فشار طولانی بر روی عکس، جزئیات آن را بشنوند.

منبع: ایران سپید.

دیدگاهتان را بنویسید لغو پاسخ