عینک هوشمند Envision با ChatGPT به کمک نابینایان می آید

کانال تلگرامی «هوشیو» از افزایش توانایی‌های عینک هوشمند با استفاده از ChatGPT گزارش داد. بخش‌هایی از این گزارش در ادامه از نظر می‌گذرد: En ision دستیار بینایی ChatGPT AI را، به عینک هوشمند خود برای نابینایان اضافه می‌کند. این شرکت اکنون با افزودن یک دستیار بینایی با قابلیت پردازش و پاسخ دهی به دستورات صوتی، محصول خود را ارتقا بخشیده است. این عینک جدید در حال‌حاضر، توسط پیشرفته‌ترین هوش مصنوعی ساخته شده تاکنون یعنی ChatGPT پشتیبانی می‌شود.

در نوامبر ۲۰۲۲، OpenAI شرکت پشتیبان ChatGPT، از ابزار پردازش زبان طبیعی مولد هوش مصنوعی خود که قادر به حفظ مکالمات انسان مانند با یک چت‌بات است، رونمایی کرد. با به روزرسانی اخیری که در ماه مارس منتشر شد، این فناوری توسط متخصصان این صنعت، به عنوان یک گام بزرگ رو به جلو در توسعه هوش مصنوعی (که افراد عادی می‌توانند از آن استفاده کنند) مورد تحسین قرار گرفت. ChatGPT در حال‌حاضر توسط غول فناوری مایکروسافت، در محصولات این شرکت ادغام گردیده است.

شرکت En ision مستقر در هلند، از عینک‌های Google Glass در بخش سخت‌افزاری خود استفاده می‌کند. این شرکت از زمان عرضه در سال ۲۰۲۰، از دوربین عینک‌های خود برای ضبط متن‌های مندرج در اسناد یا بسته‌بندی‌ها استفاده می‌کند، تا امکان خواندن این متون با صدای بلند را برای کاربران‌اش فراهم آورد.

آخرین به  روزرسانی ChatGPT که با استفاده از یک API اختصاصی در اوایل ماه جاری معرفی شد، این فناوری کمکی را برای افراد کم‌بینا به سطوحی که قبلاً دیده نشده بود، ارتقا داد. عینک جدید با فعال کردن جنبه‌هایی از تفسیر اسناد، دقیقاً مشابه آنچه افراد بینا می‌توانند به طور معمول مشاهده نمایند، پیشرفت بزرگی را برای افراد دارای اختلالات بینایی رقم زد.

یک ارتقا قابل توجه در دستیار‌های بینایی

قبل از این ویژگی کاملاً جدید به نام Ask En ision، کاربرانی که مایل به استخراج اطلاعات متنی کلیدی مانند بدهی قبض آب و برق یا دستورالعمل‌های پخت‌و‌پز بودند، به اجبار باید از عینک خود برای اسکن و خواندن همه موارد درج شده در متن قبض‌ها یا دستور‌های پخت استفاده می‌کردند. این موضوع به‌معنای اتلاف وقت برای بررسی اطلاعات اضافی، به‌منظور رسیدن به جزئیات کلیدی بود.

در حال حاضر با قابلیت Ask En ision، کاربران می‌توانند به‌سادگی با استفاده از دوربین روی عینک هوشمند، از یک سند متنی عکس بگیرند و سپس با استفاده از صدای خود، از ChatGPT سؤالات مستقیم بپرسند. این پرسش‌ها می‌توانند مواردی از این قبیل باشند، «چقدر بابت این قبض بدهکارم؟» یا «گزینه‌های گیاهخواری در این منو کدامند؟» در عرض چند ثانیه، Ask En ision پاسخ‌های دقیقی را از طریق خروجی گفتار به کاربر ارائه می‌دهد.

از آنجایی که ChatGPT ۴، روی مجموعه داده‌های گسترده‌ای از اینترنت و تعاملات انسانی آموزش دیده، این نرم‌افزار هم با پشتیبانی ChatGPT به سطح بالایی از آگاهی زمینه‌ای تجهیز گردیده است. به این معنی که می‌تواند وظایف پیچیده‌ای مانند خلاصه کردن اسناد طولانی یا پیشنهاد مسیر براساس نگاه کاربر به نقشه حمل‌و‌نقل عمومی را انجام دهد.

سایر وظایف مهمی که این دستیار مجازی پیشگام می‌تواند بر آن‌ها مسلط شود عبارتند از، تعیین دقیق داده‌های ضروری از نمودار‌ها در محل کار، ارائه ترجمه تقریباً فوری اسناد و بسته‌بندی‌ها به زبان خارجی و تفسیر دستورالعمل‌های مونتاژ. این دستیار حتی می‌تواند بفهمد مردم چه می گویند و در صورت درخواست قادر است فوراً یک آهنگ به سبک هر هنرمندی که انتخاب شده، با استفاده از عبارات موجود در منوی رستوران یا بروشور‌های شرکتی بسازد! این نشان می‌دهد که این محصول یک دستیار شخصی واقعاً هوشمند و خلاق است که می‌تواند انواع کار‌های جالب را انجام دهد.

با تمامی این اوصاف، زیبایی واقعی Ask En ision در سادگی محض رابط کاربری آن نهفته است. به رغم به کارگیری پیچیده‌ترین فناوری قابل‌تصور در این عینک، رابط کاربری آن به قدری ساده است که می‌توانید با صدای بلند سؤالات روزمره‌تان را از آن بپرسید و با آن صحبت کنید، طوری که انگار در حال انجام یک مکالمه معمولی هستید.

افق‌های جدید پیش‌روی Ask En ision

مرحله بعدی ارتقا Ask En ision که برخی از جنبه‌های آن در حال حاضر در مرحله آزمایش بتا هستند، تمرکز بیشتری بر توانایی ChatGPT برای شناسایی تصاویر، اشیاء و صحنه‌های زنده خواهد داشت و نه صرفاً اطلاعات نوشتاری. این ویژگی‌های جدید به این عینک اجازه می‌دهد تا کار‌های بیشتری مانند؛ شناسایی حالات چهره یا تشخیص اشیاء مختلف را انجام دهد.

منبع: روزنامه جوان

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

16 + 13 =

لطفا پاسخ عبارت امنیتی را در کادر بنویسید. *