کانال تلگرامی «هوشیو» از افزایش تواناییهای عینک هوشمند با استفاده از ChatGPT گزارش داد. بخشهایی از این گزارش در ادامه از نظر میگذرد: En ision دستیار بینایی ChatGPT AI را، به عینک هوشمند خود برای نابینایان اضافه میکند. این شرکت اکنون با افزودن یک دستیار بینایی با قابلیت پردازش و پاسخ دهی به دستورات صوتی، محصول خود را ارتقا بخشیده است. این عینک جدید در حالحاضر، توسط پیشرفتهترین هوش مصنوعی ساخته شده تاکنون یعنی ChatGPT پشتیبانی میشود.
در نوامبر ۲۰۲۲، OpenAI شرکت پشتیبان ChatGPT، از ابزار پردازش زبان طبیعی مولد هوش مصنوعی خود که قادر به حفظ مکالمات انسان مانند با یک چتبات است، رونمایی کرد. با به روزرسانی اخیری که در ماه مارس منتشر شد، این فناوری توسط متخصصان این صنعت، به عنوان یک گام بزرگ رو به جلو در توسعه هوش مصنوعی (که افراد عادی میتوانند از آن استفاده کنند) مورد تحسین قرار گرفت. ChatGPT در حالحاضر توسط غول فناوری مایکروسافت، در محصولات این شرکت ادغام گردیده است.
شرکت En ision مستقر در هلند، از عینکهای Google Glass در بخش سختافزاری خود استفاده میکند. این شرکت از زمان عرضه در سال ۲۰۲۰، از دوربین عینکهای خود برای ضبط متنهای مندرج در اسناد یا بستهبندیها استفاده میکند، تا امکان خواندن این متون با صدای بلند را برای کاربراناش فراهم آورد.
آخرین به روزرسانی ChatGPT که با استفاده از یک API اختصاصی در اوایل ماه جاری معرفی شد، این فناوری کمکی را برای افراد کمبینا به سطوحی که قبلاً دیده نشده بود، ارتقا داد. عینک جدید با فعال کردن جنبههایی از تفسیر اسناد، دقیقاً مشابه آنچه افراد بینا میتوانند به طور معمول مشاهده نمایند، پیشرفت بزرگی را برای افراد دارای اختلالات بینایی رقم زد.
یک ارتقا قابل توجه در دستیارهای بینایی
قبل از این ویژگی کاملاً جدید به نام Ask En ision، کاربرانی که مایل به استخراج اطلاعات متنی کلیدی مانند بدهی قبض آب و برق یا دستورالعملهای پختوپز بودند، به اجبار باید از عینک خود برای اسکن و خواندن همه موارد درج شده در متن قبضها یا دستورهای پخت استفاده میکردند. این موضوع بهمعنای اتلاف وقت برای بررسی اطلاعات اضافی، بهمنظور رسیدن به جزئیات کلیدی بود.
در حال حاضر با قابلیت Ask En ision، کاربران میتوانند بهسادگی با استفاده از دوربین روی عینک هوشمند، از یک سند متنی عکس بگیرند و سپس با استفاده از صدای خود، از ChatGPT سؤالات مستقیم بپرسند. این پرسشها میتوانند مواردی از این قبیل باشند، «چقدر بابت این قبض بدهکارم؟» یا «گزینههای گیاهخواری در این منو کدامند؟» در عرض چند ثانیه، Ask En ision پاسخهای دقیقی را از طریق خروجی گفتار به کاربر ارائه میدهد.
از آنجایی که ChatGPT ۴، روی مجموعه دادههای گستردهای از اینترنت و تعاملات انسانی آموزش دیده، این نرمافزار هم با پشتیبانی ChatGPT به سطح بالایی از آگاهی زمینهای تجهیز گردیده است. به این معنی که میتواند وظایف پیچیدهای مانند خلاصه کردن اسناد طولانی یا پیشنهاد مسیر براساس نگاه کاربر به نقشه حملونقل عمومی را انجام دهد.
سایر وظایف مهمی که این دستیار مجازی پیشگام میتواند بر آنها مسلط شود عبارتند از، تعیین دقیق دادههای ضروری از نمودارها در محل کار، ارائه ترجمه تقریباً فوری اسناد و بستهبندیها به زبان خارجی و تفسیر دستورالعملهای مونتاژ. این دستیار حتی میتواند بفهمد مردم چه می گویند و در صورت درخواست قادر است فوراً یک آهنگ به سبک هر هنرمندی که انتخاب شده، با استفاده از عبارات موجود در منوی رستوران یا بروشورهای شرکتی بسازد! این نشان میدهد که این محصول یک دستیار شخصی واقعاً هوشمند و خلاق است که میتواند انواع کارهای جالب را انجام دهد.
با تمامی این اوصاف، زیبایی واقعی Ask En ision در سادگی محض رابط کاربری آن نهفته است. به رغم به کارگیری پیچیدهترین فناوری قابلتصور در این عینک، رابط کاربری آن به قدری ساده است که میتوانید با صدای بلند سؤالات روزمرهتان را از آن بپرسید و با آن صحبت کنید، طوری که انگار در حال انجام یک مکالمه معمولی هستید.
افقهای جدید پیشروی Ask En ision
مرحله بعدی ارتقا Ask En ision که برخی از جنبههای آن در حال حاضر در مرحله آزمایش بتا هستند، تمرکز بیشتری بر توانایی ChatGPT برای شناسایی تصاویر، اشیاء و صحنههای زنده خواهد داشت و نه صرفاً اطلاعات نوشتاری. این ویژگیهای جدید به این عینک اجازه میدهد تا کارهای بیشتری مانند؛ شناسایی حالات چهره یا تشخیص اشیاء مختلف را انجام دهد.
منبع: روزنامه جوان