فناوری، معرفی امکان جدید هوش مصنوعی عاملی در جاز

نویسنده: میثم امینی

منبع: پنجاه و سومین شماره ماهنامه ی نسل مانا

دانلود نسخه صوتی نوشته

 

در این شماره از ماهنامه نسل مانا در ستون فناوری، می‌خواهیم با یکی از امکاناتی که قرار است به صفحه‌خوان جاز بیاید صحبت کنیم؛ امکانی که می‌تواند، استفاده ما از رایانه را دگرگون و ما را بیش ‌از ‌پیش مستقل کند.

شما هم احتمالاً به چنین سناریویی برخورد کرده‌اید: تصور کنید که با خیال راحت در حال پیمایش یک وب‌سایت با استفاده از صفحه‌خوان هستید و ناگهان با سر به یک دیوار محکم دیجیتال برخورد می‌کنید. این دیوار شاید یک دکمه بدون برچسب، یک نمودار دیداری پیچیده یا یک منوی برنامه کاملاً غیردسترسی‌پذیر باشد.

قبلاً تنها راه‌حل این مشکل این بود که از یک فرد بینا کمک بخواهید یا کلاً از انجام کار صرف‌نظر کنید؛ اما این روزها به لطف هوش مصنوعی، چشم‌انداز فناوری‌های کمکی به‌سرعت در حال تغییر است.

شرکت ویسپِرُو، در شرف تغییر دائمی نحوه تعامل کاربران نابینا و کم‌بینا با رایانه‌هایشان است. به هوش مصنوعی عاملی صفحه‌خوان جاز سلام کنید؛ یک ویژگی جدید انقلابی که به طور خاص، برای کمک به شما در رهایی از مشکلات دسترسی‌پذیری که هر‌از‌چندگاهی به آن‌ها برمی‌خورید، طراحی شده است.

اگر چهل و یکمین کنفرانس اخیر فناوری‌های کمکی سی‌اس‌یوان، در شهر آناهیم در ایالت کالیفرنیای امریکا را دنبال کرده باشید، می‌دانید که هیاهوی زیادی در این کنفرانس به پا بود. در محلی که ارائه مربوط به ویسپرو نمایش داده می‌شد، از شدت شلوغی جای نشستن نبود و این موضوع دلیل خوبی داشت.

این شرکت ویژگی‌های جدید و باورنکردنی هوش مصنوعی صفحه‌خوان را به نمایش گذاشت که بسیار فراتر از قابلیت‌های سنتی تبدیل متن به گفتار است. ما دیگر فقط در مورد نرم‌افزاری که آنچه روی صفحه‌نمایش وجود دارد را می‌خواند، صحبت نمی‌کنیم؛ بلکه داریم وارد دورانی می‌شویم که صفحه‌خوان شما می‌تواند، واقعاً از طرف شما کارهای مختلف را انجام دهد.

اکثر ما وقتی عبارت «هوش مصنوعی» را می‌شنویم، به مدل‌های زبان بزرگ مانند چَت‌جی‌پی‌تی یا کلاد فکر می‌کنیم؛ شما سؤالی می‌پرسید و این ربات‌های هوش مصنوعی به شما پاسخ متنی می‌دهند؛ اما به‌روزرسانی جدید صفحه‌خوان جاز، هوش مصنوعی عاملی را در فناوری‌های کمکی معرفی می‌کند.

همان‌طور که مدیر محصول ویسپرو توضیح می‌دهد، یک عامل هوش مصنوعی فقط با شما صحبت نمی‌کند؛ بلکه کارهایی را برای شما انجام می‌دهد. این عامل به طور فعال، وظایفی مانند تایپ، کلیک‌کردن و پیمایش رایانه شما را، بر اساس دستورات صوتی یا متنی ساده شما انجام می‌دهد.

برخلاف دستیارهای هوش مصنوعی عمومی که فقط به گرفتن عکس از صفحه‌نمایش شما متکی‌اند، عامل هوش مصنوعی جاز فوق‌العاده قدرتمند است؛ زیرا، مستقیماً در صفحه‌خوان جاز تعبیه شده است. علاوه بر جاز، این امکان همچنین در برنامه فیوژن – نرم‌افزاری که در آن صفحه‌خوان جاز و برنامه درشت‌نمای زوم‌تِکست، با هم ترکیب شده‌اند  تا هم افراد نابینا و هم افراد کم‌بینا بتوانند از آن استفاده کنند – ارائه شده است.

این عامل هوش مصنوعی، با ترکیب سه نقطه داده قدرتمند کار می‌کند:

  • درخت دسترسی‌پذیری: کد زیربنای نرم‌افزار یا وب‌سایت.
  • ضبط صفحه‌نمایش: تصاویر دیداری از آنچه که واقعاً روی مانیتور نمایش داده می‌شود.
  • آگاهی زمینه‌ای: اطلاعاتی در مورد اینکه تمرکز صفحه‌خوان در حال حاضر روی کدام برنامه است.

با پردازش هم‌زمان این سه مورد، عامل هوش مصنوعی درک کاملی از صفحه‌نمایش رایانه شما پیدا می‌کند و می‌تواند، دقیقاً نحوه اجرای دستورات شما را تشخیص دهد.

شاید از خود بپرسید که آیا این امکان در آینده جای جاز را می‌گیرد؟ قطعاً خیر؛ ویسپرو به‌صراحت اعلام کرده است که این امکان جایگزین جاز نخواهد شد و همچنین یک صدای مزاحم و «همیشه روشن» که روند کار شما را مختل می‌کند نخواهد بود.

این امکان یک ویژگی بر اساس تقاضا است؛ هر آنچه که در جاز با آن آشنا هستید و دوست دارید، دقیقاً همانی که بود باقی می‌ماند. شما فقط زمانی که با یک مشکل دسترسی‌پذیری مواجه می‌شوید، در جایی گیر می‌کنید، گیج می‌شوید یا به‌خاطر طراحی غیر دسترسی‌پذیر مسدود می‌شوید، صریحاً عامل هوش مصنوعی را فراخوانی می‌کنید تا به شما در حل این مشکل کمک کند.

مثلاً در یک پیش‌نمایش از این امکان، فرد نابینا که در یک صفحه مربوط به نظرسنجی گیر کرده بود و بعد از انتخاب دکمه رادیویی مربوط به گزینه موردنظرش، دکمه‌ای را برای رفتن به مرحله بعد از نظرسنجی پیدا نمی‌کرد، از عامل هوش مصنوعی پرسید که چرا نمی‌تواند به مرحله بعد برود.

عامل، صفحه را تجزیه‌وتحلیل کرد و متوجه شد که توسعه‌دهنده وب‌سایت، برای طراحی دکمه مربوط به رفتن به مرحله بعد، از یک عنصر معنادار اچ‌تی‌ام‌ال استفاده نکرده است و به این دلیل است که صفحه‌خوان، نمی‌تواند این دکمه را پیدا کند.

سپس عامل هوش مصنوعی برای کاربر، دکمه بعدی را فعال کرد و به مرحله بعد از نظرسنجی رفت.

در مثالی دیگر، کاربر در برنامه تقویم در انتخاب تاریخ برای یک رویداد مشکل داشت و هروقت تاریخی را انتخاب می‌کرد، تاریخ انتخاب‌شده دوباره به تاریخ پیش‌فرض برمی‌گشت.

او از عامل هوش مصنوعی جاز خواست که تاریخ را برایش مشخص کند که عامل، به‌راحتی این کار را برای او انجام داد.

البته این امکان فوق‌العاده مفید به اینترنت نیاز دارد که متأسفانه در حال حاضر در دسترس اکثریت مردم ایران نیست. در نتیجه، این امکان مفید در حال حاضر بیشتر فقط یک خبر جالب است تا قولی برای داشتن یک زندگی کمی راحت‌تر در آینده نزدیک؛

امیدواریم که با شکست طرح تبعیض‌آمیز اینترنت طبقاتی، بتوانیم دوباره از امکانات این‌چنینی برای افزایش کیفیت زندگی‌مان استفاده کنیم و مثل هم‌نوعانمان در کشورهای دیگر از موهبت بزرگی که هوش مصنوعی است، بهره‌مند شویم.

منبع وب‌سایت آریا نیرالا

ترجمه و گردآوری: میثم امینی

منبع : نسل مانا

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

لطفا پاسخ عبارت امنیتی را در کادر بنویسید. *