آموزش جلوگیری از دسترسی هوش مصنوعی به اطلاعات حساس

نگران نباشید، می توانید جلوی دسترسی ابزارهای هوش مصنوعی به داده های شخصی خود را بگیرید تا از آن ها برای آموزش های مدل های هوش مصنوعی استفاده نشود.

هر محتوایی که در سطح اینترنت مشاهده می کنید، به احتمال زیاد جمع آوری شده و برای آموزش نسل کنونی هوش مصنوعی مولد مورد استفاده قرار گرفته است. مدل های زبان بزرگ مثل ChatGPT و ابزار های تولیدکننده ی تصویر با انبوهی از داده های ما تغذیه می شوند. حتی اگر این داده ها برای ساخت چت بات به کار نروند، می توانند در ویژگی های دیگر یادگیری ماشین استفاده شوند.

شرکت های فناوری برای جمع آوری داده هایی که به گفته خودشان برای خلق هوش مصنوعی مولد ضروری هستند، سرتاسر وب را با بی توجهی به حقوق مؤلفان، قوانین کپی رایت و حریم خصوصی کاربران، مورد استفاده قرار داده اند. شرکت هایی هم که انبوهی از اطلاعات کاربران را در اختیار دارند، به دنبال سهمی از سود صنعت هوش مصنوعی هستند.

اگر شما هم نگران هستید که داده هایتان مورد استفاده ی هوش مصنوعی قرار بگیرد، ما در این مقاله به بررسی راهکارهای جلوگیری از دسترسی هوش مصنوعی به اطلاعات خصوصی می پردازیم.

محدودیت های جلوگیری از دسترسی هوش مصنوعی به داده ها

پیش از آن که به روش های جلوگیری از دسترسی هوش مصنوعی به اطلاعات خصوصی بپردازیم، بهتر است سطح انتظارات را در حد واقع بینانه نگه داریم. بسیاری از شرکت های توسعه دهنده ی هوش مصنوعی از مدت ها قبل اقدام به جمع آوری گسترده ی داده های وب کرده اند؛ بنابر این، احتمالاً هر آنچه که تا امروز منتشر کرده اید، هم اکنون در سیستم های آن ها وجود دارد. این شرکت ها درباره ی اطلاعاتی که استخراج یا خریداری کرده اند، شفاف عمل نمی کنند و اطلاعات ما در این زمینه بسیار مبهم است.

شرکت ها می توانند فرایند انصراف از استفاده ی داده ها برای آموزش هوش مصنوعی را پیچیده کنند. بسیاری از افراد درباره ی مجوز هایی که پذیرفته اند یا نحوه ی به کارگیری داده ها، دید روشنی ندارند. این موضوع مربوط به قبل از زمانی است که به قوانین مختلف، مانند حمایت از حقوق مالکیت فکری و قوانین قدرتمند حفظ حریم خصوصی اروپا، توجه شود. فیسبوک، گوگل و شرکت های دیگر، در اسناد مربوط به حریم خصوصی خود ذکر کرده اند که شاید از داده های شما برای آموزش هوش مصنوعی استفاده کنند.

فهرست زیر فقط شامل شرکت هایی می شود که درحال حاضر راهکاری برای منع دسترسی آن ها به داده های شخصی کاربران برای آموزش مدل های هوش مصنوعی ارائه می دهند.

روش جلوگیری از دسترسی ابزارهای هوش مصنوعی به داده ها

ذخیره سازی فایل ها در سرویس های ابری، مزایای زیادی دارد. اما این فایل ها می توانند برای مقاصد دیگر نیز مورد استفاده قرار بگیرند. براساس اسناد شرکت هایی مانند ادوبی و آمازون، داده های ذخیره شده در فضای ابری آن ها، می تواند برای آموزش الگوریتم های یادگیری ماشین به کار رود.

گوگل جمنای

اگر از چت بات گوگل جمنای (Gemini) استفاده می کنید، باید بدانید کارشناسان انسانی برخی مکالمات شما را برای بررسی و بهبود مدل هوش مصنوعی بازبینی می کنند. به هر حال، می توانید این دسترسی را لغو کنید. بدین منظور جمنای را در مرورگر خود باز کرده، روی بخش Activity کلیک و سپس از منوی کشویی Turn Off را انتخاب کنید. در این قسمت، می توانید صرفاً فعالیت جمنای را غیرفعال کنید و یا با انتخاب گزینه ی Delete data، هم دسترسی را لغو کرده و هم اطلاعات مکالمات گذشته را پاک کنید.

نکته ی مهم اینکه با غیرفعال سازی دسترسی جمنای به داده های شخصی خود، مکالمات آتی شما دیگر برای بازبینی دردسترس نخواهد بود، اما اطلاعات مکالمات قبلی که برای بررسی انتخاب شده اند، همچنان تا سه سال نزد گوگل باقی خواهند ماند.

ChatGPT و DALL-E

هنگام استفاده از چت بات ها، ناخواسته اطلاعات شخصی زیادی را فاش می کنیم. OpenAI، به عنوان توسعه دهنده ی چت بات محبوب ChatGPT، به کاربران اختیاراتی برای کنترل داده هایشان می دهد. این اختیار شامل جلوگیری از استفاده از اطلاعات برای آموزش مدل های هوش مصنوعی آینده می شود.

طبق صفحات راهنمای OpenAI، کاربران وب ChatGPT که حساب کاربری ندارند، باید به بخش تنظیمات (Settings) مراجعه و گزینه ی Improve the model for everyone را غیرفعال کنند. اگر حساب کاربری دارید و ازطریق مرورگر وب وارد شده اید، باید به بخشChatGPT بروید و سپس در مسیر Settings و Data Controls، گزینه ی Chat History & Training را خاموش کنید. درصورتی که از اپلیکیشن های موبایل ChatGPT استفاده می کنید، به Settings مراجعه کرده و Data Controls را انتخاب کنید و درنهایت گزینه ی Chat History & Training را خاموش کنید.

صفحات پشتیبانی OpenAI هشدار می دهند که تغییر تنظیمات دسترسی به داده های شخصی در مرورگر یا دستگاه خاص، روی سایر مرورگرها یا دستگاه های شما همگام سازی نمی شود؛ بنابراین، باید اینکار را در هر جایی که از ChatGPT استفاده می کنید، انجام دهید.

فعالیت های OpenAI فراتر از ChatGPT است. این استارتاپ برای ابزار تولید تصویر Dall-E 3 نیز فرمی در نظر گرفته است که به شما امکان می دهد با ارسال آن، تصاویر مورد نظر خود را از مجموعه داده های آموزشی آینده حذف کنید. در این فرم باید نام، ایمیل، مالکیت حق نشر تصویر، جزئیات تصویر و اصل تصویر را آپلود کنید. OpenAI همچنین می گوید اگر حجم زیادی از تصاویر را به صورت آنلاین میزبانی می کنید که نمی خواهید برای آموزش داده ها استفاده شوند، شاید اضافه کردن GPTBot به فایل robots.txt وب سایت محل میزبانی تصاویر، روش کارآمدتری باشد.

Perplexity

Perplexity استارتاپی است که با استفاده از هوش مصنوعی در جست وجوی وب و یافتن پاسخ سؤالات به کاربران کمک می کند. این ابزار مثل سایر نرم افزارهای مشابه، به صورت پیش فرض رضایت شما برای استفاده از تعاملات و داده هایتان را در جهت بهبود هوش مصنوعی خود دریافت می کند. برای غیرفعال کردن این مورد، روی نام کاربری خود کلیک کنید، به بخش Account بروید و AI Data Retention را در حالت غیرفعال قرار دهید.

ادوبی

اگر از حساب کاربری شخصی ادوبی استفاده می کنید، غیرفعال کردن این قابلیت به سادگی امکان پذیر است. بدین منظور باید در صفحه ی حریم خصوصی ادوبی به بخش Content analysis بروید و کلید مربوطه را خاموش کنید. برای حساب های تجاری یا آموزشی، این امکان به صورت مجزا برای تک تک کاربران وجود ندارد و برای غیرفعال سازی آن باید با مدیر سیستم تماس بگیرید.

وردپرس

وردپرس گزینه ای برای جلوگیری از اشتراک گذاری داده ها با سرویس های شخص ثالث دارد. برای فعال کردن این قابلیت، در پنل مدیریت وب سایت، روی Settings و بعد از آن General و سپس Privacy کلیک کرده و در نهایت تیک گزینه ی Prevent third-party sharing را بزنید. سخنگوی Automattic می گوید: «ما درحال همکاری با خزنده های وب ازجمله Common Crawl هستیم تا جلوی دسترسی و فروش غیرمجاز محتوای کاربران را بگیریم.»

Grammarly

درحال حاضر، کاربران عادی گرمرلی (Grammarly) امکان لغو استفاده از داده هایشان را برای بهبود مدل یادگیری ماشین این سرویس ندارند. این امکان فقط برای حساب های تجاری (Business Account) دردسترس است که به صورت خودکار قابل مدیریت بوده و نیازی به درخواست مستقیم کاربر ندارد.

برای لغو دسترسی گرمرلی در حساب های تجاری، به تنظیمات حساب کاربری (Account Settings) مراجعه، روی تب Data Settings کلیک و سپس گزینه ی Product Improvement & Training را غیرفعال کنید. همچنین، حساب های تجاری تحت مدیریت مانند حساب های آموزشی و حساب های خریداری شده ازطریق نماینده ی فروش گرمرلی، به صورت خودکار از فرایند آموزش مدل هوش مصنوعی مستثنی هستند.

Quora

Quora ادعا می کند درحال حاضر از پاسخ ها، پست ها یا نظرات کاربران برای آموزش هوش مصنوعی استفاده نمی کند. این شرکت همچنین هیچ گونه داده ی کاربری را برای آموزش هوش مصنوعی به فروش نمی رساند. به هر حال، Quora همچنان گزینه ای برای انصراف از این موضوع در نظر گرفته است. برای اینکار، به صفحه ی Settings بروید، روی Privacy کلیک و سپس Allow large language models to be trained on your content را غیرفعال کنید.

به نوشته ی WIRED، امکان دارد Quora همچنان از برخی پست های خاص برای آموزش مدل های زبان بزرگ (LLM) استفاده کند. صفحات راهنمای این شرکت توضیح می دهند درصورتی که به پاسخ تولیدشده با هوش مصنوعی، پاسخ دهید، شاید اطلاعات آن، برای آموزش هوش مصنوعی مورد استفاده قرار گیرد. این شرکت اشاره می کند که احتمال استخراج داده ها از طرف شرکت های متفرقه نیز وجود دارد.

Tumblr

شرکت Automattic، مالک وب سایت های Tumblr و WordPress.com، اعلام کرده که با همکاری شرکت های هوش مصنوعی قصد دارد از مجموعه داده های عظیم و منحصر به فرد محتوای منتشر شده در پلتفرم های خود برای آموزش هوش مصنوعی استفاده کند. سخنگوی این شرکت تأکید کرده است که ایمیل های کاربران و محتوای خصوصی شامل این همکاری نخواهد شد.

درصورتی که در Tumblr وبلاگ شخصی دارید، می توانید با مراجعه به Settings، انتخاب وبلاگ، کلیک روی آیکون چرخ دنده، رفتن به بخش Visibility و فعال کردن گزینه ی Prevent third-party sharing مانع استفاده از محتوای خود برای آموزش هوش مصنوعی شوید. همچنین بر اساس صفحات پشتیبانی Tumblr، پست های صریح، وبلاگ های حذف شده، و وبلاگ های دارای رمز عبور یا خصوصی به هیچ وجه با شرکت های دیگر به اشتراک گذاشته نمی شوند.

اسلک

شاید برایتان عجیب باشد، اما حتی همان پیام های رد و بدل شده ی به ظاهر بی اهمیت در اسلک محل کارتان هم ممکن است برای آموزش مدل های این پلتفرم استفاده شوند. براساس گفته ی معاون بخش محصول اسلک، این پلتفرم از سالیان گذشته در محصولاتش از یادگیری ماشین برای ارائه ی قابلیت هایی مثل پیشنهاد کانال و ایموجی استفاده می کند.

اگرچه اسلک از داده های مشتریان برای آموزش مدل زبان بزرگ محصول هوش مصنوعی خود استفاده نمی کند، اما می تواند از تعاملات شما برای بهبود قابلیت های یادگیری ماشینی نرم افزار بهره ببرد. در صورتی که از حساب سازمانی اسلک استفاده می کنید، امکان انصراف از این فرآیند وجود ندارد.

تنها راه برای لغو اشتراک اسلک، ارسال ایمیل از طرف مدیر سیستم به آدرس feedback@slack.com است. موضوع ایمیل باید Slack Global model opt-out request باشد و URL سازمان نیز در آن درج شود. اسلک هیچ جدول زمانی برای مدت زمان انجام فرایند لغو اشتراک ارائه نمی دهد، اما پس از تکمیل آن باید ایمیل تأیید برای شما ارسال کند.

وب سایت اختصاصی

اگر وب سایت اختصاصی خود را راه اندازی کرده اید، می توانید با به روزرسانی فایل robots.txt از ربات های هوش مصنوعی بخواهید صفحاتتان را کپی نکنند. بسیاری از وب سایت های خبری اجازه نمی دهند ربات های هوش مصنوعی مقالاتشان را مرور کنند. برای مثال، فایل robots.txt وب سایت WIRED اجازه ی دسترسی به ربات های OpenAI، گوگل، آمازون، فیسبوک، Anthropic و Perplexity و بسیاری دیگر را نمی دهد.

این قابلیت صرفاً برای ناشران محتوا کاربرد ندارد. هر وب سایتی می تواند با اضافه کردن دستور disallow به فایل robots.txt، ربات های هوش مصنوعی را از دسترسی به سایت خود منع کند.

منبع: زومیت