دیجی کالا چندی پیش با انتشار خبری اعلام کرد که تأیید و رد کامنت های ثبت شده توسط کاربران را به هوش مصنوعی سپرده است. در این رابطه به گفتگو با مدیر تیم هوش مصنوعی و محتوای دیجی کالا نشستیم تا از روند توسعه ی این سیستم آگاه شویم.
اواخر آبان ماه سال جاری دیجی کالا با انتشار خبری اعلام کرد که بخش اعظم مدیریت بخش کامنت ها در این فروشگاه به هوش مصنوعی سپرده شده است. برای آگاهی از کم و کیف این سیستم به گفتگو با مدیران دیجی کالا نشستیم. در این گفتگو، وحید پولادی، مدیر بخش محتوای دیجی کالا و نوید شهدی، مدیر بخش هوش مصنوعی، به ارائه اطلاعاتی در رابطه با این سیستم پرداختند.
امیرحسن موسوی، مدیر روابط دیجی کالا، در ابتدای گفت وگو اعلام کرد که برای توسعه ی این سیستم دو تیم محتوا و هوش مصنوعی درگیر بوده اند. البته به گفته ی موسوی، پیش از تشکیل تیم هوش مصنوعی، یکی از استارتاپ های حاضر در دیجی کالا نکست در این فرایند شرکت داشت که در ادامه ی ماجرا با تشکیل تیم هوش مصنوعی دیجی کالا به مدیریت نوید شهدی، این تیم از فرایند توسعه کنار رفته است.
– کامنت کاربران چه جایگاهی در ساختار محتوای دیجی کالا دارد؟
– وحید پولادی: فرایند مدیریت محتوا در دیجی کالا پس از گذشت ۱۵ سال از تأسیس این فروشگاه اینترنتی، سومین نسل خود را پشت سر می گذارد و با توجه به افزایش تنوع کالاها، دیگر استراتژی تولید محتوا به صورت متمرکز پاسخگو نیست و از این رو کامنت کاربران برای کالاهای مختلف نقش بسیار پررنگ تری به خود گرفته است. با افزایش تنوع کالایی، تولید محتوا باید با مشارکت کاربران و از طریق کامنت ها انجام شود. تغییر استراتژی محتوایی دیجی کالا باعث شد رویه ای برای تشویق کاربران به منظور کامنت گذاشتن در پیش گرفته شود و در نتیجه تعداد کامنت های ثبت شده افزایش یافت؛ به طوری که در حال حاضر کاربران دیجی کالا به صورت روزانه میانگین بیش از ۴۰ هزار کامنت (رکورد بیش از ۶۰ هزار کامنت در یک روز) در این فروشگاه ثبت می کنند. با پیاده سازی امکان ضمیمه کردن تصاویر و ویدئو در کامنت، به این نتیجه رسیدیم که مدیریت این بخش وظیفه ی بسیار سنگینی به تیم محتوا تحمیل می کند؛ برای مثال تعداد کامنت ها طی یک ماه اخیر بیش از ۵۰ درصد افزایش یافته است. اول با یک استارتاپ که در دیجی کالا نکست فعال بود، در خصوص این موضوع وارد مذاکره شدیم؛ اما پس از گذشت مدتی متوجه شدیم راهکار این استارتاپ قابلیت پیاده سازی در سیستم دیجی کالا ندارد. هم زمان با این موارد، نوید شهدی وارد دیجی کالا شد.
– توسعه سیستم هوش مصنوعی چندماه طول کشید و پیشرفت این سیستم چطور بوده است؟
– نوید شهدی: من ابتدای امسال به دیجی کالا اضافه شدم و مدیریت تیم هوش مصنوعی را بر عهده گرفتم. پس از تشکیل تیم هوش مصنوعی، ما با تیم های متعدد فعال در دیجی کالا به صحبت نشستیم تا چالش ها و گلوگاه هایی که می شد با راهکارهای مبتنی بر هوش مصنوعی حل کنیم، شناسایی کنیم. موضوع مدیریت کامنت ها از جمله ی مواردی بود که انرژی زیادی از تیم محتوا می گرفت و توسعه ی یک الگوریتم مبتنی بر یادگیری ماشین می توانست بار این کار را سبک تر کند.
اوایل سال جاری و پس از توافق برای پیاده سازی این سیستم، یکی دوماه مذاکره برای مشخص کردن قوانین صرف کردیم و سه ماه طول کشید تا دیتای مورد نیاز جمع آوری شود. تیم محتوا کار خود را آغاز کرد؛ به طوری که تمام داده ها بالغ بر یک میلیون و هشتصدهزار کامنت با لیبل گردآوری شد. اوایل مهرماه ۱۳۹۹ این سیستم تأیید خودکار مورد استفاده قرار گرفت.
البته پیش از توسعه ی سیستم جدید، یک الگوریتم دیگر مورد استفاده قرار می گرفت که فقط قادر بود در مورد رد کردن کامنت ها اظهارنظر کند. البته این سیستم تنها قادر به رد کردن ۲ درصد کامنت ها بوده است. قطعا افزایش تعداد کامنت ها باعث شد این سیستم عملکرد چندان مثبتی نداشته باشد؛ درحالی که درصد موفقیت الگوریتم هوش مصنوعی جدید برای رد، تأیید یا شناسایی به عنوان کامنتی که باید عامل انسانی در مورد آن نظر دهد، بیش از ۹۸ درصد است.
توسعه، آموزش و آزمون این سیستم حدود ۶ ماه زمان برد و در حال حاضر ۷۵ تا ۸۰ درصد از کامنت های ثبت شده توسط سیستم هوش مصنوعی مدیریت می شود.
– آیا هوش مصنوعی موفق شده است برداشت سلیقه ای عامل انسانی در قوانین تأیید یا رد نظرات را برطرف کند؟
– نوید شهدی: با توجه به برداشت سلیقه ای عوامل انسانی از قوانین تعیین شده برای رد یا قبول کردن کامنت ها، این موضوع با اضافه شدن ماشین و هوش مصنوعی از بین رفته است؛ البته این مشکل خیلی محدود بود و تناقض عملکرد در رد یا تأیید کامنت ها چندان پررنگ نبود.
– اغلب چه کامنت هایی منتشر نمی شوند؟
– وحید پولادی: کامنت ها به عنوان بخشی از محتوای دیجی کالا در نظر گرفته می شوند و از این رو بسیار ارزشمند هستند. اما برخی کامنت ها ارتباطی با کالای مورد نظر ندارند و بیشتر به تشریح تجربه ی خرید می پردازند که از این رو منتشر نمی شوند. برای مثال به کامنت هایی در رابطه با شکایت از دیر رسیدن کالا اشاره کرد که ارتباطی با خود کالا ندارد. البته منتشر نشدن کامنت ها در خصوص مشکلات این چنینی به منزله ی نادیده گرفته شدن آن ها نیست؛ این نوع کامنت ها هرچند در صفحه ی مورد نظر منتشر نمی شوند؛ اما پیام کاربر در قالب یک مسئله درون سازمانی برای پیگیری به واحد های مربوط ارسال می شود. در فاز بعدی نیز تلاش بر این است تا تشخیص این کامنت ها توسط هوش مصنوعی انجام شود.
– پردازش طبیعی زبان ها، دیتای جالبی جز تأیید و رد نظرات در اختیار قرار می دهد؛ آیا برنامه ای برای گسترش استفاده از قابلیت های هوش مصنوعی و اطلاعات استخراج شده وجود دارد؟
– نوید شهدی: تأیید یا رد کامنت ها را باید بخش کوچکی از سیستم هوش مصنوعی مرتبط با کامنت ها عنوان کرد که در دست توسعه داریم. اطلاعاتی که کاربران در قالب کامنت ها برای محصولات مختلف ثبت می کنند، در زمینه های بسیاری قابل استفاده است. برای مثال با استفاده از کامنت ثبت شده برای یک محصول، می توان نقطه ی قوت و ضعف محصول را استخراج کرد و همچنین توصیه برای خرید یا نخریدن محصول را براساس منظور کاربر از کامنت استنباط کرد. اطلاعات برگرفته از کاربران در قالب کامنت ها را که اتفاقا حجم بالایی نیز دارند، می توان در انواع سناریوهای مختلف مورد استفاده قرار داد که از جمله ی این کاربردها می توان به بخش نظرات، بخش پیشنهاد به کاربران دیگر و رتبه بندی محصولات استفاده کرد.
– وحید پولادی: استفاده از هوش مصنوعی علاوه بر اینکه بار عملیاتی کنترل کامنت ها را کم می کند، در آینده باعث خواهد شد بتوان معنای کامنت های ثبت شده را استخراج کرد. برای مثال در مورد یک گوشی هوشمند، احتمالا کامنت هایی در مورد ماژول های مختلف نظیر باتری، دوربین و سایر موارد با نقد عملکرد هر یک از این ماژول ها شامل موارد نکات مثبت و منفی ثبت شده است. هوش مصنوعی پس از تصمیم گیری در مورد انتشار یا رد شدن کامنت، می تواند توصیه برای خرید یا عدم خرید محصول را براساس معنای هر یک از کامنت ها به صورت خلاصه به کاربران نمایش دهد. کاربرد دیگری که برای این سیستم در نظر گرفته شده، جلوگیری از انتشار کامنت های غیر واقعی است.
– قیمت بالا و وجود کالاهای غیر اصل از جمله انتقادات واردشده به دیجی کالا است؛ آیا برنامه ای برای هوش مصنوعی به منظور شناسایی چنین مواردی دارید؟ آیا سیستم گزارش دهی کامنت ها می تواند در این موارد کمک کند؟
– وحید پولادی: برای درک اینکه چطور یک کالای غیر اصل در همان ابتدا شناسایی نمی شود، بهتر است ابتدا نگاهی به فرایند ثبت یک کالا در دیجی کالا داشته باشیم. سیستم دیجی کالا به نوعی طراحی شده است که امکان ثبت کالای مشابه در آن وجود ندارد. برای مثال در صورتی که یک ساعت اورجینال توسط یک فروشنده در حال فروش باشد، دیجی کالا اجازه نمی دهد تأمین کننده ای دیگر این محصول را با ایجاد یک صفحه ی محصول جدید عرضه کند. حال فرض کنید که تأمین کننده ی دوم، نسخه ی غیر اصل کالای مورد نظر را برای فروش قرار داده است و از این رو هر دو کالا از طریق یک صفحه محصول با تأمین کنندگان مختلف به فروش می رسند. در این شرایط وقتی کاربری کامنتی در مورد غیر اصل (فیک) بودن کالا منتشر می کند، بلافاصله موضوع به بخش مانیتورینگ مارکت پلیس گزارش می شود و این بخش از تأمین کننده درخواست می کند مدارک خود دال بر اصل بودن کالا را ارسال کند. در صورتی که تأمین کننده قادر به اثبات ادعای خود مبنی بر اصل بودن کالا نباشد، دیجی کالا کالای این تأمین کننده را حذف می کند. پس استفاده از هوش مصنوعی فقط به شناسایی کامنت ها در این رابطه محدود می شود.
– نوید شهدی: پروژه ای طولانی مدت تعریف شده است که در نظر داریم با استفاده از فاکتورهای مختلفی نظیر قیمت محصولات در بازار آفلاین، ارزش دلار و سایر پارامترهای دخیل، به برآورد قیمت کالاها بپردازیم. کامنت در مقطع فعلی نمی تواند نقش مؤثری برای محاسبه قیمت داشته باشند؛ هرچند می توان با استفاده از کامنت ها فهمید نظر کاربران در رابطه با قیمت چیست.
– با توجه به تغییر استراتژی محتوایی دیجی کالا در مورد بخش کامنت، چه برنامه هایی برای این بخش دارید؟
– وحید پولادی: ما در نظر داریم روند کامنت گذاری را به سمت محتوای ویدیویی سوق دهیم و در جریان این تغییر و تحول، به کاربران مان نیز آموزش دهیم تا بتوانند ویدیوهایی باکیفیت تولید کنند. برای مثال کاربران می توانند برای کالاهای مختلف ویدیوی جعبه گشایی تولید و در صفحه ی محصول آپلود کنند و حتی در آینده قادر خواهند بود از این ویدیوها درآمدزایی کنند.
منبع: زومیت.