ارائه مدلی برای سیستم های توصیه گر در شبکه های مبتنی بر اعتمادword
امروزه با گسترش و رشد روز افزون اطلاعات در فضای مجازی و وجود انبوهی از کالا یا خدماتی که در وب سایتهای تجاری و خدماتی ارائه میگردند کاربران را با این مشکل مواجه نموده است که چگونه کالا یا خدمت مورد نظر خود را به راحتی و با صرف کمترین زمان ممکن بیابند. در این میان سیستمهای توصیهگر با هدف تسهیل و یاری رساندن به کاربران در زمینه انتخاب و یافتن کالای مورد نیاز ایشان با استفاده از علوم و روشهای مبتنی بر داده کاوی اطلاعات، ایجاد و توسعه یافتهاند. همچنین در سالهای اخیر ظهور و گسترش شبکههای اجتماعی و شبکههای مبتنی بر رابطه اعتماد میان کاربران، باعث گشوده شدن افق جدیدی در ارائه سیستمهای توصیهگر و توسعه نسل جدیدی از اینگونه سیستمها گردیده است و آنرا به یکی از موضوعات جذاب و مورد توجه محققان تبدیل نموده است. از میان روشها و مدلهای موجود در زمینه سیستمهای توصیهگر روش پالایش گروهیبه لحاظ سادگی پیادهسازی از محبوبیت قابل ملاحظهای برخوردار است اما این روش در ارائه پیشنهادات مناسب و قابل قبول به کاربران تازه وارد دارای ضعفهای جدی میباشد. سیستمهای توصیهگر مبتنی بر اعتماد، با بهرهگیری از رابطه اعتماد میان کاربران، در جهت رفع نقاط ضعف بیان شده و خصوصا ارائه پیشنهادات مناسب به کاربران تازه وارد گامهای موثری برداشتهاند. در این تحقیق سعی شده است تا از تلفیق و ترکیب روشهای موجود در زمینه پالایش گروهی و همچنین مدلهای مبتنی بر اعتماد و بررسی نقاط ضعف و قوت آنها مدلی نوین و توسعه یافته ارائه گردد که در آن نتایج از خطای کمتر و دقت بالاتری برخوردار بوده و با افزایش معیار پوشش بتوان به درصد بیشتری از کاربران پاسخ مناسب ارائه نمود. برای این منظور در میان انواع روشهای پالایش گروهی، روش مبتنی بر آیتم و برای پیمایش شبکه اعتماد میان کاربران نیز از روش پیمایش تصادفی بهره گرفته شده است، همچنین با تفسیر و تعدیل نظرات کاربران و اتخاذ شیوهای مناسب جهت محاسبه مقدار دقیق اعتماد میان کاربران و تغییر در نحوه پیمایش شبکه اعتماد میان ایشان سعی در بهبود و کاهش خطاهای نتایج گردیده است. در نهایت، جهت ارزیابی و برآورد مدل ترکیبی ارائه شده، نتایج و آمارهای حاصل از اجرای مدل پیشنهادی بر روی مجموعه داده های Epinions و Movielens و مقایسه آنها با نتایج مدل پایه TrustWalkerبه عنوان یکی از بهترین مدلهای ترکیبی ارائه شده در زمینه سیستمهای توصیه گر مبتنی بر اعتماد، ارائه میگردد. واژههای کلیدی: داده کاوی[1]، شبکه های اجتماعی[2]، شبکه های مبتنی بر اعتماد[3]، سیستمهای توصیه گر[4]،پالایش گروهی[5]، اعتماد[6]، پیمایش تصادفی[7]، ترکیب سازی[8] فهرست مطالب فصل اول : مقدمهای بر انواع سیستم توصیهگر.......................................1 1-1- مقدمه............2 1-2- سیستمهای توصیهگر..........3 1-3- انواع سیستمهای توصیهگر از لحاظ عملکردی............................................................4 1-4- مزایا و اهمیت یک سیستم توصیهگر کارآمد...............................................................5 1-5-معایب و مشکلات کلی سیستمهای توصیهگر..............................................................6 1-6-انواع رویکردها و مدلهای موجود در زمینه پیادهسازی سیستمهای توصیهگر.......7 1-7- تشریح و بیان مسئله.......................................................................................................11 1-8- اهداف تحقیق...................................................................................................................12 1-9- سوالات و فرضیههای تحقیق........................................................................................13 1-10- مراحل تحقیق...............................................................................................................14 1-11- فصول پایان نامه...........................................................................................................15
فصل دوم : مروری بر ادبیات تحقیق و مبانی نظری تحقیق....................................17 2-1- مقدمه ...............................................................................................................................18 2-2- پالایش گروهی (Collaborative Filtering)....................................................19 2-2-1- پالایش گروهی مبتنی بر حافظه(Memory Based)...................................20 2-2-1-1- روش پالایش گروهی مبتنی بر آیتم...............................................................22 2-2-1-2- امتیازدهی به صورت پیش فرض.......................................................................24 2-2-1-3- تشدید حالت(Case Amplification).......................................................24 2-2-2- پالایش گروهی مبتنی بر مدل(Model Based)............................................25 2-3- پالایش محتوایی (Content Based Filtering) .............................................26 2-4- تکنیکهای ترکیبی...........................................................................................................27 2-5- سیستمهای توصیهگر مبتنی بر رابطه اعتماد میان کاربران...................................28 2-5-1- چگونگی کارکرد سیستم توصیهگر مبتنی بر اعتماد..........................................30 2-5-2- مزایا و معایب..............................................................................................................31 2-5-3- انتشار اعتماد و تجمیع اعتماد.................................................................................33 2-6- چالش ها و محدودیتهای موجود.................................................................................33 2-6-1- نقصان و کاستی اطلاعات.........................................................................................34 2-6-2- مشکل کاربران تازه وارد............................................................................................34 2-6-3- کلاهبرداری و تقلب...................................................................................................35 2-6-4- پیچیدگیهای محاسباتی و زمانی.............................................................................36 2-7- معیارهای ارزیابی سیستمهای توصیهگر.....................................................................37 2-7-1- خطای جذر میانگین مربعات (RMSE).............................................................37 2-7-2- معیار درصد پوشش...................................................................................................38 2-7-3- معیار دقت...................................................................................................................39 2-7-4- معیار F-Measure.................................................................................................39
فصل سوم : مروری بر مطالعات و تحقیقات پیشین..................................................41 3-1- مقدمه................................................................................................................................42 3-2- مرور کارهای گذشته.......................................................................................................42 3-2-1- مدل MoleTrust...................................................................................................45 3-2-2- مدل TidalTrust...................................................................................................47 3-2-3- مدل دانه سیب...........................................................................................................48 3-2-4- مدل ارائه شده توسط Anderson.....................................................................48 3-2-5- مدل ارائه شده توسط ODonovan.................................................................49 3-2-6- مدل TrustWalker..............................................................................................50 3-2-6-1- ساختار مدل TrustWalker...........................................................................51 3-2-6-2- تشابه آیتم ها.........................................................................................................51 3-2-6-3- خصوصیات ویژه مدل TrustWalker...........................................................52 3-2-6-3-1- فراگیری و عمومیت مدل...............................................................................52 3-2-6-3-2- اطمینان به نتایج حاصل.................................................................................53 3-2-6-3-3- تفسیرپذیری و قابل توضیح بودن نتایج......................................................54 3-2-6-4- نمایش ماتریسی مدل TrustWalker..........................................................54 3-2-6-5- نتیجه گیری در خصوص مدل TrustWalker...........................................55
فصل چهارم : تشریح مدل ترکیبی پیشنهادی و چگونگی توسعه و بهبود مدل پایه.56 4-1- مقدمه................................................................................................................................57 4-2- تشریح مدل کلی TrustWalker.............................................................................57 4-2-1- علائم نشانه گذاری و متغیرهای مدل....................................................................57 4-2-2- روند یک پیمایش تصادفی در شبکه......................................................................58 4-2-3- انتخاب تصادفی یک کاربر ......................................................................................59 4-2-4- انتخاب یک آیتم مشابه.............................................................................................59 4-2-5- تشابه آیتم ها...............................................................................................................60 4-2-6- محاسبه احتمال ماندن در یک گره شبکه اعتماد ().............................61 4-2-7- چگونگی انجام پیشبینی امتیاز..............................................................................62 4-2-8- چگونگی محاسبه احتمال .................................................63 4-2-9- چگونگی محاسبه عملی ..................................................................................64 4-2-10- شرط اتمام کلی مدل..............................................................................................64 4-3- بهبود و توسعه مدل TrustWalker........................................................................65 4-3-1- استفاده از فرمول jaccard جهت محاسبه تشابه آیتمها..................................66 4-3-2- حذف میانگین از فرمول پیرسون............................................................................67 4-3-3- استفاده از تکنیک مبتنی بر آیتم خالص...............................................................67 4-3-4- تعدیل و تفسیر نظرات کاربران................................................................................68 4-3-5- محاسبه دقیق مقدار اعتماد یا امتیاز رابطه میان دو کاربر................................71 4-3-6- محاسبه ترکیبی امتیاز رابطه میان کاربران..........................................................73
فصل پنجم : تشریح روند انجام آزمایشات و نتایج حاصل....................................76 5-1- مقدمه................................................................................................................................77 5-2- معرفی مجموعه داده epinions................................................................................77 5-2-1- ویژگیهای مجموعه داده epinions.....................................................................79 5-2-2- آماده سازی و نحوه پالایش دادهها.........................................................................81 5-2-3- ایجاد مجموعه داده نمونه.........................................................................................83 5-3- مجموعه داده movielens.........................................................................................84 5-3-1- ویژگیهای مجموعه داده movielens.................................................................84 5-4- نیازمندیهای نرم افزاری.................................................................................................85 5-5- نیازمندیهای سخت افزاری............................................................................................85 5-6- متدولوژی نرم افزاری......................................................................................................86 5-7- پارامترهای پیش فرض انجام آزمایشات......................................................................86 5-8- نتایج اجرای آزمایشات با مجموعه داده epinions و movielens.................87 5-8-1- بررسی تاثیر عمق پیمایش بر روی نتایج حاصل در خصوص کاربران تازه وارد.................................................................................................................................................87 5-8-2- بررسی تاثیر تاریخ اعلام نظرات توسط کاربران...................................................88 5-8-3- بررسی تاثیر تغییر فرمول محاسبه تشابه آیتمها.................................................89 5-8-4- بررسی تاثیر بکارگیری مکانیزم تفسیر و تعدیل نظرات کاربران......................90 5-8-5- بررسی تاثیر بکارگیری انواع روشهای ترکیبی برای انتخاب کاربران و پیمایش شبکه..............................................................................................................................................93 5-8-5-1- نحوه محاسبه امتیاز رابطه موجود میان کاربران............................................93 5-8-5-2- بررسی تاثیر بکارگیری روشهای ترکیبی در عملکرد سیستم برای تمامی کاربران...........................................................................................................................................94 5-8-5-3- بررسی تاثیر بکارگیری روشهای ترکیبی در عملکرد سیستم برای کاربران تازه وارد .......................................................................................................................................99 5-8-6- بررسی تاثیر بکارگیری توام مکانیزم تفسیر امتیازات کاربران به همراه استفاده از روشهای ترکیبی انتخاب کاربران و پیمایش شبکه اعتماد..........................................101 5-9- انجام آزمایشات با مجموعه داده movielens.....................................................107 5-9-1- نتایج حاصل از اجرای روشهای ترکیبی مورد استفاده در مدل توسعه یافته............................................................................................................................................107
فصل ششم : نتیجه گیری نهایی و کارهای آینده....................................................110 6-1- مقدمه..............................................................................................................................111 6-2- عملکرد مدل توسعه یافته...........................................................................................112 6-2-1- عملکرد مدل توسعه یافته در خصوص تمامی کاربران....................................112 6-2-2- عملکرد مدل توسعه یافته در خصوص کاربران تازه وارد................................114 6-3- نتیجه گیری نهایی ......................................................................................................115 6-3-1- تحلیل نهایی نتایج حاصل از انجام آزمایشات بر روی مجموعه داده epinions................................................................................................................................116 6-3-2- تحلیل نهایی نتایج حاصل از انجام آزمایشات بر روی مجموعه داده movielens............................................................................................................................118 6-4- پیشنهادات کارهای آینده...........................................................................................118
اختصارات.................................................................................................................120 فهرست منابع...........................................................................................................121 فهرست جداول
عنوان..................................................................................................................................صفحه
جدول 3-1 : دستهبندی مدلهای اعتماد...............................................................................................44 جدول 4-1 : ماتریس پراکندگی نحوه امتیازدهی دو کاربر و ..........................................70 جدول 4-2 : تفسیر نظرات کاربر ..................................................................................................70 جدول 5-1 : ساختار جدول reviews................................................................................................81 جدول 5-2 : ساختار جدول WOT......................................................................................................82 جدول 5-3 : ساختار جدول cold_start_users..........................................................................82 جدول 5-4 : ساختار جدول ratings...................................................................................................83 جدول 5-5 : مقادیر پیش فرض پارامترها و متغیرهای مورد استفاده در مدل پیشنهادی.........86 جدول 5-6 : نتایج بررسی تاثیر عمق پیمایش در خصوص کاربران تازه وارد...............................88 جدول 5-7 : نتایج حاصل از بررسی تاثیر تاریخ اعلام نظرات کاربران............................................89 جدول 5-8 : نتایج حاصل از تغییر فرمول محاسبه تشابه آیتمها....................................................90 جدول 5-9 : نتایج حاصل از بکارگیری مکانیزم تعدیل و تفسیر نظرات کاربران.........................91 جدول 5-10 : نتایج حاصل از بکارگیری مکانیزم تعدیل و تفسیر نظرات کاربران در خصوص کاربران تازه وارد..........................................................................................................................................91 جدول 5-11 : نتایج حاصل از اجرای روشهای ترکیبی در مقابل روش مورد استفاده در مدل پایه.................................................................................................................................................................96 جدول 5-12 : نتایج حاصل از اجرای روشهای ترکیبی در مقابل روش مورد استفاده در مدل پایه برای کاربران تازه وارد........................................................................................................................99 جدول 5-13 : نتایج حاصل از اجرای توام مکانیزم تعدیل و تفسیر نظر کاربران و استفاده از روشهای ترکیبی پیمایش شبکه در مقابل روش مورد استفاده در مدل پایه..............................102 جدول 5-14 : نتایج حاصل از اجرای توام مکانیزم تعدیل و تفسیر نظر کاربران و استفاده از روشهای ترکیبی پیمایش شبکه در مقابل روش مورد استفاده در مدل پایه برای کاربران تازه وارد..............................................................................................................................................................104 جدول 5-15 : نتایج حاصل از اجرای روشهای ترکیبی انتخاب کاربران و پیمایش شبکه......107 جدول 5-16 : نتایج حاصل از اجرا و بکارگیری مکانیزم تعدیل و تفسیر نظرات کاربران بر روی روشهای ترکیبی انتخاب کاربران و پیمایش شبکه...........................................................................108 جدول 6-1 : نتایج حاصل از مقایسه معیارهای ارزیابی مدل توسعه یافته در مقابل مدل پایه .....................................................................................................................................................................113 جدول 6-2 : نتایج حاصل از مقایسه معیارهای ارزیابی مدل توسعه یافته در مقابل مدل پایه در خصوص کاربران تازه وارد.......................................................................................................................114 فهرست اشکال و نمودارها شکل 2-1 : چگونگی کارکرد روش پالایش گروهی (Collaborative Filtering)...............20 شکل 2-2 : نمایش یک شبکه اعتماد به همراه امتیازات بیان شده توسط کاربران در خصوص آیتمهای مختلف..........................................................................................................................................31 شکل 3-1 : معماری مدل MoleTrust ارائه شده توسط Massa..............................................46 شکل 5-1 : بنر صفحه اصلی سایت epinions.................................................................................78 نمودار 5-1 : مقایسه نتایج خطای RMSE و درصد پوشش مدل پایه و مدل توسعه یافته در خصوص کاربران تازه وارد و تمامی کاربران با بکارگیری مکانیزم تعدیل و تفسیر نظرات کاربران ........................................................................................................................................................................92 نمودار 5-2 : مقایسه نتایج معیارF-measure مدل پایه و مدل توسعه یافته در خصوص کاربران تازه وارد و تمامی کاربران با بکارگیری مکانیزم تعدیل و تفسیر نظرات کاربران............93 نمودار 5-3 : مقایسه نتایج معیاردرصد پوششحاصل از اجرای روشهای ترکیبی در مقابل روش مورد استفاده در مدل پایه........................................................................................................................97 نمودار 5-4 : مقایسه نتایج خطای RMSEحاصل از اجرای روشهای ترکیبی در مقابل روش مورد استفاده در مدل پایه........................................................................................................................98 نمودار 5-5 : مقایسه نتایج معیار F-measureحاصل از اجرای روشهای ترکیبی در مقابل روش مورد استفاده در مدل پایه.............................................................................................................98 نمودار 5-6 : مقایسه نتایج معیار درصد پوشش حاصل از اجرای روشهای ترکیبی در مقابل روش مورد استفاده در مدل پایه برای کاربران تازه وارد.................................................................100 نمودار 5-7 : مقایسه نتایج خطای RMSEحاصل از اجرای روشهای ترکیبی در مقابل روش مورد استفاده در مدل پایه برای کاربران تازه وارد............................................................................100 نمودار 5-8 : مقایسه نتایج معیار F-measureحاصل از اجرای روشهای ترکیبی در مقابل روش مورد استفاده در مدل پایه برای کاربران تازه وارد.................................................................101 نمودار 5-9 : مقایسه نتایج معیار درصد پوشش حاصل از اجرای توام مکانیزم تعدیل و تفسیر نظر کاربران و استفاده از روشهای ترکیبی پیمایش شبکه در مقابل روش مورد استفاده در مدل پایه..............................................................................................................................................................103 نمودار 5-10 : مقایسه نتایج خطای RMSEحاصل از اجرای توام مکانیزم تعدیل و تفسیر نظر کاربران و استفاده از روشهای ترکیبی پیمایش شبکه در مقابل روش مورد استفاده در مدل پایه .....................................................................................................................................................................103 نمودار 5-11 : مقایسه نتایج معیار F-measure حاصل از اجرای توام مکانیزم تعدیل و تفسیر نظر کاربران و استفاده از روشهای ترکیبی پیمایش شبکه در مقابل روش مورد استفاده در مدل پایه..............................................................................................................................................................104 نمودار 5-12 : مقایسه نتایج معیار درصد پوشش حاصل از اجرای توام مکانیزم تعدیل و تفسیر نظر کاربران و استفاده از روشهای ترکیبی پیمایش شبکه در مقابل روش مورد استفاده در مدل پایه برای کاربران تازه وارد.....................................................................................................................105 نمودار 5-13 : مقایسه نتایج خطای RMSEحاصل از اجرای توام مکانیزم تعدیل و تفسیر نظر کاربران و استفاده از روشهای ترکیبی پیمایش شبکه در مقابل روش مورد استفاده در مدل پایه برای کاربران تازه وارد.............................................................................................................................106 نمودار 5-14 : مقایسه نتایج معیار F-measureحاصل از اجرای توام مکانیزم تعدیل و تفسیر نظر کاربران و استفاده از روشهای ترکیبی پیمایش شبکه در مقابل روش مورد استفاده در مدل پایه برای کاربران تازه وارد.....................................................................................................................106 نمودار 5-15 : مقایسه نتایج خطای RMSEحاصل از اجرا و بکارگیری مکانیزم تعدیل و تفسیر نظرات کاربران بر روی روشهای ترکیبی انتخاب کاربران و پیمایش شبکه....................109 نمودار 6-1 : مقایسه عملکرد کلی مدل توسعه یافته در مقابل مدل پایه از نظر تمام معیارهای ارزیابی........................................................................................................................................................113 نمودار 6-2 : مقایسه عملکرد کلی مدل توسعه یافته در مقابل مدل پایه برای کاربران تازه وارد از نظر تمام معیارهای ارزیابی................................................................................................................115 فصل اول مقدمه ای بر انواع سیستمهای توصیهگر 1- مقدمهای بر انواع سیستمهای توصیهگر 1-1- مقدمه گسترش سریع و روز افزون اطلاعات ارائه شده بر روی شبکه جهانی اینترنت، کاربران را با مشکلات عدیده و قابل تاملی در خصوص انتخاب منابع و اطلاعات مورد نیاز ایشان مواجه نموده است و چه بسا که بدون راهنمایی و هدایت صحیح، کاربران در اخذ تصمیمات صحیح یا انتخاب کالا و خدمات مورد نیازشان دچار اشتباه شده که این امر تبعات عدیدهای از جمله نارضایتی، سلب اطمینان کاربران و مشتریان سایتهای موجود بر روی اینترنت را به همراه خواهد داشت. از اینرو وجود ابزار و سیستمهایی برای کمک به کاربران در انتخاب اطلاعات مناسب و مورد نیاز ایشان کاملا ضروری به نظر میرسد. در سالهای اخیر برای برآورده سازی این نیازها سیستمهای توصیهگرمطرح و توسعه یافتهاند و الگوریتمها ، مقالات و متون علمی بسیار متنوع و مختلفی در این زمینه مطرح گردیده است . در این میان، ایجاد و گسترش شبکههای اجتماعی، شبکههای اعتماد و وجود انواع روابط میان کاربران این شبکهها افق جدیدی را برروی محققان و توسعه دهندگان سیستمهای توصیهگر گشوده است تا با بهرهگیری از علوم اجتماعی و علوم روان شناختی حاکم در این شبکهها و خصوصا وجود رابطه اعتماد میان کاربران بتوانند نسل جدیدی از سیستمهای توصیهگر را تحت عنوان "سیستمهای توصیهگر مبتنی بر اعتماد[9]"معرفی و عرضه نمایند. این سیستمها قادر هستند تا به درصد بیشتری از کاربران پاسخ مناسب را ارائه دهند و همچنین نتایج آنها از دقت بالاتری برخوردار میباشد. با توجه به کثرت کاربران و افراد عضو شبکههای مبتنی بر اعتماد و شبکههای اجتماعی، همچنین تنوع رفتار و ویژگیهای ایشان، تنها یک شیوه یا یک مدل قادر به پاسخگویی و ارائه پیشنهادات دقیق و قابل قبول نمیباشد که این امر باعث ظهور سیستمهای توصیهگر ترکیبی[10]گردیده است. در این سیستمها سعی شده است تا با ترکیب انواع مختلفی از سیستمهای توصیهگر بتوان سیستمی تولید نمود که دارای مزایای حداکثری و معایب حداقلی باشد. در این پایاننامه سعی شده است تا با تغییر، اصلاح، تلفیق و ترکیب تعدادی از روشها و الگوریتمهای مطرح و قابل قبول در سطح جهانی، مدلی ارائه گردد که نسبت به مدلهای پیشین دارای دقت و درصد پوشش بالاتری باشد و همچنین بتواند نقایص مدلهای پیشین خصوصا در رابطه با ارائه پیشنهاد به کاربران تازه وارد[11] را تا حد قابل قبولی مرتفع نماید. 1-2- سیستمهای توصیهگر تعاریف متفاوتی برای سیستمهای توصیهگر ارائه شدهاست. عدهای از محققان سیستمهای توصیهگر را زیرمجموعهای از سیستمهای تصمیمیار[12] میدانند و آنها را سیستمهای اطلاعاتی[13] تعریف میکنند که توانایی تحلیل رفتارهای گذشته و ارائه توصیههایی برای مسائل جاری را دارا میباشند[1]. به زبان سادهتر در سیستمهای توصیهگر تلاش بر این است تا با حدس زدن شیوه تفکر کاربر به کمک اطلاعاتی که از نحوه رفتار وی یا کاربران مشابه و نظرات آنها داریم مناسبترین و نزدیکترین کالا یا خدمت به سلیقه او را شناسایی و پیشنهاد کنیم. این سیستمها در حقیقت سعی دارند فرایندی را که ما در زندگی روزمره خود بکار میبریم و طی آن تلاش میکنیم تا افرادی با سلایق نزدیک به خود را پیدا کرده و از آنها در مورد انتخابهایمان نظر بخواهیم را شبیه سازی نمایند. به صورت کلیتر سیستمهای توصیهگر زیر مجموعهای از سیستمهای پالایش اطلاعات[14]هستند که وظیفه آنها جستجو برای بیان پیشبینی امتیاز(درجه)[15] یا بیان سلایق و ترجیحات[16] یک کاربر در خصوص یک موضوع[17] ( مانند موسیقی، کتاب یا فیلم) یا یک عنصر اجتماعی مانند افراد و گروهها میباشد[2]–[4]. 1-3- انواع سیستمهای توصیهگر از لحاظ عملکردی سیستمهای توصیهگر به لحاظ نحوه ارائه نتایج و پیشنهادات به کاربران خود، به شیوه های متفاوتی عمل می نمایند که در ذیل به پارهای از آنها به صورت فهرست وار اشاره میگردد:
در این تحقیق سعی در ایجاد مدلی است که بتواند نظرو امتیازتخصیص داده شده توسط یک کاربر خاص به یک محصول یا آیتم خاص را پیشبینی نماید. 1-4- مزایا و اهمیت یک سیستم توصیهگر کارآمد طبق آمار رسمی ارائه شده توسط سایت فروش کتاب Amazon[18] ، 35 درصد از فروش این سایت به واسطه وجود سیستم توصیهگر و ارائه پیشنهادات مناسب به علاقهمندان کتاب می باشد[5]همچنین سایت اجاره فیلم Netflix برای بهبود 10 درصدی دقت سیستم توصیهگر خود موسوم به Cinematch[19]جایزه ای بالغ بر یک میلیون دلار برای محققان در نظر گرفته است. هر دو مثال فوق نشان دهنده اهمیت سیستمهای توصیهگر و نقش آنها در تجارت میباشد. در ذیل تعدادی از دلایل اهمیت وجود یک سیستم توصیهگر مناسب و کارآمد در یک سایت تجارت الکترونیک برشمرده میگردد:
1-5- معایب و مشکلات کلی سیستمهای توصیهگر در مقابل مزایای بیان شده، این سیستمها دارای نواقص و محدودیتهایی نیز می باشند که در ذیل به پاره ای از آنها اشاره میشود:
مشکلات فنی و موانع عدیدهای نیز در خصوص پیادهسازی و ارائه الگوریتم برای سیستمهای توصیهگر وجود دارد که پارهای از آنها عبارتند از:
1-6- انواع رویکردها و مدلهای موجود در زمینه پیادهسازی سیستمهای توصیهگر در سالهای اخیر شیوهها، رویکردها، الگوریتمها و مدلهای متنوع و گوناگونی در زمینه توسعه انواع سیستمهای توصیه گر مطرح گردیده است که از ابعاد مختلف و با نگاههای متفاوتی به مسئله ارائه پاسخ و پیشنهاد مناسب به کاربران پرداختهاند که در این میان، پارهای از مهمترین و معروفترین روشهای موجود به اختصار معرفی میگردند. یکی از متداولترین شیوه های مطرح"پالایش گروهی"میباشد[6]. این شیوه با جمعآوری و آنالیز دادههای موجود در مورد رفتار گذشته کاربران، فعالیتهای ایشان، سلایق آنها و امتیازاتی که به آیتمهای مختلف توسط ایشان داده شده است و همچنین بر اساس تشابه کاربران یا موضوعات با یکدیگر، مدلی ایجاد مینماید و سپس از آن مدل برای پیشبینی آیتمهای مورد علاقه کاربر یا پیشبینی امتیازدهی یک کاربر به یک آیتم خاص استفاده مینماید[7]. یکی دیگر از شیوههای موجود در این زمینه "پالایش محتوایی[22]" میباشد که در این شیوه، مجموعهای از خصوصیات یک آیتم، برای پیشنهاد آیتمهای جدید با خصوصیات مشابه با آن مورد استفاده قرار میگیرد[8]. از هر دو روش فوق نسخههایی نیز به صورت تجاری پیادهسازی شده است که به عنوان مثال سیستم توصیهگر موسیقی بکار رفته در سایت Last.fm[23] بر اساس شیوه پالایش محتوایی پیادهسازی شده است در حالیکه در سایت [24]PandoraRadio از شیوه پالایش گروهی استفاده شده است. یکی دیگر از شیوههای موجود درخصوص تولید سیستمهای توصیهگر، ترکیب هر دو رویکرد فوق تحت عنوان "سیستمهای توصیهگر ترکیبی" میباشد[4]. مطالعات اخیر نشان داده است که در برخی موارد استفاده از ترکیب هر دو شیوه میتواند نتایج موثرتری را ایجاد نماید. این ترکیب میتواند در اشکال و انواع مختلفی صورت گیرد که هر کدام نتایج خاصی را تولید مینمایند[9]. تحقیقات نشان داده است که ترکیب این دو شیوه می تواند برخی از مشکلات هر کدام از روشها را برطرف نموده و نتایج با دقت بالاتری ایجاد نماید، به عنوان مثال، سیستم توصیهگر ایجاد شده در سایتNetflix[25]از یک سیستم ترکیبی بهره میبرد که در آن عادات مشاهده فیلم، توسط کاربران مشابه (شیوه پالایش گروهی)، در کنار ارائه فیلمهایی که به لحاظ مشخصات، مشابه فیلمهایی هستند که توسط کاربر امتیاز بالاتری اخذ نمودهاند (شیوه پالایش محتوایی) در نظر گرفته شده است. با ظهور شبکههای اجتماعی و شبکههای مبتنی بر اعتماد، رویکردها و ایدههای جدیدی در خصوص ایجاد و بهبود سیستمهای توصیهگر، با توجه به ارتباطات میان کاربران و به صورت خاص، وجود رابطه اعتماد میان آنها مطرح گردیدکه منجر به تولید سیستمهای توصیه گر مبتنی بر اعتماد شده است[10]. جهت کپی مطلب از ctrl+A استفاده نمایید نماید |