این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
رایانش نرم و فناوری اطلاعات، جلد ۸، شماره ۲، صفحات ۱-۱۶

عنوان فارسی رتبه‌ بندی ویژگی‌‌ها در تشخیص نظرات اسپم فارسی
چکیده فارسی مقاله یکی از عوامل اصلی در تصمیم‌گیری مشتریان برای خرید یک محصول یا استفاده از خدماتی خاص، استفاده از نظرات برخط است. این‌گونه از نظرات منابعی ارزشمند از اطلاعات هستند که برای تشخیص افکار عمومی در مورد محصول یا خدمات استفاده می‏شوند. اگرچه نظرات برخط می‌توانند مفید باشند اما اعتماد کورکورانه به آن‏ها، هم برای فروشنده و هم برای خریدار خطرناک است زیرا ممکن است برای به‌دست آوردن سود، دستکاری شده باشند که اصطلاحاً به این گونه نظرات « نظرات اسپم» گفته می‌شود. پژوهش حاضر روی نظرات فارسی ثبت‌شده در مورد تلفن همراه در وب‌سایت دیجی‌کالا انجام شده و از میان انواع اسپم، اسپم نوع یک و دو بررسی شده‌اند که نوع اول نظرات جعلی و نوع دوم نظراتی هستند که تنها در رابطه با مدل کالا نوشته شده‏اند. ویژگی‌های مورد استفاده در این پژوهش به علت کارا بودن آن‏ها در دسته‌بندی، شامل ویژگی‌های مبتنی بر نظر و ویژگی‌های فراداده است. این ویژگی‌ها و نیز ترکیب‌های متفاوت از آن‏ها در تشخیص نظرات اسپم فارسی و تأثیر آن‏ها روی دقت دسته‌بند بررسی شده ‌است. دسته‌بندی توسط درخت تصمیم، دسته‌بند ماشین بردار پشتیبان و دسته‌بند نایو بیز انجام شده و در نهایت دقت آن‏ها روی ترکیب‌های مختلف این ویژگی‌ها با هم مقایسه گردیده است. بالاترین میزان دقت به‌دست آمده از سه دسته‌بند توسط درخت تصمیم حاصل می‏شود که برابر با با 778/0 براساس معیار اِف است. در رتبه‎دهی به ویژ‌گی‌ها باز هم درخت تصمیم با دقت 824/0 و با ترکیب سه ویژگی بازخوردهای مثبت، امتیاز کلی کالا و قطبیت نظر رتبه‌ی برتر را به خود اختصاص می‌دهد.
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Feature ranking for Persian Review Spam detection
چکیده انگلیسی مقاله Using online reviews is one of the main factors in customers' decision making for buying a product or using a service. These reviews are valuable sources of information which can be used for detecting public opinion about products or services. Although online reviews are useful, trusting them blindly is dangerous for both costumers and sellers as they may be manipulated to earn profit; such reviews are called spam reviews. The current study addresses Persian reviews about cell-phone extracted from Digikala.com and investigates spam type 1 and type 2 which are fake reviews and reviews describing brands' names only, respectively. Features used in this study, due to their efficiency, are review-based and metadata features. These features and their combinations in detecting Persian spam reviews, also their effect on the accuracy of classifier are assessed. Spam classification is performed using decision tree, support vector machines, and naïve Bayes classifiers and their accuracy are compared using different features' combinations. The highest accuracy is obtained using the decision tree classifier which achieves 0.778 in terms of F-measure. In ranking features, again the decision tree outperforms the other two classifiers by achieving 0.824 F-measure by combining the positive feedback, overall score, and review polarity features.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله نشاط صفریان |
دانشکده مهندسی برق و کامپیوتر، مؤسسه آموزش عالی صفاهان، اصفهان، ایران.

محمد احسان بصیری |
گروه کامپیوتر، دانشکده فنی و مهندسی، دانشگاه شهرکرد، شهرکرد، ایران

هادی خسروی |
دانشکده فنی و مهندسی، دانشگاه شهرکرد، شهرکرد، ایران.


نشانی اینترنتی http://jscit.nit.ac.ir/article_87279_df20f941945a01babc0de419ea3e34af.pdf
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/834/article-834-1646099.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات