این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
شنبه 6 دی 1404
International Journal of Information and Communication Technology Research (IJICT
، جلد ۶، شماره ۳، صفحات ۲۵-۳۹
عنوان فارسی
چکیده فارسی مقاله
کلیدواژههای فارسی مقاله
عنوان انگلیسی
Analyzing Content-based Heuristics for Persian Web Spam Detection
چکیده انگلیسی مقاله
The rapid growth of web spam in the World Wide Web has motivated researchers to propose algorithms for combating web spam. Despite using these techniques, the search engines do not perform well in detecting Persian spam websites. In this paper, we analyze the effectiveness of many previously proposed content-based features on detecting Persian spam websites, and also present a number of new content-based features. As another approach, we explain and examine our Bag-Of-Spam-Words (BOSW) method to do web spam detection. In this method, we represent each document as a vector of specific words selected from a spam corpus. Finally, we apply a number of feature selection methods and use various kinds of classification algorithms to classify the Persian websites. For this purpose, we have created a dataset of Persian hosts. Our results show that using the BOSW method with the SVM classifier has the best performance in detecting Persian spam websites.
کلیدواژههای انگلیسی مقاله
Persian web spam, web spam detection, cotent-based features
نویسندگان مقاله
| Elahe Rabbani
| Azadeh Shakery
نشانی اینترنتی
http://ijict.itrc.ac.ir/browse.php?a_code=A-10-27-95&slc_lang=fa&sid=1
فایل مقاله
اشکال در دسترسی به فایل - ./files/site1/rds_journals/417/article-417-1212398.pdf
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
فناوری اطلاعات
نوع مقاله منتشر شده
پژوهشی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات