این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پژوهشنامه پردازش و مدیریت اطلاعات، جلد ۲۹، شماره ۲، صفحات ۴۵۳-۴۷۶

عنوان فارسی شناسایی نویسندگان پیام های الکترونیکی از طریق واکاوی نوع و سبک نگارش آن ها مبتنی بر روش های یادگیری ماشین(WKF based on SVM-PHGS)
چکیده فارسی مقاله شناسایی نویسنده یکی از مسایل مهم در دسته بندی متن و پردازش زبا نهای طبیعی به شمار می رود. این نوشتار دستآورد پژوهشی با هدف تعیین هوشمند نوشته های 50 نویسنده سایبری(50 نفر از مشتریان بالقوه ی وب سایت آمازون با توجه به پیام ها و مراجعاتی که به این وب سایت داشته اند انتخاب شده اند) به کمک روش های یادگیری ماشین است. برای سنجش کارایی روش پیشنهادی، دقت تصمیم گیری آزموده و نتایج آنها با بازدهی روش های یادگیری ماشین مقایسه شده است. همچنین در هنگام استخراج ویژگیهای گوناگون نوشته های نویسندگان برای ارزیابی توسط ماشین، کوشش شده تا حداکثر ویژگی های مورد نیاز برای تشخیص نویسنده شبیه سازی گردد و بدین منظور، نزدیک به10000 ویژگی گوناگون از نوشته های مختلف استخراج شده و در چهار دسته ی ویژگی های لغوی ، ویژگی های نحوی ، ویژگی های خاص و ویژگی های ساختاری قرار گرفته اند. در این پژوهش به طور میانگین دقت تعیین نویسنده به کمک روش پیشنهادی تا 98/78 درستی نیز رسیده است.
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Identify the Authors of Electronic Messages Through the Analysis of the Type and Style Based on Machine Learning Technique
چکیده انگلیسی مقاله Identifying the author of an electroni message is one of the main problems in text classification and natural language processing. The aim of this article is to determine the authors of 50 cyber messages (by 50 potential customers, according to Amazon 's website), by a machine learning methods. To evaluate the effectiveness of the proposed method, the decision was carefully tested and the results were compared with the performance of machine learning methods. Also, when extracting various features of authors' writing style for evaluation by machine, we tried to maximize the features required to identify a writer. Therefore, nearly 10,000 different features were extracted from different entries in four categories: lexical features, syntactic features, special features and structural features. In this study, the average accuracy of the proposed method reached to 98. 78.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله سمیرا زنگویی | samira zangoei


حسنعلی نعمتی شمس آباد | hassanali nemati shamsabad



نشانی اینترنتی http://jipm.irandoc.ac.ir/browse.php?a_code=A-10-1859-1&slc_lang=fa&sid=fa
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/1504/article-1504-252325.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده فناوری اطلاعات
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات