این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
دوشنبه 1 دی 1404
پردازش علائم و داده ها
، جلد ۱۲، شماره ۴، صفحات ۸۳-۹۴
عنوان فارسی
تشخیص خودکار جنسیت نویسنده در متون فارسی
چکیده فارسی مقاله
با گسترش روز افزون استفاده از اینترنت، شاهد تبادل هزاران گیگابایت اطلاعات متنی در فضای مجازی هستیم. فضای سایبر این امکان را به اشخاص میدهد که هویت حقیقی خود را مخفی کنند و با هویت ساختگی جدیدی وارد آن شوند. از اینرو اهمیت حفظ امنیت این فضا، کنترل بر محتوای تولید شده توسط کاربران و شناسایی مشخصات تولیدکنندگان محتوا هر روز پررنگتر میشود. موضوع مورد بررسی در این تحقیق که مربوط به حوزه شناسایی نویسنده میباشد، شناسایی خودکار جنسیت نویسنده متن فارسی است. به منظور شناسایی جنسیت، با توجه به مطالعات زبان-روانشناختی صورت گرفته، 48 ویژگی روانشناختی و سبک شناسی تعریف شد. دو پیکره متنی جهت آموزش طبقه بندها تهیه شد و سپس برای شناسایی جنسیت، سه الگوریتم یادگیری ماشینی مختلف (ماشین بردار پشتیبان، بیز ساده و درخت تصمیم) طراحی شد. نتایج اعتبارسنجی متقابل10تایی نشان داد که بیشترین دقت مربوط به طبقهبند درخت تصمیم با دقت %73.8 است.
کلیدواژههای فارسی مقاله
تشخیص جنسیت، شناسایی نویسنده، متن کاوی
عنوان انگلیسی
automatic gender identification in persian text
چکیده انگلیسی مقاله
Gigantic amount of textual data being transfers in web everyday. like other communities,cyberspace is vulnerable to attacks, false information and deception.it becomes increasingly important to design an efficient method to trace identity in this community.to investigate the problem of gender identification,we propose 48 feature,and design three machine learning algorithms.the results of study showed that ADtree classifier had accuracy up to 73.8%.
کلیدواژههای انگلیسی مقاله
gender identification,author identification,text mining
نویسندگان مقاله
مهدی مرادی |
تهران- طرشت- کوچه اویار قاسم-خوابگاه شهید شوریده
محمد بحرانی |
دانشگاه صنعتی شریف
سازمان اصلی تایید شده
: دانشگاه صنعتی شریف (Sharif university of technology)
نشانی اینترنتی
http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-338-1&slc_lang=fa&sid=fa
فایل مقاله
اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-233340.pdf
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
مقالات پردازش متن
نوع مقاله منتشر شده
پژوهشی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات