این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پردازش علائم و داده ها، جلد ۱۲، شماره ۴، صفحات ۸۳-۹۴

عنوان فارسی تشخیص خودکار جنسیت نویسنده در متون فارسی
چکیده فارسی مقاله با گسترش روز افزون استفاده از اینترنت، شاهد تبادل هزاران گیگابایت اطلاعات متنی در فضای مجازی هستیم. فضای سایبر این امکان را به اشخاص می‌دهد که هویت حقیقی خود را مخفی کنند و با هویت ساختگی جدیدی وارد آن شوند. از این‌رو اهمیت حفظ امنیت این فضا، کنترل بر محتوای تولید شده توسط کاربران و شناسایی مشخصات تولیدکنندگان محتوا هر روز پررنگتر می‌شود. موضوع مورد بررسی در این تحقیق که مربوط به حوزه‌ شناسایی نویسنده می‌باشد، شناسایی خودکار جنسیت نویسنده متن فارسی است. به منظور شناسایی جنسیت، با توجه به مطالعات زبان-روانشناختی صورت گرفته، 48 ویژگی روان‌شناختی و سبک شناسی تعریف شد. دو پیکره متنی جهت آموزش طبقه بندها تهیه شد و سپس برای شناسایی جنسیت، سه الگوریتم یادگیری ماشینی مختلف (ماشین بردار پشتیبان، بیز ساده و درخت تصمیم) طراحی شد. نتایج اعتبارسنجی متقابل10تایی نشان داد که بیشترین دقت مربوط به طبقهبند درخت تصمیم با دقت %73.8 است.
کلیدواژه‌های فارسی مقاله تشخیص جنسیت، شناسایی نویسنده، متن کاوی

عنوان انگلیسی automatic gender identification in persian text
چکیده انگلیسی مقاله Gigantic amount of textual data being transfers in web everyday. like other communities,cyberspace is vulnerable to attacks, false information and deception.it becomes increasingly important to design an efficient method to trace identity in this community.to investigate the problem of gender identification,we propose 48 feature,and design three machine learning algorithms.the results of study showed that ADtree classifier had accuracy up to 73.8%.
کلیدواژه‌های انگلیسی مقاله gender identification,author identification,text mining

نویسندگان مقاله مهدی مرادی |
تهران- طرشت- کوچه اویار قاسم-خوابگاه شهید شوریده

محمد بحرانی |
دانشگاه صنعتی شریف
سازمان اصلی تایید شده: دانشگاه صنعتی شریف (Sharif university of technology)


نشانی اینترنتی http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-338-1&slc_lang=fa&sid=fa
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-233340.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده مقالات پردازش متن
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات