این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
یکشنبه 30 آذر 1404
پردازش علائم و داده ها
، جلد ۱۲، شماره ۴، صفحات ۴۳-۵۲
عنوان فارسی
ویرایشگر متن شریف: سامانۀ ویرایش و خطایابی املایی زبان فارسی
چکیده فارسی مقاله
در مقالۀ حاضر سامانهای هوشمند جهت ویرایش و خطایابی املایی متون فارسی معرفی شدهاست. هدف از طراحی و ایجاد این سامانه، ویرایش متون فارسی برای کاربردهای پردازش زبان طبیعی است. این سامانه بر مبنای یک رویکرد مهندسی قابل توسعه، از سه زیرسامانه تشکیل شدهاست: ویرایشگر متن فارسی معیار، خطایاب املایی خودکار زبان فارسی و ستاکیاب واژگان زبان فارسی. این سه بخش با یکدیگر در تعاملند؛ بدین شکل که ابتدا ستاک واژههای متن شناسایی میشود و در صورت عدم وجود ستاک در فهرست واژههای زبان، واژۀ مذکور به عنوان واژهای نادرست شناسایی خواهدشد و سپس خطایاب خودکار فهرستی از واژههای جایگزین را پیشنهاد خواهدکرد. در زیرسامانۀ ویرایشگر، متن موجود ویرایش شده و متنی یکپارچه که منطبق بر معیارهای مصوب فرهنگستان زبان و ادب فارسی است، به کاربر ارائه خواهد شد. نتایج ارزیابی نشاندهندۀ دقتی بسیار خوب در حدود 95% در ستاکیابی کلمات، 92% در ویرایش و 96% در خطایابی املایی زبان فارسی است.
کلیدواژههای فارسی مقاله
عنوان انگلیسی
Sharif Text Editor: A Persian Editor and Spell Checker System
چکیده انگلیسی مقاله
In this paper, we will introduce an intelligent system to edit and spell check Persian texts. The goal is editing and preprocessing Persian texts for natural language processing tasks. This system is based on an expandable and engineering approach and is composed of three subsystems: Persian text editor, spell checker and stemmer. These parts interact with each other to edit texts. To do this, the stemmer subsystem process each word in the text if the subsystem could not find a stem in the lexicon, the word will be recognized as an incorrect word. Then, the spell checker provides a list of suggestions to correct the wrong word. Subsequently, the editor subsystem edits the text based on the standards of the Academy of Persian Language and Literature. Our evaluation shows nearly 92%, 95% and 96% precision numbers for editor, stemmer and spell checker subsystems, respectively.
کلیدواژههای انگلیسی مقاله
نویسندگان مقاله
بهرام وزیرنژاد |
دانشگاه صنعتی شریف، ساختمان ابن سینا، طبقه چهارم، مرکز زبان ها و زبان شناسی
سازمان اصلی تایید شده
: دانشگاه صنعتی شریف (Sharif university of technology)
فاطمه سلطانزاده |
دانشگاه صنعتی شریف، ساختمان ابن سینا، طبقه چهارم، مرکز زبان ها و زبان شناسی
سازمان اصلی تایید شده
: دانشگاه صنعتی شریف (Sharif university of technology)
محسن مهدوی |
دانشگاه صنعتی شریف، ساختمان ابن سینا، طبقه چهارم، مرکز زبان ها و زبان شناسی
سازمان اصلی تایید شده
: دانشگاه صنعتی شریف (Sharif university of technology)
مهدی مرادی |
دانشگاه صنعتی شریف، ساختمان ابن سینا، طبقه چهارم، مرکز زبان ها و زبان شناسی
سازمان اصلی تایید شده
: دانشگاه صنعتی شریف (Sharif university of technology)
نشانی اینترنتی
http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-84-4&slc_lang=fa&sid=fa
فایل مقاله
اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-233337.pdf
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
مقالات پردازش متن
نوع مقاله منتشر شده
پژوهشی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات