این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
دوشنبه 24 آذر 1404
پژوهشنامه پردازش و مدیریت اطلاعات
، جلد ۳۶، شماره ۴، صفحات ۱۰۸۱-۱۱۱۲
عنوان فارسی
استخراج ویژگیهای متنی و معنایی در یادگیری رتبهبندی جهت بازیابی اسناد وب
چکیده فارسی مقاله
با ظهور وب معنایی، تعریف و استفاده از ویژگیهای معنایی در الگوریتمهای یادگیری رتبهبندی هم مطرح شده است. یک چالش مهم در این زمینه عدم استفاده از ویژگیهای جامع و همچنین، عدم ترکیب کامل از ویژگیهای متنی و معنایی است. در این مقاله، با تعریف ویژگیهای معنایی جدید در چهار دسته ویژگیهای مبتنی بر گراف و پایگاه دانش، ویژگیهای مبتنی بر تکرار موجودیت، ویژگیهای مبتنی بر فیلدهای متنی، و ویژگیهای مبتنی بر نمایش برداری کلمات و متون به این چالش پاسخ داده شده است. جهت ارزیابی از مجموعه داده MQ-2007 متعلق به LETOR4، که حاوی ویژگیهای متنی آماده است، و شش الگوریتم یادگیری رتبهبندی استاندارد استفاده شده است. نتایج تجربی نشان میدهد که ویژگیهای معنایی و نیز ترکیب آنها با ویژگیهای متنی باعث بهبود 50 درصدی نسبت به استفاده از تنها ویژگیهای متنی میشوند. در انتها، از یک الگوریتم انتخاب ویژگی برای انتخاب بهترین ویژگیهای معنایی استفاده شده که منجر به بهبود 7 درصدی نسبت به الگوریتمهای رتبهبندی بدون انتخاب ویژگی شده است.
کلیدواژههای فارسی مقاله
یادگیری رتبهبندی، ویژگیهای معنایی، بازیابی اسناد وب، دادههای پیوندی
عنوان انگلیسی
Extraction of Effective Textual and Semantic Features in Learning to Rank for Web Document Retrieval
چکیده انگلیسی مقاله
Ranking algorithms, as the core of web search systems, are responsible for finding and ranking the most relevant documents to user information needs from the crawled and indexed corpus. With the ever-increasing amount of available training data, ranking technologies are moving towards using Machine Learning methods, described as Learning to Rank algorithms. The basic Learning to Rank systems mainly have used textual features while ignoring semantic features. With the advent of Semantic Web, there is an emerging interest in developing and using semantic features for Learning to Rank systems. An important challenge is that there is currently no comprehensive study on the combined usage of textual and semantic features for Learning to Rank systems. In this paper, first, we define and implement four new sets of semantic features based on Knowledge Graph, Entity Repetition, Textual Fields and Vector Representation of Words and Texts. For experimental analysis, we used the MQ-2007 dataset from LETOR 4, which includes a set of textual features. The results of running six standard Learning to Rank Algorithms show that by using semantic features, either in isolation or in combination with textual features, significantly increases the performance. The increase in performance is even more significant when we limit the tests to hard queries. We also implemented an existing Feature Selection algorithm to test whether it can improve the results even further. The results showed improvements for some Learning to Rank algorithms, yet failed to improve on others.
کلیدواژههای انگلیسی مقاله
Learning to Rank, Semantic Features, Web Document Retrieval, Linked Data, Feature Selection
نویسندگان مقاله
محدثه محجوب | Mohaddeseh Mahjoob
Computer and Information Technology Engineering Department; Ferdowsi University; Mashhad, Iran;
دانشکده مهندسی؛ گروه کامپیوتر؛ دانشگاه فردوسی مشهد؛ ایران؛
فائزه انسان | Faezeh Ensan
Faculty of Engineering; Computer and Information Technology Engineering Department; Ferdowsi University; Mashhad, Iran;
دانشکده مهندسی؛ دانشگاه فردوسی مشهد؛ مشهد، ایران؛
ساناز کشوری | Sanaz Keshvari
Faculty of Engineering; Computer and Information Technology Engineering Department; Ferdowsi University; Mashhad, Iran
دانشکده مهندسی؛ گروه کامپیوتر؛ دانشگاه فردوسی مشهد؛ مشهد، ایران؛
پرستو جعفرزاده | Parastoo Jafarzadeh
Faculty of Engineering; Computer and Information Technology Engineering Department; Ryerson University; Toronto, Canada;
گروه مهندسی برق کامپیوتر و بیومدیکال؛ دانشگاه رایرسون، کانادا؛
محمد امین کیوان زاد | Mohammadamin keyvanzad
Faculty of Computer Science; University of New Brunswick; New Brunswick, Canada;
مهندسی کامپیوتر؛ دانشگاه نیوبرانزویک، کانادا
نشانی اینترنتی
http://jipm.irandoc.ac.ir/browse.php?a_code=A-10-6397-1&slc_lang=fa&sid=1
فایل مقاله
فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
فناوری اطلاعات
نوع مقاله منتشر شده
پژوهشی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات