این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پژوهشنامه پردازش و مدیریت اطلاعات، جلد ۳۶، شماره ۳، صفحات ۷۹۱-۸۱۶

عنوان فارسی ارائه روشی مبتنی بر ژنتیک برای رفع ابهام نام نویسندگان مقالات
چکیده فارسی مقاله امروزه، با افزایش روزافزون حجم مقالات از یک طرف و استفاده از اینترنت و خدمات موتورهای جست‌وجو از طرف دیگر، روش‌های ابهام‌زدایی از اسامی پژوهشگران بسیار مورد توجه قرار گرفته است. تاکنون روش‌های مختلفی برای حل این مشکل ارائه شده که هر یک مزایا و معایب خاص خود را دارند. هدف این مقاله ارائه راهکاری جهت شناسایی رکوردهای متعددی است که به یک نویسنده تعلق دارند. بدین‌منظور بعد از استخراج ویژگی‌های داخلی و خارجی نویسندگان، یک معیار جدید جهت مشخص‌کردن میزان مشابهت میان دو رکورد ارائه شده است. اهمیت هر یک از ویژگی‌های ارائه‌شده با استفاده از الگوریتمی مبتنی بر ژنتیک با دو تابع برازش مختلف تعیین می‌شود تا از طریق یادگیری نمونه‌های موجود بهینه‌ترین ضرایب به‌دست آید. روش پیشنهادی با دو تابع برازش روی داده‌های آزمایشی مورد ارزیابی و مقایسه قرار گرفته و نتایج حاصل نشان‌دهنده افزایش دقت در روش پیشنهادی با هر دو تابع برازش نسبت به روش‌ قبلی است.
کلیدواژه‌های فارسی مقاله ابهام نام نویسندگان، فاصله لونشتین، الگوریتم ژنتیک، تابع برازش

عنوان انگلیسی A Genetic-based Approach for Author Name Disambiguation Problem
چکیده انگلیسی مقاله In the recent years, with the increasing volume of articles and the use of Internet and search engine services, the author name disambiguation problem has received a lot of attention. Name disambiguation can occur when one is seeking a list of publications of an author who has used different name variations and also when there are multiple other authors with the same name. So far, various methods have been proposed to solve this problem, each of which has its own advantages and disadvantages. Despite years of research, the name disambiguation problem remains largely unresolved. In this study, we propose an algorithm to identify several records that belong to one author. For this purpose, a new criterion has been proposed to determine the similarity between the two records. Since this study addresses the approximate matching of authors' records, the importance of the fields in each record is determined by the coefficients. In order to get the optimal coefficients, we propose a genetic algorithm to learn from the available samples. The proposed method has been evaluated with two fitness functions on experimental data and the results are promising.
کلیدواژه‌های انگلیسی مقاله Name Disambiguation Problem, Levenshtein Distance, Genetic Algorithm, Fitness Function

نویسندگان مقاله نیلوفر مظفری | Niloofar Mozafari
Regional Information Center for Science and Technology; Islamic World Science Citation Center; Shiraz, Iran
مرکز منطقه‌ای اطلاع‌رسانی علوم و فناوری؛ پایگاه استنادی علوم جهان اسلام؛ شیراز، ایران؛


نشانی اینترنتی http://jipm.irandoc.ac.ir/browse.php?a_code=A-10-7185-1&slc_lang=fa&sid=1
فایل مقاله فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده ذخیره و بازیابی
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات