این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
دوشنبه 24 آذر 1404
پژوهشنامه پردازش و مدیریت اطلاعات
، جلد ۳۷، شماره ۳، صفحات ۸۰۷-۸۳۸
عنوان فارسی
ارائه روشی نوین برای استخراج خودکار چهریزهها در جستجوهای چهریزهای (مورد مطالعه: حوزه زنان و زایمان)
چکیده فارسی مقاله
هدف این پژوهش ابداع و معرفی الگوریتمی نوین برای استخراج چهریزهها ست که امکان تجربی شناسایی چهریزهها با کمک پشتوانه انتشاراتی را فراهم میکند. الگوریتم پیشنهادی بر مبنای دو ایده شکل گرفته است: ایده اول این است که چهریزه در بافت بروز پیدا میکند. بنابراین برای تشخیص چهریزه در یک بدنه متنی بایستی بافت یا بستر آن مورد بررسی قرار گیرد و ایده دوم این است که چهریزه نقطه تمرکز در یک درخت واژگانی است که نه بسیار عام و نه بسیار خاص است. در حوزه پزشکی، دامنه زنان و زایمان به عنوان بستر آزمون انتخاب گردید. سه پیکرهی متنی از درون پشتوانه انتشاراتی انتخاب شد. پیکرهی بستر، از چکیده و عنوان مجموعه مقالات موجود در 20 مجله برتر حوزه انتخاب شد که در برگیرنده 167071 سند بود. پیکره دوم، پیکره منشاء بود که 2000 مقاله به صورت تصادفی از پیکره بستر، انتخاب شد. پیکره سوم، پیکره واژگانی است که با استفاده از یک سرویس تحت وب و معیار رتبهبندی واژگان LIDF-value استخراج گردید. خروجی حاصل، در برگیرنده 514 واژه بود. واژگان تکراری حذف شدند و در نهایت 480 واژه مهم شناسایی شد. سپس، واژگان در پیکره بستر با کمک مجموعه راهنما یعنی Mesh ، بسط داده شد و پس از آن بر اساس دو شرط انتقال مبتنی بر تکرار یعنی بیشتر بودن اسناد مرتبط با واژه در بستر نسبت به منشاء و انتقال مبتنی بر رتبه یعنی رشد رتبه موجود واژه در پیکره بستر نسبت به منشاء که نشاندهنده عام شدن واژه است، چهریزههای کاندید استخراج شدند. در نهایت با استفاده از سه قاعدهی اخص بودن، جایگزنی و اعم بودن، چهریزههای شناسایی شده اصلاح و نامگذاری شدند. در نهایت 26 چهریزه به عنوان چهریزههای حوزه زنان و زایمان شناسایی شدند. با مقایسه الگوریتم پیشنهادی با دیگر الگوریتمها مشخص شد که ایجاد سه افراز (افراز منشاء و بدنه متنی و افراز برای شناسایی واژگان مهم) و مقایسه رفتار واژه در آنها و سپس ایجاد درخت بر اساس چهریزههای کاندید یعنی ترکیب رویکرد آماری و هرس درخت میتواند نتایج مناسب تری نسبت به رویکرد صرفاً آماری یا هرس درخت داشته است. همچنین، مقایسه چهریزههای خروجی از الگوریتم و چهریزههای سنتی در این زمینه نشان داد که چهریزههای خروجی الگوریتم، خردتر و برای مرور در ابزارهای بازیابی اطلاعات مفیدتر هستند. همچنین،در این پژوهش مشخص شد که چهریزههای دامنه تخصصی از چهریزههای عمومی در حوزه پزشکی متفاوت است و مستقل از آنها قابل شناسایی و تعریف است اما نمیتوان، نتایج را به تمامی دامنههای پزشکی تعمیم داد و نیاز است پژوهشهای دیگری در دیگر حوزهها صورت گیرد.
کلیدواژههای فارسی مقاله
بازیابی اطلاعات، چهریزه، جستجوی چهریزهای، استخراج خودکار چهریزه.
عنوان انگلیسی
Introducing a novel method for Automatic facet extraction in the faceted search (Case Study: gynecology and obstetrics domain)
چکیده انگلیسی مقاله
In this research, a new algorithm for facets extraction has been developed and introduced, which provides the experimental possibility of identifying facets based on a literary warrant. In the field of automatic facet extraction, two main ideas were considered by reviewing the researches. The first idea is that the facet appears in the context. Therefore, to identify the facet in a corpus, its context must be examined. The second idea is that the facet is the focal point in a lexical tree that is neither very general nor very specific. Based on these two ideas, first, the corpus in the medicine area and the obstetrics and gynaecology domain was prepared. The research team selected three corpora from the literary warrant and used the abstract and title of the collection of articles in the top 20 journals of the field to create a contextual corpus. This collection contained 167071 documents. 2000 articles were randomly selected to create the origin corpus. The third body is the lexical corpus. The proper words of the corpus were extracted using a web-based service. The output contained 514 words. Duplicate words were removed and finally, 480 important words were identified. Then, the words were expanded in the contextual corpus with the help of the guide set- Mesh and then-candidate dissertations were extracted based on the two conditions of frequency-based Shifting and rank-based Shifting. Finally, using the three rules of specificity, substitution, and generality, the identified facets were modified and named. Finally, 26 facets were identified in the domain of gynaecology and obstetrics. Comparing the proposed algorithm with other algorithms, it was found that the combination of statistical approach and tree pruning can have better results than purely statistical approach or tree pruning. Also, the comparison of the output facets of the algorithm with the traditional facets in this obstetrics and gynaecology domain showed that the output of the algorithm is smaller and more useful for browsing information retrieval tools. Also, in this study was specified that specialized domain facets are different from general facets and can be redefined independently, but the results cannot be generalized to all medical domains and other research needs to be done in other fields.
کلیدواژههای انگلیسی مقاله
data retrieval, facet, faceted search, automatic facet extraction.
نویسندگان مقاله
عبدالحسین فرجپهلو | Abdolhossein Farajpahlou
School of Education & Psychology; Shahid Chamran University; Ahvaz, Iran;
دانشگاه شهید چمران اهواز؛ اهواز؛ ایران.
فریده عصاره | Farideh Osareh
School of Education & Psychology; Shahid Chamran University; Ahvaz, Iran;
دانشگاه شهید چمران اهواز؛ اهواز؛ ایران.
سید مصطفی فخراحمد | Seyed Mostafa Fakhrahmad
Department of Computer Science and Engineering & IT; Shiraz University; Shiraz, Iran
دانشگاه شیراز؛ شیراز؛ ایران.
لیلا دهقانی | Leila Dehghani
Medical librarianship group, Department of Paramedical Medicine ; Bushehr University of Medical Sciences; Bushehr, Iran
دانشگاه علوم پزشکی بوشهر؛ بوشهر؛ ایران.
نشانی اینترنتی
http://jipm.irandoc.ac.ir/browse.php?a_code=A-10-9185-1&slc_lang=fa&sid=1
فایل مقاله
فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
ذخیره و بازیابی
نوع مقاله منتشر شده
پژوهشی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات