این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
یکشنبه 23 آذر 1404
مجله اپیدمیولوژی ایران
، جلد ۱، شماره ۳، صفحات ۴۱-۴۵
عنوان فارسی
بهکارگیری متغیرهای پنهان در مدل رگرسیون لجستیک برای حذف اثر همخطی چندگانه در تحلیل برخی عوامل مرتبط با سرطان پستان
چکیده فارسی مقاله
مقدمه و اهداف: رگرسیون لجستیک یکی از کاربردیترین مدلهای خطی تعمیمیافته برای تحلیل رابطهی یک یا چند متغیر توضیحی بر متغیر پاسخ رستهای است. زمانی که بین متغیرهای توضیحی همبستگیهای نسبتا قوی وجود داشته باشد همخطی چندگانه ایجاد شده، ممکن است به کاهش کارآیی مدل منجر شود. هدف این تحقیق استفاده از متغیرهای پنهان برای کاهش اثر همخطی چندگانه در تحلیل یک مطالعه مورد ـ شاهدی است.روش کار: دادههای مورد استفاده در این تحقیق متعلق به یک مطالعه مورد ـ شاهدی است که در آن 300 نفر زن مبتلا به سرطان پستان با 300 زن شاهد از نظر عوامل خطر مورد مقایسه قرار گرفتند. برای بررسی اثر همخطی، پنج متغیر کمی که بین آنها همبستگی بالایی وجود داشت، در نظر گرفته شدند. ابتدا مدل لجستیک به متغیرهای فوق برازش داده شد. سپس به منظور حذف اثر همخطی، دو متغیر پنهان با استفاده از هرکدام از دو روش تحلیل عاملی و تحلیل مؤلفههای اصلی بهدست آورده، بر مبنای آنها پارامترهای مدلهای لجستیک مجدداً محاسبه شدند. کارآیی مدلها، با استفاده از خطای استاندارد پارامترها مقایسه گردید. نتایج: مدل رگرسیون لجستیک براساس متغیرهای اولیه حاکی از مقادیر غیرعادی نسبت شانس برای سن در اولین زایمان زنده (453503 و 10184==%95CI و 67960OR=) و سن در اولین حاملگی (000029/0OR=) بود. درحالی که پارامترهای مدلهای لجستیک حاصل از متغیرهای پنهان به دست آمده از هر دو روش تحلیل عامل و تحلیل مؤلفههای اصلی، از نظر آماری معنی دار (003/0>p) و خطای استاندارد همهی آنها کوچکتر از خطای استاندارد مربوط به رگرسیون لجستیک معمولی بود. فاکتورها و مولفههای اصلی تولید شده توسط دو روش حداقل 85 درصد کل واریانس را تبیین کردند. نتیجهگیری: تحقیق نشان داد انحراف استاندارد پارامترهای برآورد شده در رگرسیون لجستیک براساس متغیرهای پنهان از رگرسیون لجستیک براساس مشاهدات اولیه کوچکتر بوده و در نتیجه اینگونه مدلبندی در تحلیل برخی عوامل خطر سرطان پستان که همخطی دارند کارآتر است.
کلیدواژههای فارسی مقاله
عنوان انگلیسی
Using Latent Variables to Eliminate Multicollinearity Effect in A Logistic Regression on Risk Factors for Breast Cancer
چکیده انگلیسی مقاله
Background and Objectives: Logistic regression is one of the most widely used generalized linear models for analysis of the relationships between one or more explanatory variables and a categorical response. Strong correlations among explanatory variables (multicollinearity) reduce the efficiency of model to a considerable degree. In this study we used latent variables to reduce the effects of multicollinearity in the analysis of a case-control study. Methods: Our data came from a case-control study in which 300 women with breast cancer were compared to 300 controls. Five highly correlated quantitative variables were selected to assess the effect of multicollinearity. First, an ordinary logistic regression model was fitted to the data. Then, to remove the effect of multicollinearity, two latent variables were generated using factor analysis and principal components analysis methods. Parameters of logistic regression were estimated using these latent as explanatory variables. We used the estimated standard errors of the parameters to compare the efficiency of models. Results: The logistic regression based on five primary variables produced unusual odds ratio estimates for age at first pregnancy (OR=67960, 95%CI: 10184-453503) and for total length of breast feeding (OR=0). On the other hand, the parameters estimated for logistic regression on latent variables generated by both factor analysis and principal components analysis were statistically significant (P< 0.003). The standard errors were smaller than with ordinary logistic regression on original variables. The factors and components generated by the two methods explained at least 85% of the total variance. Conclusions: This research showed that the standard errors of the estimated parameters in logistic regression based on latent variables were considerably smaller than that of model for original variables. Therefore models including latent variables could be more efficient when there is multicollinearity among the risk factors for breast cancer.
کلیدواژههای انگلیسی مقاله
نویسندگان مقاله
محمد امین پورحسینقلی | ma pourhosseingholi
biostatistician, shaheed beheshti university of medical sciences
کارشناس ارشد آمار زیستی، دانشگاه علوم پزشکی شهید بهشتی، تهران
سازمان اصلی تایید شده
: دانشگاه علوم پزشکی شهید بهشتی (Shahid beheshti university of medical sciences)
یدا محرابی | y mehrabi
associate professor of medical statistics, shaheed beheshti university of medical sciences,
2دانشیار آمار زیستی، دانشگاه علوم پزشکی شهید بهشتی، تهران
سازمان اصلی تایید شده
: دانشگاه علوم پزشکی شهید بهشتی (Shahid beheshti university of medical sciences)
حمید علوی مجد | h alavi majd
assistant professor of biostatistics, shaheed beheshti university of medical sciences
استادیار آمار زیستی، دانشگاه علوم پزشکی شهید بهشتی، تهران
سازمان اصلی تایید شده
: دانشگاه علوم پزشکی شهید بهشتی (Shahid beheshti university of medical sciences)
پروین یاوری | p yavari
associate professor of epidemiology, shaheed beheshti university of medical sciences
استاد اپیدمیولوژی، دانشگاه علوم پزشکی شهید بهشتی، تهران
سازمان اصلی تایید شده
: دانشگاه علوم پزشکی شهید بهشتی (Shahid beheshti university of medical sciences)
نشانی اینترنتی
http://irje.tums.ac.ir/browse.php?a_code=A-10-25-196&slc_lang=fa&sid=fa
فایل مقاله
فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
عمومی
نوع مقاله منتشر شده
پژوهشی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات