این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
پنجشنبه 4 دی 1404
مدیریت صنعتی
، جلد ۱۶، شماره ۴، صفحات ۵۹۷-۶۳۰
عنوان فارسی
قیمتگذاری پویای کلاسهای مشتریان در سیستمهای حملونقل ریلی با استفاده از الگوریتم شبکۀ عمیق Q
چکیده فارسی مقاله
هدف: در این پژوهش به بررسی مسئلۀ قیمتگذاری پویا در سیستمهای حملونقل ریلی با استفاده از تکنیکهای پیشرفته یادگیری تقویتی عمیق پرداخته شده است. هدف اصلی این پژوهش، بهینهسازی درآمد شرکتهای حملونقل ریلی، از طریق ایجاد سیاست فروش بلیت است که بتواند قیمت بلیت را با در نظر گرفتن کلاسهای خدماتی بهصورت پویا تنظیم کند. این رویکرد به شرکتهای حملونقل ریلی این امکان را میدهد تا با تنظیم دقیقتر قیمتها، بر اساس تقاضای مسافران، درآمد بیشتری کسب کنند و سودآوری خود را بهبود بخشند. روش: در این پژوهش، بهمنظور حل مسئله قیمتگذاری پویا، از الگوریتم شبکۀ عمیق Q، یکی از الگوریتمهای پُرکاربرد یادگیری تقویتی عمیق، بهره گرفته شده است. این الگوریتم یک الگوریتم پیشگامانه است که شبکههای عصبی عمیق را با یادگیری Q ترکیب میکند. در الگوریتم شبکۀ عمیق Q، شبکههای عصبی عمیق وظیفۀ تقریب مقادیر Q را بهجای جدول پُرهزینۀ Q برعهده دارند. یک شبکۀ عصبی عمیق میتواند حالت فعلی و یک عمل ممکن را مشاهده کند و بهصورت مستقیم مقدار Q را تقریب بزند. توانایی الگوریتم شبکۀ عمیق Q در یادگیری سیاستهای بهینه در محیطهای پیچیده، این الگوریتم را به یک الگوریتم پُرکاربرد تبدیل کرده است. با توجه به این نکته که مدلهای یادگیری تقویتی، اغلب برای تحلیل بیش از حد پیچیده بهکار میروند، تحلیل استراتژیهای قیمتگذاری متفاوت، فقط با آزمایشهای عددی و شبیهسازی بهدست میآیند. یافتهها: نتایج شبیهسازیها نشان میدهد که الگوریتم شبکۀ عمیق Q، بهطور موفقیتآمیزی به یک سیاست قیمتگذاری پایدار همگرا تبدیل شده است. در این مطالعه، شاخصهای عملکردی مختلفی مانند درآمد کل، ظرفیت باقیمانده، میانگین قیمتهای ارائهشده به مشتریان و تعداد بلیتهای فروختهشده در هر کلاس خدماتی بررسی شد. الگوریتم در مراحل اولیه با نرخ یادگیری بالا بهبود و بهتدریج به پایداری و ثبات دست یافت. میانگین درآمد کل، پس از 5000 تکرار، به مقدار 225 هزار همگرا میشود. این مقدار نشاندهندۀ آن است که این شرکت بهطور متوسط، از هر قطار 225 هزار واحد پولی درآمد کسب میکند. میانگین ظرفیت باقیمانده نیز پس از حدود 3000 تکرار، به مقدار صفر نزدیک میشود. همگرایی نمودار میانگین ظرفیت باقیمانده به صفر، نشاندهندۀ این است که عامل یادگیری تقویتی، بهطور مؤثری یاد گرفته است که برای حداکثرسازی درآمد کل، میبایست تمامی بلیتهای موجود را به فروش برساند. شاخص میانگین قیمتهای پیشنهادی به مشتریان، پس از حدود 7500 تکرار به یک حالت پایدار میرسد، به این معنا که الگوریتم به یک سیاست قیمتگذاری بهینه دست پیدا کرده است. در این وضعیت، میانگین قیمتها در محدوده 680 تا 700 واحد پولی باقی میماند و نوسانهای چشمگیری مشاهده نمیشود. به عبارت دیگر، مدل یادگیری تقویتی بر اساس شاخص میانگین قیمتهای پیشنهادی همگرا شده است. در نهایت، پس از حدود 5000 تکرار، میانگین تعداد بلیت فروخته شده برای تمامی کلاسهای خدماتی، به یک سطح تقریباً ثابت و پایدار میرسد. میانگین تعداد بلیت فروخته شده برای کلاس اکونومی، حدود 175 تا 180 بلیت، کلاس بیزینس حدود 130 تا 135 بلیت، کلاس ویژه حدود 60 تا 65 بلیت و کلاس هتل حدود 23 تا 25 بلیت بهدست آمد. نتیجهگیری: نتایج این پژوهش نشان میدهد که پس از حدود 7500 تکرار، الگوریتم شبکۀ عمیق Q به یک سیاست بهینه و پایدار رسیده است و تغییرات چشمگیری در عملکرد مشاهده نمیشود. همچنین میتوان نتیجه گرفت که استفاده از الگوریتم شبکۀ عمیق Q در قیمتگذاری پویا، میتواند به بهبود چشمگیری در مدیریت درآمد سیستمهای حملونقل ریلی منجر شود. این الگوریتم با قابلیت یادگیری و سازگاری با شرایط متغیر، قادر است که سیاستهای قیمتگذاری مؤثری را با هدف حداکثرسازی درآمد بهکار گیرد و همچنین، تعداد بهینۀ بلیتهای فروختهشده در هر کلاس خدماتی را تعیین کند. این دستاوردها میتوانند به شرکتهای حملونقل ریلی در بهبود راهبردهای قیمتگذاری و افزایش بهرهوری اقتصادی کمک شایانی کنند.
کلیدواژههای فارسی مقاله
قیمتگذاری پویا،یادگیری تقویتی عمیق،حملونقل ریلی،
عنوان انگلیسی
Dynamic Pricing of Customer Classes in Rail Transportation Systems Using Deep Q Network Algorithm
چکیده انگلیسی مقاله
Objective
This research investigates the problem of dynamic pricing in rail transportation systems using advanced deep reinforcement learning techniques. The main goal is to optimize the revenue of railway transport companies by developing a ticket sales policy that dynamically adjusts ticket prices based on service classes. This approach allows rail transport companies to enhance revenue and profitability by accurately aligning prices with passenger demand.
Methods
To solve the problem of dynamic pricing, this research utilizes the Q deep network algorithm, which combines deep neural networks with Q-learning. Deep neural networks approximate Q values instead of using a costly Q table. The Q deep network algorithm is widely used due to its ability to learn optimal policies in complex environments. As reinforcement learning models are often too complex to analyze, numerical experiments and simulations are used to analyze different pricing strategies.
Results
The simulations demonstrate that the Q deep network algorithm successfully converges to a stable pricing policy. Various performance indicators were investigated, including such as total revenue, remaining capacity, average prices offered to customers, and the number of tickets sold in each service class. The algorithm showed improvement in the early stages and gradually achieved stability. The average total revenue converges to 225,000 after 5,000 iterations, indicating that the company earns an average of 225,000 monetary units from each train. The average residual capacity approaches zero after approximately 3,000 iterations, indicating that the reinforcement learning agent learns to sell all available tickets to maximize total revenue. The average price index offered to customers stabilizes after approximately 7,500 iterations, indicating that the algorithm has converged to an optimal pricing policy. In this state, the average prices remain within the range of 680 to 700 monetary units, with no significant fluctuations observed. In other words, the reinforcement learning model has successfully converged based on the average proposed price index.
Finally, after about 5,000 iterations, the average number of tickets sold for all service classes reaches a stable level. The average number of tickets sold for economy class is around 175 to 180 tickets, for business class is around 130 to 135 tickets, for special
class is around 60 to 65 tickets, and for hotel class is around 23 to 25 tickets.
Conclusion
The findings of this study suggest that employing the Deep Q-Network algorithm in dynamic pricing can lead to substantial optimization in revenue management for railway transportation systems.
The results of this research indicate that after approximately 7,500 iterations, the Q deep network algorithm reaches an optimal and stable policy with no significant changes in performance. It can be concluded that the use of the Q deep network algorithm in dynamic pricing can significantly improve the revenue management of rail transportation systems. This algorithm can learn and adapt to changing conditions, allowing for effective pricing policies to maximize revenue and determine the optimal number of tickets sold in each service class. The obtained findings can help rail transport companies improve pricing strategies and increase economic productivity.
کلیدواژههای انگلیسی مقاله
قیمتگذاری پویا,یادگیری تقویتی عمیق,حملونقل ریلی
نویسندگان مقاله
امید نیکنامی |
دانشجوی کارشناسی ارشد، گروه مهندسی صنایع، دانشکده مهندسی صنایع و سیستمها، دانشگاه تربیت مدرس، تهران، ایران.
الهام آخوندزاده نوقایی |
استادیار، گروه فناوری اطلاعات، دانشکده مهندسی صنایع و سیستمها، دانشگاه تربیت مدرس، تهران، ایران.
نشانی اینترنتی
https://imj.ut.ac.ir/article_99727_90ae11416a117502b7e35f3ded8510f0.pdf
فایل مقاله
فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات