實(shí)用馬爾可夫決策過程

定　價(jià)：￥22.00

作　者：	劉克編著
出版社：	清華大學(xué)出版社
叢編項(xiàng)：	不確定理論與優(yōu)化叢書
標(biāo)　簽：	概率統(tǒng)計(jì)

購買這本書可以去

ISBN：	9787302095064	出版時(shí)間：	2004-11-01	包裝：	平裝
開本：	23cm	頁數(shù)：	196	字?jǐn)?shù)：

內(nèi)容簡介

　　馬爾可夫決策過程是研究隨機(jī)環(huán)境下多階段決策過程優(yōu)化問題的理論工具.在過去的幾十年中，隨著生態(tài)科學(xué)、經(jīng)濟(jì)理論、通訊工程以及眾多學(xué)科中需要考慮不確定因素和序列決策問題的大量新模型的涌現(xiàn)，進(jìn)一步刺激了馬爾可夫決策過程在理論上和應(yīng)用領(lǐng)域中長足的發(fā)展.本書從簡單的例子開始，介紹了馬爾可夫決策過程的基本概念、決策過程以及一些常用的基本理論.還介紹了多種最優(yōu)準(zhǔn)則，包括有限階段準(zhǔn)則、折扣準(zhǔn)則、平均準(zhǔn)則、權(quán)重報(bào)酬準(zhǔn)則、概率準(zhǔn)則等.從模型角度考慮了有限狀態(tài)空間、可數(shù)狀態(tài)空間和一般Borel狀態(tài)空間；從決策時(shí)間上來說，考慮了離散時(shí)間、連續(xù)時(shí)間和半馬氏決策時(shí)刻問題.本文還介紹了大量的應(yīng)用實(shí)例以及建模方法.本書可作為高年級大學(xué)生和研究生教材，也可作為運(yùn)籌學(xué)、管理科學(xué)、信息科學(xué)、系統(tǒng)科學(xué)以及計(jì)算機(jī)科學(xué)和工程領(lǐng)域的學(xué)者和技術(shù)人員的參考書.

作者簡介

暫缺《實(shí)用馬爾可夫決策過程》作者簡介

圖書目錄

第1章引論
1.1序列決策模型
1.2馬氏決策過程的例子
1.3馬氏決策過程的定義與記號
1.4馬氏決策過程的起源和發(fā)展
第2章有限階段模型
2.1最優(yōu)準(zhǔn)則
2.2有限階段的策略迭代和最優(yōu)方程
2，3最優(yōu)策略的存在性和算法
2.4兩個(gè)例子
2.5單調(diào)策略的最優(yōu)性
第3章無限階段折扣模型
3，l最優(yōu)準(zhǔn)則
3.2最優(yōu)方程
3.3最優(yōu)策略的存在性
3.4策略迭代算法
3.5值迭代算法
3.6改進(jìn)的策略迭代算法
3，7線性規(guī)劃算法
3.8可數(shù)狀態(tài)與行動(dòng)的模型
3.9最優(yōu)單調(diào)策略
3.10最優(yōu)策略的結(jié)構(gòu)
第4章無限階段平均模型
4，1最優(yōu)準(zhǔn)則
4.2最優(yōu)平穩(wěn)策略的存在性
4.3平穩(wěn)策略的一些特征
4.4最優(yōu)方程與策略迭代算法
4.5單鏈時(shí)的情形
4.6多鏈時(shí)的情形
第5章權(quán)重準(zhǔn)則模型與概率準(zhǔn)則模型
5.1折扣權(quán)重模型
5.2折扣與平均權(quán)重模型
5.3MDP的百分比與目標(biāo)水平
5.4風(fēng)險(xiǎn)概率準(zhǔn)則模型
第6章連續(xù)時(shí)間與半馬氏模型
6.1連續(xù)時(shí)間折扣MDP
6.2連續(xù)時(shí)間平均MDP
6.3折扣半馬氏模型
6.4平均半馬氏模型
6.5服務(wù)率受控的一個(gè)排隊(duì)模型
第7章空集裝箱調(diào)配問題
7.1單港口的問題與建模
7.2無限階段折扣準(zhǔn)則
7.3無限階段平均準(zhǔn)則
7.4數(shù)值例子
7.5多港口空集裝箱的調(diào)配問題
第8章人力資源模型
8.1問題
8.2數(shù)學(xué)模型
8.3相關(guān)參數(shù)分析
8.4數(shù)例
參考文獻(xiàn)
索引