注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)計(jì)算機(jī)視覺(jué)與PyTorch項(xiàng)目實(shí)戰(zhàn):基于深度學(xué)習(xí)框架的端到端產(chǎn)品級(jí)模型設(shè)計(jì)與開(kāi)發(fā)

計(jì)算機(jī)視覺(jué)與PyTorch項(xiàng)目實(shí)戰(zhàn):基于深度學(xué)習(xí)框架的端到端產(chǎn)品級(jí)模型設(shè)計(jì)與開(kāi)發(fā)

計(jì)算機(jī)視覺(jué)與PyTorch項(xiàng)目實(shí)戰(zhàn):基于深度學(xué)習(xí)框架的端到端產(chǎn)品級(jí)模型設(shè)計(jì)與開(kāi)發(fā)

定 價(jià):¥99.00

作 者: [印] 阿克謝·庫(kù)爾卡尼(Akshay Kulkarni)、阿達(dá)沙·希瓦南達(dá)(Adarsha Shivananda)、尼廷·奈杰·夏爾馬著 歐拉 譯
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787302657422 出版時(shí)間: 2024-04-01 包裝: 平裝-膠訂
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  《計(jì)算機(jī)視覺(jué)與PyTorch項(xiàng)目實(shí)戰(zhàn):基于深度學(xué)習(xí)框架的端到端產(chǎn)品級(jí)模型設(shè)計(jì)與開(kāi)發(fā)》使用PyTorch 框架來(lái)討論計(jì)算機(jī)視覺(jué)算法及其應(yīng)用。首先介紹計(jì)算機(jī)視覺(jué)基礎(chǔ),主題涉及卷積神經(jīng)網(wǎng)絡(luò)、ResNet、YOLO、數(shù)據(jù)增強(qiáng)和業(yè)內(nèi)使用的其他常規(guī)技術(shù)。隨后簡(jiǎn)要概述PyTorch 庫(kù)。接下來(lái)探究圖像分類問(wèn)題、對(duì)象檢測(cè)技術(shù)以及如何在訓(xùn)練和運(yùn)行推理的同時(shí)實(shí)現(xiàn)遷移學(xué)習(xí)。最后通過(guò)一個(gè)完整的建模過(guò)程來(lái)闡述深度學(xué)習(xí)框架PyTorch 是如何運(yùn)用優(yōu)化技巧和模型AI 可解釋性的?!队?jì)算機(jī)視覺(jué)與PyTorch項(xiàng)目實(shí)戰(zhàn):基于深度學(xué)習(xí)框架的端到端產(chǎn)品級(jí)模型設(shè)計(jì)與開(kāi)發(fā)》適合具有一定基礎(chǔ)的中高級(jí)讀者閱讀和參考,可以幫助他們使用遷移學(xué)習(xí)和PyTorch 來(lái)搭建產(chǎn)品級(jí)的計(jì)算機(jī)視覺(jué)模型。

作者簡(jiǎn)介

  著譯者和技術(shù)審閱者簡(jiǎn)介阿克謝·庫(kù)爾卡尼(Akshay Kulkarni),AI與機(jī)器學(xué)習(xí)(ML)布道師和思想領(lǐng)袖,為財(cái)富500強(qiáng)提供咨詢服務(wù),幫助客戶推動(dòng)AI和數(shù)字化戰(zhàn)略轉(zhuǎn)型。作為谷歌開(kāi)發(fā)者,他經(jīng)常受邀在機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)大會(huì)(包括Strata、O'Reilly的Conf和GIDS)發(fā)表演講。他還是印度多個(gè)頂級(jí)研究生院的客座教授。2019年,他入選“印度40位40歲以下數(shù)據(jù)科學(xué)家”名單。業(yè)余時(shí)間,他喜歡閱讀、寫(xiě)作、寫(xiě)代碼以及為有抱負(fù)的數(shù)據(jù)科學(xué)工程師提供幫助。目前,他和自己的家人居住在印度班加羅爾。 阿達(dá)沙·希瓦南達(dá)(Adarsha Shivananda),數(shù)據(jù)科學(xué)和MLOps先行者,致力于創(chuàng)建世界級(jí)的MLOps能力以確保人工智能可以持續(xù)交付價(jià)值。他的使命是在組織內(nèi)部和外部建立一個(gè)數(shù)據(jù)科學(xué)家人才庫(kù),通過(guò)培訓(xùn)來(lái)解決問(wèn)題,他在這方面一直保持領(lǐng)先地位。他先后就職于制藥、保健、包裝消費(fèi)、零售和營(yíng)銷領(lǐng)域。目前,他居住在印度班加羅爾,喜歡閱讀和數(shù)據(jù)科學(xué)培訓(xùn)。 尼廷·奈杰·夏爾馬(Nitin Ranjan Sharma),諾華制藥產(chǎn)品經(jīng)理,主要帶領(lǐng)團(tuán)隊(duì)使用多模型技術(shù)來(lái)開(kāi)發(fā)產(chǎn)品,此外也為財(cái)富500強(qiáng)公司提供咨詢服務(wù),使用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)框架來(lái)幫助他們解決復(fù)雜的業(yè)務(wù)問(wèn)題。他主要關(guān)注的領(lǐng)域和核心專長(zhǎng)是計(jì)算機(jī)視覺(jué),比如解決圖像和視頻數(shù)據(jù)的業(yè)務(wù)難題。在加入諾華制藥之前,他的身份是Publicis Sapient、EY和TekSystems Global Services數(shù)據(jù)科學(xué)團(tuán)隊(duì)成員。他經(jīng)常受邀在數(shù)據(jù)科學(xué)大會(huì)上發(fā)表演講并喜歡培訓(xùn)和指導(dǎo)數(shù)據(jù)科學(xué)愛(ài)好者開(kāi)展工作。此外,他還是一名非?;钴S的開(kāi)源貢獻(xiàn)者。 歐拉,奉行知行合一,擅長(zhǎng)于問(wèn)題的引導(dǎo)和拆解。目前感興趣的方向有機(jī)器學(xué)習(xí)、人工智能和商業(yè)分析。 賈萊姆·拉吉·羅希特(Jalem Raj Rohit),Episource公司的高級(jí)數(shù)據(jù)科學(xué)家,全面領(lǐng)導(dǎo)計(jì)算機(jī)視覺(jué)工作。他參與創(chuàng)辦了Pydata德里和Pydata孟買(mǎi)等機(jī)器學(xué)習(xí)社群并以組織者和嘉賓的身份舉辦和參加了很多小型聚會(huì)與大型會(huì)議大會(huì)。他寫(xiě)了兩本書(shū),錄制了視頻課程(Julia語(yǔ)言和無(wú)服務(wù)器項(xiàng)目)。他的興趣領(lǐng)域包括計(jì)算機(jī)視覺(jué)、MLOps和分布式系統(tǒng)。

圖書(shū)目錄

第1章 計(jì)算機(jī)視覺(jué)的基礎(chǔ)構(gòu)成
第2章 圖像分類
第3章 構(gòu)建目標(biāo)檢測(cè)模型
第4章 構(gòu)建圖像分割模型
第5章 基于圖像的搜索和推薦系統(tǒng)
第6章 姿態(tài)估計(jì)
第7章 圖像異常檢測(cè)
第8章 圖像超分辨率
第9章 視頻分析
第10章 計(jì)算機(jī)視覺(jué)的可解釋AI
詳細(xì)目錄
第1章 計(jì)算機(jī)視覺(jué)的基本構(gòu)成 001
1.1 什么是計(jì)算機(jī)視覺(jué) 002
1.1.1 應(yīng)用 002
1.1.2 通道 005
1.1.3 卷積神經(jīng)網(wǎng)絡(luò) 007
1.1.4 了解CNN架構(gòu)類型 014
1.1.5 掌握深度學(xué)習(xí)模型 021
1.1.6 PyTorch簡(jiǎn)介 024
1.2 小結(jié) 026
第2章 圖像分類 027
2.1 本章所涵蓋的主題 028
2.2 方法概述 028
2.3 創(chuàng)建圖像分類流程 029
2.3.1 第一個(gè)基本模型 030
2.3.2 數(shù)據(jù) 030
2.3.3 數(shù)據(jù)探索 032
2.3.4 數(shù)據(jù)加載器 033
2.3.5 定義模型 035
2.3.6 訓(xùn)練過(guò)程 040
2.3.7 基本模型的第二種變體 044
2.3.8 基本模型的第三種變體 046
2.3.9 基本模型的第四種變體 052
2.7 小結(jié) 053
第3章 構(gòu)建目標(biāo)檢測(cè)模型 055
3.1 使用Boosted Cascade進(jìn)行目標(biāo)檢測(cè) 056
3.2 R-CNN 058
3.2.1 區(qū)域候選網(wǎng)絡(luò) 059
3.2.2 快速區(qū)域卷積神經(jīng)網(wǎng)絡(luò) 062
3.2.3 候選區(qū)域網(wǎng)絡(luò)的工作原理 063
3.2.4 錨框生成層 064
3.2.5 候選區(qū)域?qū)?065
3.3 Mask R-CNN 065
3.4 YOLO 066
3.5 YOLO V2/V3 068
3.6 項(xiàng)目代碼片段 069
3.7 小結(jié) 082
第4章 構(gòu)建圖像分割模型 083
4.1 圖像分割 084
4.2 PyTorch預(yù)訓(xùn)練支持 086
4.2.1 語(yǔ)義分割 086
4.2.2 實(shí)例分割 089
4.3 模型優(yōu)化 090
4.4 小結(jié) 106
第5章 基于圖的搜索和推薦系統(tǒng) 107
5.1 問(wèn)題陳述 107
5.2 方法和方法論 108
5.3 實(shí)現(xiàn) 109
5.3.1 數(shù)據(jù)集 109
5.3.2 安裝和導(dǎo)入庫(kù) 110
5.3.3 導(dǎo)入和理解數(shù)據(jù) 111
5.3.4 特征工程 114
5.3.5 計(jì)算相似度和排名 121
5.3.6 可視化推薦結(jié)果 122
5.3.7 從用戶處接收?qǐng)D輸入并推薦相似產(chǎn)品 125
5.4 小結(jié) 128
第6章 姿態(tài)估計(jì) 129
6.1 自頂向下的方法 130
6.2 自底向上的方法 130
6.3 OpenPose 131
6.3.1 分支1 131
6.3.2 分支2 131
6.4 HRNet 133
6.5 Higher HRNet 135
6.6 PoseNet 136
6.6.1 PoseNet工作機(jī)制 136
6.6.2 PoseNet的優(yōu)點(diǎn)和缺點(diǎn) 140
6.6.3 姿態(tài)估計(jì)的應(yīng)用 140
6.6.4 在雜貨店視頻上進(jìn)行的測(cè)試用例 140
6.7 實(shí)現(xiàn) 141
6.8 小結(jié) 148
第7章 圖像異常檢測(cè) 149
7.1 異常檢測(cè) 149
7.2 方法1:使用預(yù)訓(xùn)練的分類模型 151
7.3 方法2:使用自編碼器 165
7.4 小結(jié) 168
第8章 圖像超分辨率 169
8.1 利用最近鄰概念放大圖像 170
8.2 理解雙線性插值 171
8.3 變分自編碼器 172
8.4 生成式對(duì)抗網(wǎng)絡(luò) 176
8.5 模型代碼 177
8.6 模型開(kāi)發(fā) 177
8.7 運(yùn)行應(yīng)用程序 188
8.8 小結(jié) 190
第9章 視頻分析 191
9.1 問(wèn)題陳述 192
9.2 方法 194
9.3 實(shí)現(xiàn) 195
9.3.1 數(shù)據(jù) 196
9.3.2 把視頻上傳到Google Colab 197
9.3.3 將視頻轉(zhuǎn)換為一系列圖像 197
9.3.4 圖像提取 198
9.3.5 數(shù)據(jù)預(yù)處理 198
9.3.6 確定雜貨店中的熱點(diǎn) 200
9.3.7 導(dǎo)入圖像 203
9.3.8 獲取人群計(jì)數(shù) 203
9.3.9 安保與監(jiān)控 205
9.3.10 確定人口統(tǒng)計(jì)學(xué)特征(年齡和性別) 208
9.4 小結(jié) 210
第10章 計(jì)算機(jī)視覺(jué)的可解釋AI 211
10.1 Grad-CAM 212
10.2 Grad-CAM 213
10.3 NBDT 214
10.4 Grad-CAM和Grad-CAM 的實(shí)現(xiàn) 216
10.4.1 在單個(gè)圖像上的Grad-CAM和Grad-CAM 實(shí)現(xiàn) 216
10.4.2 在單個(gè)圖像上的NBDT實(shí)現(xiàn) 219
10.5 小結(jié) 221

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) www.stefanvlieger.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)