注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡操作系統(tǒng)其他操作系統(tǒng)計算機視覺:飛槳深度學習實戰(zhàn)

計算機視覺:飛槳深度學習實戰(zhàn)

計算機視覺:飛槳深度學習實戰(zhàn)

定 價:¥69.80

作 者: 深度學習技術及應用國家工程研究中心 百度技術培訓中心 組編 羅曉燕 白浩杰 黨青青 杜宇寧 張寶昌 編著
出版社: 清華大學出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787302623762 出版時間: 2023-04-01 包裝: 平裝-膠訂
開本: 16開 頁數(shù): 字數(shù):  

內容簡介

  本書在介紹深度學習、百度飛槳等相關知識的基礎上,著重介紹了圖像分類、目標檢測、語義分割、人體關鍵點檢測、圖像生成、視頻分類、圖像文本檢測和識別、圖像識別等計算機視覺任務的實現(xiàn)原理及深度學習模型框架,并通過具體案例來詳細介紹各任務的實現(xiàn)細節(jié)。 全書分為理論篇和實戰(zhàn)篇。理論篇(第1~4章)梳理了計算機視覺技術的發(fā)展歷程、主要任務、行業(yè)應用系統(tǒng),同時簡要介紹了深度學習開發(fā)框架、飛槳(PaddlePaddle)開發(fā)平臺,以及深度學習的基礎知識與網(wǎng)絡模型架構。實戰(zhàn)篇(第5~12章)結合計算機視覺的各個任務要求與技術發(fā)展,對其中經(jīng)典的深度學習算法模型進行介紹。全書提供了實例代碼,詳解了在飛槳開發(fā)框架下各任務的模型實現(xiàn)過程。 本書適合作為高等院校人工智能、計算機視覺專業(yè)高年級本科生、研究生的教材,同時可作為計算機視覺相關任務實踐教程,也可以作為科研工作者的參考書籍。

作者簡介

暫缺《計算機視覺:飛槳深度學習實戰(zhàn)》作者簡介

圖書目錄

理論篇
第1章計算機視覺概述
1.1計算機視覺技術的發(fā)展
1.2計算機視覺任務概述
1.2.1計算機視覺經(jīng)典任務
1.2.2計算機視覺常見任務
1.3計算機視覺處理應用系統(tǒng)
1.3.1計算機視覺行業(yè)產業(yè)鏈
1.3.2計算機視覺行業(yè)應用系統(tǒng)
1.4計算機視覺處理常用工具
1.4.1OpenCV簡介
1.4.2OpenCVPython
1.4.3OpenCV的基礎模塊
1.4.4其他CV常用工具
1.5本章小結
參考文獻
第2章深度學習開發(fā)框架
2.1常見的深度學習開發(fā)框架
2.1.1TensorFlow深度學習開發(fā)框架
2.1.2PyTorch深度學習開發(fā)框架
2.1.3PaddlePaddle深度學習開發(fā)框架
2.2飛槳基礎
2.2.1開發(fā)環(huán)境
2.2.2開發(fā)套件
2.2.3工具組件
2.2.4開發(fā)平臺
2.3本章小結
參考文獻
 
 
第3章深度學習算法基礎
3.1機器學習
3.2神經(jīng)網(wǎng)絡的基本組成
3.2.1神經(jīng)元
3.2.2神經(jīng)網(wǎng)絡的結構
3.3神經(jīng)網(wǎng)絡的計算
3.3.1激活函數(shù)
3.3.2正向傳播
3.3.3反向傳播
3.3.4優(yōu)化算法
3.4卷積神經(jīng)網(wǎng)絡的基本組成
3.4.1卷積層
3.4.2池化層
3.4.3ReLU激活函數(shù)
3.4.4全連接層
3.5深度學習模型的訓練技巧
3.5.1歸一化
3.5.2丟棄法
3.5.3權重衰減
3.5.4參數(shù)初始化
3.6本章小結
參考文獻
第4章深度學習網(wǎng)絡模型
4.1深度學習網(wǎng)絡架構
4.2代表性的網(wǎng)絡模型
4.2.1卷積神經(jīng)網(wǎng)絡模型
4.2.2循環(huán)神經(jīng)網(wǎng)絡模型
4.2.3Transformer網(wǎng)絡模型
4.2.4復雜MLP網(wǎng)絡模型
4.3網(wǎng)絡搭建案例
4.3.1環(huán)境準備
4.3.2數(shù)據(jù)準備
4.3.3模型構建
4.3.4模型訓練與驗證
4.3.5模型可視化
4.4本章小結
參考文獻
實戰(zhàn)篇
第5章圖像分類算法原理與實戰(zhàn)
5.1圖像分類任務的基本介紹
5.1.1圖像分類技術的發(fā)展
5.1.2圖像分類的評價指標
5.2基于殘差的網(wǎng)絡
5.2.1ResNet模型
5.2.2DenseNet模型
5.2.3DPN模型
5.3基于Transformer的網(wǎng)絡
5.3.1ViT模型
5.3.2SwinTransformer模型
5.4輕量化的網(wǎng)絡
5.4.1MobileNet模型
5.4.2PPLCNet模型
5.5飛槳實現(xiàn)圖像分類案例
5.5.1環(huán)境安裝與配置
5.5.2數(shù)據(jù)準備
5.5.3模型構建
5.5.4模型訓練
5.5.5模型預測
5.6本章小結
參考文獻
第6章目標檢測算法原理與實戰(zhàn)
6.1目標檢測任務基本介紹
6.1.1目標檢測技術的發(fā)展
6.1.2目標檢測的評價指標
6.2Faster RCNN基本解析
6.2.1RCNN系列
6.2.2Faster RCNN整體架構
6.2.3Faster RCNN主要特點
6.3SSD基本解析
6.3.1SSD基本架構
6.3.2SSD主要特點
6.4YOLOv3基本解析
6.4.1YOLO系列
6.4.2YOLOv3主要特點
6.5FCOS基本解析
6.5.1FCOS基本架構
6.5.2FCOS主要特點
6.5.3損失函數(shù)的設計
6.5.4FCOS的優(yōu)缺點
6.6DETR基本解析
6.6.1DETR基本結構
6.6.2DETR主要特點
6.7飛槳實現(xiàn)目標檢測案例
6.7.1環(huán)境準備
6.7.2數(shù)據(jù)讀取與增強
6.7.3模型構建
6.7.4模型訓練
6.7.5模型測試與可視化
6.8本章小結
參考文獻
第7章語義分割算法原理與實戰(zhàn)
7.1語義分割任務的基本介紹
7.1.1語義分割的發(fā)展
7.1.2語義分割的評價指標
7.2深度學習語義分割基礎網(wǎng)絡
7.2.1FCN模型
7.2.2SegNet模型
7.2.3UNet模型
7.3語義分割網(wǎng)絡的系列改進
7.3.1空洞可分離卷積: DeepLabv3
7.3.2低層細節(jié)信息保留: RefineNet
7.3.3全局語義特征聚合: OCRNet
7.4飛槳實現(xiàn)語義分割案例
7.4.1環(huán)境準備
7.4.2數(shù)據(jù)準備與預處理
7.4.3模型構建
7.4.4模型訓練
7.4.5模型驗證與評估
7.5本章小結
參考文獻
第8章人體關鍵點檢測原理與實戰(zhàn)
8.1人體關鍵點檢測任務的基本介紹
8.1.1人體關鍵點檢測的發(fā)展
8.1.2人體關鍵點檢測的評價指標
8.2人體關鍵點檢測的經(jīng)典方法
8.2.1模板匹配
8.2.2貝葉斯估計
8.3多尺度人體姿態(tài)檢測方法
8.3.1Hourglass模型架構
8.3.2一階Hourglass模塊
8.3.3多階Hourglass網(wǎng)絡
8.4高分辨率人體姿態(tài)估計方法
8.4.1HRNet模型
8.4.2HigherHRNet 模型
8.5人體姿態(tài)識別OpenPose
8.5.1卷積姿態(tài)機CPM
8.5.2OpenPose架構
8.6飛槳實現(xiàn)人體關鍵點檢測案例
8.6.1環(huán)境準備
8.6.2數(shù)據(jù)集準備
8.6.3模塊導入
8.6.4數(shù)據(jù)集定義
8.6.5模型構建
8.6.6損失函數(shù)定義
8.6.7模型訓練
8.6.8模型預測
8.7本章小結
參考文獻
第9章圖像生成算法原理與實戰(zhàn)
9.1圖像生成任務的基本介紹
9.1.1圖像生成應用與發(fā)展
9.1.2圖像生成的評價指標
9.2基于圖像生成的圖像轉換: Pix2Pix 
9.3基于圖像生成的風格遷移: CycleGAN
9.3.1CycleGAN的網(wǎng)絡結構
9.3.2CycleGAN的循環(huán)訓練流程
9.4基于圖像生成算法的圖像屬性控制: StyleGAN
9.4.1StyleGANv1的網(wǎng)絡結構與訓練技巧
9.4.2StyleGANv1對隱空間耦合度的量化
9.4.3StyleGANv2的改進
9.5飛槳實現(xiàn)圖像生成案例
9.5.1環(huán)境準備
9.5.2數(shù)據(jù)讀取與預處理
9.5.3模型構建
9.5.4模型訓練
9.5.5模型驗證與評估
9.5.6模型測試
9.6本章小結
參考文獻
第10章視頻分類原理與實戰(zhàn)
10.1視頻分類任務的基本介紹
10.1.1視頻分類的應用與發(fā)展
10.1.2視頻分類任務的評價指標
10.2基于時序劃分的雙流網(wǎng)絡
10.2.1TSN模型
10.2.2SlowFast模型
10.3基于時序移位的類3D網(wǎng)絡: TSM
10.3.1類3D思想
10.3.2網(wǎng)絡設計
10.4基于自注意力機制的網(wǎng)絡
10.4.1Nonlocal模型
10.4.2TimeSformer模型
10.5飛槳實現(xiàn)視頻分類案例
10.5.1環(huán)境準備
10.5.2數(shù)據(jù)讀取與預處理
10.5.3模型構建
10.5.4模型訓練
10.5.5模型驗證與評估
10.5.6模型測試
10.6本章小結
參考文獻
第11章圖像文本檢測和識別原理與實戰(zhàn)
11.1圖像文本檢測和識別任務的基本介紹
11.1.1OCR任務的應用與發(fā)展
11.1.2OCR任務的評價指標
11.2文本檢測算法
11.2.1小尺度文本檢測算法: CTPN
11.2.2場景文本檢測算法: EAST
11.2.3任意形狀文本檢測器: SAST
11.2.4二值化檢測模型: DBNet
11.3文本識別算法
11.3.1基于卷積循環(huán)神經(jīng)網(wǎng)絡的識別模型: CRNN
11.3.2基于空間注意力殘差網(wǎng)絡的識別模型: STARNet
11.3.3具有自動校正功能的魯棒識別模型: RARE
11.3.4基于語義推理網(wǎng)絡的識別模型: SRN
11.4端到端ORC方法
11.4.1FOTS模型
11.4.2PGNet模型
11.5飛槳實現(xiàn)OCR案例
11.5.1環(huán)境準備
11.5.2數(shù)據(jù)讀取與預處理
11.5.3模型構建
11.5.4CTC Loss
11.5.5訓練配置
11.5.6模型訓練
11.5.7驗證前準備
11.5.8開始驗證
11.6本章小結
參考文獻
第12章圖像識別原理與實戰(zhàn)
12.1圖像識別系統(tǒng)任務流程基本概述
12.1.1圖像識別任務基本介紹
12.1.2百度飛槳圖像識別系統(tǒng)簡介
12.2目標檢測模塊
12.3特征學習模塊
12.3.1度量學習算法原理及主要內容
12.3.2深度度量學習常見算法框架
12.3.3百度飛槳中深度度量學習應用
12.4特征檢索系統(tǒng)
12.4.1特征檢索系統(tǒng)介紹
12.4.2特征檢索原理介紹
12.5飛槳實現(xiàn)圖像識別應用案例
12.5.1環(huán)境配置
12.5.2已知類別的圖像識別
12.5.3商品識別與檢索
12.5.4基于新的索引庫的圖像識別
12.6本章小結
參考文獻
 

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.stefanvlieger.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號