OpenCL異構(gòu)計(jì)算：入門FPGA和TensorFlow神經(jīng)網(wǎng)絡(luò)

定　價(jià)：￥59.00

作　者：	胡正偉，謝志遠(yuǎn)，王巖著
出版社：	清華大學(xué)出版社
叢編項(xiàng)：	普通高等院校電子信息系列教材
標(biāo)　簽：	暫缺

購買這本書可以去

ISBN：	9787302593980	出版時(shí)間：	2021-12-01	包裝：
開本：	16開	頁數(shù)：	223	字?jǐn)?shù)：

內(nèi)容簡介

　　本書以通過FPGA實(shí)現(xiàn)簡易神經(jīng)網(wǎng)絡(luò)的推理流程為主線，主要包含以下內(nèi)容：在TensorFlow學(xué)習(xí)框架下實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)訓(xùn)練，保存訓(xùn)練好的權(quán)值和偏置；將TensorFlow框架下訓(xùn)練的神經(jīng)網(wǎng)絡(luò)使用OpenCL語言實(shí)現(xiàn)，并編譯生成可執(zhí)行文件和FPGA編程文件；將輸入數(shù)據(jù)、權(quán)值、偏置等數(shù)據(jù)通過以太網(wǎng)口傳輸?shù)紽PGA開發(fā)板；在FPGA開發(fā)板上運(yùn)行神經(jīng)網(wǎng)絡(luò)。本書的重點(diǎn)在于神經(jīng)網(wǎng)絡(luò)算法的OpenCL描述方法及FPGA實(shí)現(xiàn)流程。簡易神經(jīng)網(wǎng)絡(luò)算法不僅可以讓讀者明白神經(jīng)網(wǎng)絡(luò)的工作原理及基本框架，還可以使用較少的OpenCL代碼描述，易于分析神經(jīng)網(wǎng)絡(luò)算法與代碼的對應(yīng)關(guān)系，實(shí)現(xiàn)OpenCL語言的學(xué)習(xí)。本書以Ubuntu操作系統(tǒng)為運(yùn)行環(huán)境，以***高的FPGA開發(fā)板DE10_nano為實(shí)現(xiàn)平臺，該開發(fā)板尺寸較小，易于攜帶，方便管理，價(jià)格較低，適合批量購買以開展相關(guān)教學(xué)實(shí)驗(yàn)。本書面向電子信息、計(jì)算機(jī)、自動化等相關(guān)專業(yè)的本科生及研究生或FPGA開發(fā)人員。

作者簡介

暫缺《OpenCL異構(gòu)計(jì)算：入門FPGA和TensorFlow神經(jīng)網(wǎng)絡(luò)》作者簡介

圖書目錄

●章緒論
1.1 異構(gòu)計(jì)算系統(tǒng)
1.2 OpenCL
1.3 FPGA
1.4 FPGA CPU異構(gòu)計(jì)算系統(tǒng)
1.5 HDL和OpenCL
1.5.1 OpenCL的優(yōu)點(diǎn)
1.5.2 OpenCL的缺點(diǎn)
1.6 人工神經(jīng)網(wǎng)絡(luò)
1.6.1 人工神經(jīng)網(wǎng)絡(luò)的基本概念
1.6.2 人工神經(jīng)網(wǎng)絡(luò)的基本特征
1.6.3 人工神經(jīng)網(wǎng)絡(luò)的應(yīng)用
習(xí)題1
第2章 TensorFlow基礎(chǔ)知識及運(yùn)行環(huán)境搭建
2.1 TensorFlow簡介
2.2 TensorFlow兩步編程模式
2.3 TensorFlow兩步編程模式實(shí)例
2.3.1 定義計(jì)算圖的基本操作
2.3.2 運(yùn)行計(jì)算圖的基本操作
2.4 TensorFlow環(huán)境搭建
2.4.1
2.4.2 TensorFlow軟件運(yùn)行
2.4.3 計(jì)算圖例程運(yùn)行實(shí)例
習(xí)題2
第3章 TensorFlow實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練與測試
3.1 神經(jīng)網(wǎng)絡(luò)訓(xùn)練與測試的基本概念
3.1.1 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練
3.1.2 神經(jīng)網(wǎng)絡(luò)的測試
3.2 基于TensforFlow訓(xùn)練神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)MNIST數(shù)據(jù)集識別
3.2.1 MNSIT數(shù)據(jù)集
3.2.2 Softmax Regression模型
3.2.3 MNIST數(shù)據(jù)識別的Softmax Regression神經(jīng)網(wǎng)絡(luò)模型
3.2.4 MNIST數(shù)據(jù)識別的卷積神經(jīng)網(wǎng)絡(luò)模型
3.3 MNIST數(shù)據(jù)集轉(zhuǎn)換
3.3.1 將數(shù)據(jù)集轉(zhuǎn)換為以txt文件保存的數(shù)據(jù)
3.3.2 將數(shù)據(jù)集轉(zhuǎn)換為以bmp文件保存的圖片
3.3.3 將bmp轉(zhuǎn)換為tfrecords格式
3.4 讀取tfrecords格式數(shù)據(jù)實(shí)現(xiàn)MNIST手寫字體識別
3.4.1 Softmax Regression模型
3.4.2 卷積神經(jīng)網(wǎng)絡(luò)模型
習(xí)題3
第4章 OpenCL基礎(chǔ)
4.1 OpenCL標(biāo)準(zhǔn)框架
4.2 OpenCL基本概念基礎(chǔ)
4.3 OpenCL程序的組成部分
4.4 OpenCL框架的4種模型
4.5 編寫個(gè)OpenCL程序
4.5.1 kernel程序
4.5.2 host程序
4.6 OpenCL基本知識點(diǎn)
4.6.1 kernel函數(shù)格式
4.6.2 kernel編程模式
4.6.3 kernel地址限定符
4. kernel語句描述
4.6.5 kernel數(shù)據(jù)類型
4.6.6 kernel編程
習(xí)題4
第5章面向Intel FPGA的OpenCL運(yùn)行平臺搭建
5.1 搭建OpenCL平臺的軟硬件要求
5.2 面向OpenCL應(yīng)用的DE10_nano開發(fā)板簡介
5.3 平臺所需軟件下載
5.3.1 Quartus Prime Standard下載
5.3.2 Intel FPGA SDK for OpenCL下載
5.3.3 Intel SoC FPGA EDS下載
5.4 平臺所需
5.4.1 安裝Quartus Prime Standard Edition Intel FPGA SDK for OpenCL
5.4.2 安裝SoCEDS
5.4.3 安裝DE10_nano BSP
5.5 環(huán)境變量設(shè)置
5.5.1 環(huán)境變量設(shè)置步驟
5.5.2 環(huán)境變量測試
5.6 編譯OpenCL kernel
5.7 編譯host 程序
5.8 燒寫img文件到SD卡（在Windows系統(tǒng)下完成）
5.9 minicom驅(qū)動安裝與測試
5.9.1 minicom驅(qū)動安裝
5.9.2 minicom 使用測試
5.10 hello world kernel運(yùn)行測試
5.11 DE10_nano與PC交換數(shù)據(jù)
習(xí)題5
第6章單層神經(jīng)網(wǎng)絡(luò)算法模型的FPGA實(shí)現(xiàn)流程
6.1 基于OpenCL的神經(jīng)網(wǎng)絡(luò)算法設(shè)計(jì)與FPGA實(shí)現(xiàn)的基本流程
6.2 無隱形層的簡易神經(jīng)網(wǎng)絡(luò)算法原理
6.3 神經(jīng)網(wǎng)絡(luò)的TensorFlow實(shí)現(xiàn)及訓(xùn)練
TensorFlow框架下輸入數(shù)據(jù)的轉(zhuǎn)換
6.5 神經(jīng)網(wǎng)絡(luò)算法的OpenCL實(shí)現(xiàn)
6.5.1 kernel代碼編寫及編譯
6.5.2 host代碼編寫及編譯
6.6 數(shù)據(jù)移植復(fù)制到FPGA開發(fā)板
6.7 FPGA運(yùn)行神經(jīng)網(wǎng)絡(luò)
6.8 kernel report.html文件查看
6.8.1 高層設(shè)計(jì)報(bào)告布局
6.8.2 系統(tǒng)概要
6.8.3 迭代分析
6.8.4 資源分析
6.8.5 系統(tǒng)視圖
6.9 log文件查看FPGA資源使用估計(jì)信息
習(xí)題6
第7章單層神經(jīng)網(wǎng)絡(luò)算法的kernel程序?qū)崿F(xiàn)方式分析比較
7.1 批量讀取輸入數(shù)據(jù)的OpenCL程序
7.1.1 kernel程序
7.1.2 host程序
7.1.3 執(zhí)行結(jié)果
7.2 神經(jīng)網(wǎng)絡(luò)算法的不同kernel代碼實(shí)現(xiàn)對比
7.2.1 single work item和NDRange（private）
7.2.2 local和private（single work item）
7.2.3 local和private（NDRange）
7.2.4 single work item和NDRange（local）
7.2.5 float和char（single work item-local）
7.2.6 float和char（NDRange-private）
7.3 神經(jīng)網(wǎng)絡(luò)算法的ARM與FPGA實(shí)現(xiàn)方式對比
7.3.1 ARM和FPGA（float數(shù)據(jù)類型）
7.3.2 ARM和FPGA（char數(shù)據(jù)類型）
7.4 host代碼與kernel的對應(yīng)
習(xí)題7
第8章具有一個(gè)隱形層的神經(jīng)網(wǎng)絡(luò)算法模型的OpenCL實(shí)現(xiàn)
8.1 一個(gè)隱形層的簡易神經(jīng)網(wǎng)絡(luò)算法原理
8.2 具有一個(gè)隱形層的神經(jīng)網(wǎng)絡(luò)的TensorFlow實(shí)現(xiàn)及訓(xùn)練
8.3 具有一個(gè)隱形層的神經(jīng)網(wǎng)絡(luò)算法的OpenCL實(shí)現(xiàn)
8.3.1 ARM實(shí)現(xiàn)
8.3.2 single work item格式，一個(gè)kernel
8.3.3 NDRange格式，一個(gè)kernel
8.3.4 single work item格式，kernel
8.3.5 NDRange格式，kernel
8.3.6 single work item格式，