注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)軟件工程及軟件方法學(xué)OpenCL異構(gòu)計算:入門FPGA和TensorFlow神經(jīng)網(wǎng)絡(luò)

OpenCL異構(gòu)計算:入門FPGA和TensorFlow神經(jīng)網(wǎng)絡(luò)

OpenCL異構(gòu)計算:入門FPGA和TensorFlow神經(jīng)網(wǎng)絡(luò)

定 價:¥59.00

作 者: 胡正偉,謝志遠,王巖 著
出版社: 清華大學(xué)出版社
叢編項: 普通高等院校電子信息系列教材
標(biāo) 簽: 暫缺

ISBN: 9787302593980 出版時間: 2021-12-01 包裝:
開本: 16開 頁數(shù): 223 字數(shù):  

內(nèi)容簡介

  本書以通過FPGA實現(xiàn)簡易神經(jīng)網(wǎng)絡(luò)的推理流程為主線,主要包含以下內(nèi)容: 在TensorFlow學(xué)習(xí)框架下實現(xiàn)神經(jīng)網(wǎng)絡(luò)訓(xùn)練,保存訓(xùn)練好的權(quán)值和偏置;將TensorFlow框架下訓(xùn)練的神經(jīng)網(wǎng)絡(luò)使用OpenCL語言實現(xiàn),并編譯生成可執(zhí)行文件和FPGA編程文件;將輸入數(shù)據(jù)、權(quán)值、偏置等數(shù)據(jù)通過以太網(wǎng)口傳輸?shù)紽PGA開發(fā)板;在FPGA開發(fā)板上運行神經(jīng)網(wǎng)絡(luò)。本書的重點在于神經(jīng)網(wǎng)絡(luò)算法的OpenCL描述方法及FPGA實現(xiàn)流程。簡易神經(jīng)網(wǎng)絡(luò)算法不僅可以讓讀者明白神經(jīng)網(wǎng)絡(luò)的工作原理及基本框架,還可以使用較少的OpenCL代碼描述,易于分析神經(jīng)網(wǎng)絡(luò)算法與代碼的對應(yīng)關(guān)系,實現(xiàn)OpenCL語言的學(xué)習(xí)。本書以Ubuntu操作系統(tǒng)為運行環(huán)境,以***高的FPGA開發(fā)板DE10_nano為實現(xiàn)平臺,該開發(fā)板尺寸較小,易于攜帶,方便管理,價格較低,適合批量購買以開展相關(guān)教學(xué)實驗。本書面向電子信息、計算機、自動化等相關(guān)專業(yè)的本科生及研究生或FPGA開發(fā)人員。

作者簡介

暫缺《OpenCL異構(gòu)計算:入門FPGA和TensorFlow神經(jīng)網(wǎng)絡(luò)》作者簡介

圖書目錄

●章 緒論
1.1 異構(gòu)計算系統(tǒng)
1.2 OpenCL
1.3 FPGA
1.4 FPGA CPU異構(gòu)計算系統(tǒng)
1.5 HDL和OpenCL
1.5.1 OpenCL的優(yōu)點
1.5.2 OpenCL的缺點
1.6 人工神經(jīng)網(wǎng)絡(luò)
1.6.1 人工神經(jīng)網(wǎng)絡(luò)的基本概念
1.6.2 人工神經(jīng)網(wǎng)絡(luò)的基本特征
1.6.3 人工神經(jīng)網(wǎng)絡(luò)的應(yīng)用
習(xí)題1
第2章 TensorFlow基礎(chǔ)知識及運行環(huán)境搭建
2.1 TensorFlow簡介
2.2 TensorFlow兩步編程模式
2.3 TensorFlow兩步編程模式實例
2.3.1 定義計算圖的基本操作
2.3.2 運行計算圖的基本操作
2.4 TensorFlow環(huán)境搭建
2.4.1 
2.4.2 TensorFlow軟件運行
2.4.3 計算圖例程運行實例
習(xí)題2
第3章 TensorFlow實現(xiàn)神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練與測試
3.1 神經(jīng)網(wǎng)絡(luò)訓(xùn)練與測試的基本概念
3.1.1 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練
3.1.2 神經(jīng)網(wǎng)絡(luò)的測試
3.2 基于TensforFlow訓(xùn)練神經(jīng)網(wǎng)絡(luò)實現(xiàn)MNIST數(shù)據(jù)集識別
3.2.1 MNSIT數(shù)據(jù)集
3.2.2 Softmax Regression模型
3.2.3 MNIST數(shù)據(jù)識別的Softmax Regression神經(jīng)網(wǎng)絡(luò)模型
3.2.4 MNIST數(shù)據(jù)識別的卷積神經(jīng)網(wǎng)絡(luò)模型
3.3 MNIST數(shù)據(jù)集轉(zhuǎn)換
3.3.1 將數(shù)據(jù)集轉(zhuǎn)換為以txt文件保存的數(shù)據(jù)
3.3.2 將數(shù)據(jù)集轉(zhuǎn)換為以bmp文件保存的圖片
3.3.3 將bmp轉(zhuǎn)換為tfrecords格式
3.4 讀取tfrecords格式數(shù)據(jù)實現(xiàn)MNIST手寫字體識別
3.4.1 Softmax Regression模型
3.4.2 卷積神經(jīng)網(wǎng)絡(luò)模型
習(xí)題3
第4章 OpenCL基礎(chǔ)
4.1 OpenCL標(biāo)準框架
4.2 OpenCL基本概念基礎(chǔ)
4.3 OpenCL程序的組成部分
4.4 OpenCL框架的4種模型
4.5 編寫個OpenCL程序
4.5.1 kernel程序
4.5.2 host程序
4.6 OpenCL基本知識點
4.6.1 kernel函數(shù)格式
4.6.2 kernel編程模式
4.6.3 kernel地址限定符
4. kernel語句描述
4.6.5 kernel數(shù)據(jù)類型
4.6.6 kernel編程
習(xí)題4
第5章 面向Intel FPGA的OpenCL運行平臺搭建
5.1 搭建OpenCL平臺的軟硬件要求
5.2 面向OpenCL應(yīng)用的DE10_nano開發(fā)板簡介
5.3 平臺所需軟件下載
5.3.1 Quartus Prime Standard下載
5.3.2 Intel FPGA SDK for OpenCL下載
5.3.3 Intel SoC FPGA EDS下載
5.4 平臺所需
5.4.1 安裝Quartus Prime Standard Edition Intel FPGA SDK for OpenCL
5.4.2 安裝SoCEDS
5.4.3 安裝DE10_nano BSP
5.5 環(huán)境變量設(shè)置
5.5.1 環(huán)境變量設(shè)置步驟
5.5.2 環(huán)境變量測試
5.6 編譯OpenCL kernel
5.7 編譯host 程序
5.8 燒寫img文件到SD卡(在Windows系統(tǒng)下完成)
5.9 minicom驅(qū)動安裝與測試
5.9.1 minicom驅(qū)動安裝
5.9.2 minicom 使用測試
5.10 hello world kernel運行測試
5.11 DE10_nano與PC交換數(shù)據(jù)
習(xí)題5
第6章 單層神經(jīng)網(wǎng)絡(luò)算法模型的FPGA實現(xiàn)流程
6.1 基于OpenCL的神經(jīng)網(wǎng)絡(luò)算法設(shè)計與FPGA實現(xiàn)的基本流程
6.2 無隱形層的簡易神經(jīng)網(wǎng)絡(luò)算法原理
6.3 神經(jīng)網(wǎng)絡(luò)的TensorFlow實現(xiàn)及訓(xùn)練
TensorFlow框架下輸入數(shù)據(jù)的轉(zhuǎn)換
6.5 神經(jīng)網(wǎng)絡(luò)算法的OpenCL實現(xiàn)
6.5.1 kernel代碼編寫及編譯
6.5.2 host代碼編寫及編譯
6.6 數(shù)據(jù)移植復(fù)制到FPGA開發(fā)板
6.7 FPGA運行神經(jīng)網(wǎng)絡(luò)
6.8 kernel report.html文件查看
6.8.1 高層設(shè)計報告布局
6.8.2 系統(tǒng)概要
6.8.3 迭代分析
6.8.4 資源分析
6.8.5 系統(tǒng)視圖
6.9 log文件查看FPGA資源使用估計信息
習(xí)題6
第7章 單層神經(jīng)網(wǎng)絡(luò)算法的kernel程序?qū)崿F(xiàn)方式分析比較
7.1 批量讀取輸入數(shù)據(jù)的OpenCL程序
7.1.1 kernel程序
7.1.2 host程序
7.1.3 執(zhí)行結(jié)果
7.2 神經(jīng)網(wǎng)絡(luò)算法的不同kernel代碼實現(xiàn)對比
7.2.1 single work item和NDRange(private)
7.2.2 local和private(single work item)
7.2.3 local和private(NDRange)
7.2.4 single work item和NDRange(local)
7.2.5 float和char(single work item-local)
7.2.6 float和char(NDRange-private)
7.3 神經(jīng)網(wǎng)絡(luò)算法的ARM與FPGA實現(xiàn)方式對比
7.3.1 ARM和FPGA(float數(shù)據(jù)類型)
7.3.2 ARM和FPGA(char數(shù)據(jù)類型)
7.4 host代碼與kernel的對應(yīng)
習(xí)題7
第8章 具有一個隱形層的神經(jīng)網(wǎng)絡(luò)算法模型的OpenCL實現(xiàn)
8.1 一個隱形層的簡易神經(jīng)網(wǎng)絡(luò)算法原理
8.2 具有一個隱形層的神經(jīng)網(wǎng)絡(luò)的TensorFlow實現(xiàn)及訓(xùn)練
8.3 具有一個隱形層的神經(jīng)網(wǎng)絡(luò)算法的OpenCL實現(xiàn)
8.3.1 ARM實現(xiàn)
8.3.2 single work item格式,一個kernel
8.3.3 NDRange格式,一個kernel
8.3.4 single work item格式,kernel
8.3.5 NDRange格式,kernel
8.3.6 single work item格式,

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.stefanvlieger.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號