注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡家庭與辦公軟件數(shù)據湖架構

數(shù)據湖架構

數(shù)據湖架構

定 價:¥49.00

作 者: [美] Bill Inmon 著
出版社: 人民郵電出版社
叢編項:
標 簽: 計算機/網絡 數(shù)據庫 數(shù)據庫理論

購買這本書可以去


ISBN: 9787115451736 出版時間: 2017-06-01 包裝: 平裝
開本: 16開 頁數(shù): 145 字數(shù):  

內容簡介

  隨著大數(shù)據的蓬勃發(fā)展,不少機構開始將源源不斷的數(shù)據流導入到一個叫“數(shù)據湖”的設備中去。本書是“數(shù)據倉庫”之父撰寫的新著作,是幫助讀者認識數(shù)據湖架構,并把數(shù)據湖打造成公司資產的指導手冊。全書共15章,分別涉及數(shù)據湖簡介、數(shù)據池據湖內部結構、數(shù)據池及其結構、各種類型的數(shù)據池等技術話題,目的在于講解如何構建有用的數(shù)據湖,以便數(shù)據科學家和數(shù)據分析師能夠解決商業(yè)挑戰(zhàn)并找出新的商業(yè)機會。本書適合數(shù)據管理者、學生、系統(tǒng)開發(fā)人員、架構師、程序員以及最終用戶閱讀。

作者簡介

  Bill Inmon,是“數(shù)據倉庫之父”,他著有57本書,并以9種語言在全球出版。Bill最近的創(chuàng)舉是建立了叫做“文本消歧”的技術,這項技術能以敘述性格式讀取初始文本,并能夠將文本置于常規(guī)的數(shù)據庫中,以便使用標準的分析技術進行分析處理,從而為大數(shù)據/非結構化數(shù)據創(chuàng)造獨特的業(yè)務價值。Bill曾被《計算機世界雜志(ComputerWorld)》評選為“歷史上對計算機行業(yè)影響的十個人之一”。Bill住在美國科羅拉多州的堡石城(Castle Rock)。關于文本消歧的更多資料,請訪問 www.forestrimtech.com。

圖書目錄

第1章 數(shù)據的湖泊 1
1.1 大數(shù)據來了 2
1.2 數(shù)據湖來了 2
1.3 “單向”的數(shù)據湖 4
1.4 小結 7
第2章 改造數(shù)據湖 8
2.1 元數(shù)據 9
2.2 整合圖譜 9
2.3 語境 11
2.4 元過程 11
2.5 數(shù)據科學家 13
2.6 通用性 14
2.7 小結 14
第3章 數(shù)據湖內部 16
3.1 模擬信號數(shù)據 17
3.2 應用程序數(shù)據 20
3.3 文本數(shù)據 21
3.4 另一個視角 23
3.5 小結 24
第4章 數(shù)據池 26
4.1 數(shù)據修整 27
4.2 初始數(shù)據池 28
4.3 模擬信號數(shù)據池 29
4.4 應用程序數(shù)據池 29
4.5 文本數(shù)據池 30
4.6 將數(shù)據直接傳入數(shù)據池 30
4.7 歸檔數(shù)據池 31
4.8 小結 32
第5章 數(shù)據池的通用結構 33
5.1 數(shù)據池描述 34
5.2 數(shù)據池目標 35
5.3 數(shù)據池數(shù)據 36
5.4 數(shù)據池元數(shù)據 36
5.5 數(shù)據池元過程 37
5.6 數(shù)據轉換標準 38
5.7 小結 39
第6章 模擬信號數(shù)據池 41
6.1 模擬信號數(shù)據問題 42
6.2 數(shù)據描述 42
6.3 捕獲初始數(shù)據、轉換初始數(shù)據 43
6.4 轉換/調整初始模擬信號數(shù)據 44
6.5 數(shù)據切除 47
6.6 聚類數(shù)據 48
6.7 數(shù)據關系 50
6.8 未來使用的可能性 51
6.9 異常值 52
6.10 臨時性的特定分析 54
6.11 小結 55
第7章 應用程序數(shù)據池 57
7.1 數(shù)據的基因 58
7.2 數(shù)據描述 59
7.3 標準數(shù)據庫格式 59
7.4 數(shù)據的基本組織 60
7.5 數(shù)據的整合 61
7.6 數(shù)據模型 61
7.7 整合的必要性 63
7.8 從一個應用指向到下一個應用 65
7.9 交并應用 66
7.10 應用程序數(shù)據池內的數(shù)據子集 67
7.11 小結 68
第8章 文本數(shù)據池 70
8.1 統(tǒng)一化的數(shù)據與計算機 70
8.2 寶貴的文本 71
8.3 文本消歧 72
8.4 傳入數(shù)據池的文本 73
8.5 文本消歧的輸出 74
8.6 固有的復雜性 75
8.7 文本消歧的功能 77
8.8 分類與本體 77
8.9 文本與語境的價值 79
8.10 對文本追根溯源 80
8.11 消歧的機制 80
8.12 分析數(shù)據庫 81
8.13 將結果可視化 82
8.14 小結 84
第9章 數(shù)據池間的對比 85
9.1 數(shù)據池的相似性 85
9.2 數(shù)據池的差異性 86
9.3 數(shù)據最終狀態(tài)的關系型格式 86
9.4 技術間差異 87
9.5 數(shù)據池中數(shù)據的總預期容量 88
9.6 數(shù)據池間的數(shù)據移動 88
9.7 在多個數(shù)據池進行分析 89
9.8 使用元數(shù)據來關聯(lián)不同數(shù)據池內的數(shù)據 90
9.9 假如…… 91
9.10 小結 92
第10章 利用基礎架構 94
10.1 “單向”數(shù)據湖 95
10.2 改造數(shù)據湖 96
10.3 轉換技術 96
10.4 一些分析問題 97
10.5 查詢文本數(shù)據 100
10.6 真實的分析 101
10.7 小結 102
第11章 搜索與分析 103
11.1 供應商所散布的困惑 110
11.2 小結 110
第12章 數(shù)據池中的業(yè)務價值 111
12.1 模擬信號數(shù)據池中的業(yè)務價值 111
12.2 應用程序數(shù)據池中的業(yè)務價值 114
12.3 文本數(shù)據池中的業(yè)務價值 115
12.4 記錄中的業(yè)務價值比例 116
12.5 小結 117
第13章 一些額外話題 118
13.1 高層系統(tǒng)級別文檔 118
13.2 詳細的數(shù)據池級別文檔 119
13.3 什么樣的數(shù)據會流入數(shù)據湖/數(shù)據池 120
13.4 分析在何處發(fā)生 121
13.5 數(shù)據的年齡 125
13.6 數(shù)據的安全 125
13.7 小結 126
第14章 分析與整合工具 127
14.1 可視化 127
14.2 搜索與修正 128
14.3 文本消歧 129
14.4 統(tǒng)計分析 130
14.5 經典的ETL處理 131
14.6 小結 131
第15章 歸檔數(shù)據池 133
15.1 數(shù)據的移除標準 134
15.2 結構性改動 134
15.3 為歸檔數(shù)據池建立單獨的索引 135
15.4 小結 136
術語表 137
參考資料 142

本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.stefanvlieger.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號