天天操天天射综合,午夜精品999,国产黄a一级,亚洲成aⅴ人在线观看,外国免费毛片,蜜桃精品视频在线,亚洲第一中文字幕在线

中國工程院院士李德毅:大數(shù)據(jù)挖掘帶動的變遷

2014-05-30 08:22:41 大云網  點擊量: 評論 (0)
5月29日消息,2014第十八屆中國國際軟件博覽會在北京展覽館開幕。本屆軟博會以軟件引領信息消費,助力經濟轉型升級為主題,充分展示軟件業(yè)在促進信息消費、提高百姓生活質量、提升社會各行各業(yè)信息化水平等方
    5月29日消息,2014第十八屆中國國際軟件博覽會在北京展覽館開幕。本屆軟博會以“軟件引領信息消費,助力經濟轉型升級”為主題,充分展示軟件業(yè)在促進信息消費、提高百姓生活質量、提升社會各行各業(yè)信息化水平等方面的最新成果。中國工程院院士李德毅做了題為《大數(shù)據(jù)挖掘帶動的變遷》的主題演講。
中國工程院院士 李德毅
    以下是演講實錄:
    各位來賓、各位同仁、我們工程院在大數(shù)據(jù)時代面對著挑戰(zhàn),今天我就講講這個問題!我們的數(shù)據(jù)要有一定的結構,我們來看看在大數(shù)據(jù)時代軟件工程遇到了什么挑戰(zhàn)?軟件工程師來說,數(shù)據(jù)是按照數(shù)據(jù)結構來寫的,大數(shù)據(jù)時代有沒有可能程序繞著數(shù)據(jù)轉呢?科學應該怎么做,在這個大數(shù)據(jù)時代軟件科學應該怎么做,數(shù)據(jù)挖掘應該怎么做?數(shù)據(jù)挖掘是軟件的代名詞,大數(shù)據(jù)通常來自三個方向,總體來說是自然界大數(shù)據(jù),很大很大,我們那么多衛(wèi)星圍著地球轉,每天下來的數(shù)據(jù)很多。第二生命大數(shù)據(jù)。最重要的是人們尤其關心的是社交大數(shù)據(jù)。今天一個報告在3分鐘之內就可能被全世界的人們所知道。PB時代是對科學的挑戰(zhàn),更是對包括數(shù)據(jù)挖掘在內的任職科學的挑戰(zhàn),也是對軟件工程的挑戰(zhàn)。
    我們看奧巴馬就職的社交場所,這么多面孔,每一個面孔下都有一個故事,這個故事正在發(fā)生著,如果我們可以走便天下的話,我們可以找到奧巴馬的人際關系,一個人在社會上生存有很多方方面面,這些方面我們是技術無法做到的,人臉是數(shù)據(jù)安全的很重要的識別器,怎么識別呢?人們想了很多辦法,就人臉我們就想到了攝像頭,北京市80萬個攝像頭,我們每天都在攝像頭的監(jiān)督下開車、購物。身份認證、年齡識別、情感計算、親緣發(fā)現(xiàn)、性別識別、地區(qū)和民族識別。如果我有一家全家福,你能通過這個發(fā)現(xiàn)誰是女婿,誰是兒媳婦嗎?人臉之間的相似形,人臉的易變性,圖像本身的質量,特征提取中需要提取的特征屬性和數(shù)量,我們能用傳統(tǒng)的結構化數(shù)據(jù)表征嗎?誰是他?這是社交網絡中基本的問題,計算機在發(fā)展過程中我們是怎樣對付這樣的數(shù)據(jù)的?我起了一個題目叫做山不轉,水在轉。早間圖形給我們提出了很好的計算模型,當時我們把計算機分了三檔,第一是CPU加上操作系統(tǒng),這是計算機的命根子,還有一個是內存和外存,全球的虛擬化,在操作系統(tǒng)里很重要,當時我們叫做輸入輸出,這就構成了我們計算時代,構成了我們IT時代。這個龍頭是CPU和操作系統(tǒng),這些計算的虛擬化我們要關心具體的計算。所以就是早期計算的虛擬化,導致現(xiàn)在的云計算。把內外存儲叫做存儲,在交互單元里有技術存儲、呼叫的迭代關系,因此我們現(xiàn)在的交換機、服務器等等都叫計算機。
    計算對軟件付出了很大的努力,尤其是高性能計算機。我們認為計算在前20年中起到了主導作用,它的標志速度就是摩爾速度。跟這個時代相對應的是結構化數(shù)據(jù),軟件加程序加數(shù)據(jù)加存檔,這個數(shù)據(jù)應該是結構化數(shù)據(jù)才能被運行起來。我們想到偉大的科學家,埃德加佛蘭克,提出關系模型,以關系代數(shù)為核心運算,用二維表形式表示實體和實體間的聯(lián)系。只要談到數(shù)據(jù)庫沒有不談關系數(shù)據(jù)庫的。關系數(shù)據(jù)庫有嚴格的頂層設計,為構建良式關系!幾個關系結合成一個關系,對這樣的關系進行運算,只要在關系數(shù)據(jù)中總可以通過SQL語言滿足條件的結果唯一挖掘出來。關系代數(shù)是關系數(shù)據(jù)庫的形式化理論和約束。先有頂層設計和數(shù)據(jù)結構,后填入清洗后的數(shù)據(jù)。數(shù)據(jù)圍繞結構轉,數(shù)據(jù)圍繞程序轉。用戶無需關心數(shù)據(jù)的獲取、存儲、分析以及提取過程,更無需關心數(shù)據(jù)結構的內部組織形式。我曾經是國際上數(shù)據(jù)庫小組的成員。如果有一個TD級的管理,甚至要50個小時為時間點,結構化數(shù)據(jù)面臨著挑戰(zhàn),挑戰(zhàn)一,過于刻苦,無法表示原生態(tài)的大數(shù)據(jù)怎么辦!挑戰(zhàn)二,隨著數(shù)據(jù)的增大,關系代數(shù)運轉的性能急劇下降!
大云網官方微信售電那點事兒

責任編輯:葉雨田

免責聲明:本文僅代表作者個人觀點,與本站無關。其原創(chuàng)性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
我要收藏
個贊
?