国产偷人视频在线观看,日本 在线 视频 中文 有码,亚洲天堂在线免费观看,婷婷中文字幕一区二区三区

    <td id="kgcjv"></td>

    <td id="kgcjv"><li id="kgcjv"></li></td>

    大數(shù)據(jù)時(shí)代的讀書心得及筆記

    | 詩(shī)詩(shī)

    大數(shù)據(jù)時(shí)代的讀書心得及筆記5篇

    我們從一些大數(shù)據(jù)時(shí)代讀書上得到感悟后,寫大數(shù)據(jù)時(shí)代的讀書心得及筆記是一個(gè)不錯(cuò)的選擇,這樣有利于培養(yǎng)我們思考的習(xí)慣。下面是小編給大家?guī)淼拇髷?shù)據(jù)時(shí)代的讀書心得及筆記5篇,希望大家喜歡!

    大數(shù)據(jù)時(shí)代的讀書心得及筆記

    大數(shù)據(jù)時(shí)代的讀書心得及筆記(精選篇1)

    讀完《大數(shù)據(jù)時(shí)代》這本書后,我意識(shí)到:我們即將或正在迎接由書面到電子的跳躍之后的又一重大變革。

    這本書介紹了大數(shù)據(jù)時(shí)代來臨后,接踵而至的三項(xiàng)變革——商業(yè)變革、管理變革和思維變革。

    其實(shí),這場(chǎng)變革已經(jīng)打響。商業(yè)領(lǐng)域由于大數(shù)據(jù)時(shí)代的到來而推陳出新。前幾年,一家名為Farecast的公司,讓預(yù)訂到更優(yōu)惠的機(jī)票價(jià)格不再是夢(mèng)想。公司利用航班售票的數(shù)據(jù)來預(yù)測(cè)未來機(jī)票價(jià)格的走勢(shì)?,F(xiàn)在,使用這種工具的乘客,平均每張機(jī)票可以省大約50美元,這就是大數(shù)據(jù)給人們帶來的便利。

    大家應(yīng)該都知道20--年出現(xiàn)的H1N1型流感,就拿美國(guó)為例,疾控中心每周只進(jìn)行一次數(shù)據(jù)統(tǒng)計(jì),而病人一般都是難以忍受病痛的折磨才會(huì)去醫(yī)院就診,因此也導(dǎo)致了信息的滯后。然而,對(duì)于飛速傳播的疾病,Google公司卻能及時(shí)地作出判斷,確定流感爆發(fā)的地點(diǎn),這便是基于龐大的數(shù)據(jù)資源,可見大數(shù)據(jù)時(shí)代對(duì)公共衛(wèi)生也產(chǎn)生了重大的影響!

    在我看來,如果想在在大數(shù)據(jù)時(shí)代里暢游,不僅要學(xué)會(huì)分析,而且還要能夠大膽地決斷。

    在美國(guó),每到七、八月份時(shí),正是臺(tái)風(fēng)肆虐之時(shí),防澇用品也擺上了商品貨架。沃爾瑪公司注意到,每到這時(shí),一種蛋撻的銷售量較其他月份明顯增加。于是,商家作了大膽的推測(cè),出現(xiàn)這樣的結(jié)果源于兩種物品的相關(guān)性,便將這種蛋撻擺在了防澇用品的旁邊。這樣的舉措大大增加了利潤(rùn),這就是屬于世界頭號(hào)零售商的大數(shù)據(jù)頭腦!

    大數(shù)據(jù)時(shí)代的到來,可以讓我們的生活更加便利。但是,如果讓大數(shù)據(jù)主宰一切,也存在一定的風(fēng)險(xiǎn)。

    大家應(yīng)該都知道電子地圖,它可以為人們指引方向。但大家應(yīng)該還不知道,它會(huì)默默地積累人們的行程數(shù)據(jù),通過智能分析可以推斷出哪里是自己的家,哪里是工作單位。我們的隱私就這樣被不為人知地收集著。

    大數(shù)據(jù)時(shí)代的到來,讓我們的生活更安全,更方便,但與此同時(shí),我們的隱私不再是隱私,數(shù)據(jù)的收集變得無所不包、無孔不入。世界已經(jīng)向大數(shù)據(jù)時(shí)代邁進(jìn)了一小步,一個(gè)嶄新的時(shí)代正向我們走來。讓我們用知識(shí)武裝大腦,做好準(zhǔn)備,迎接新時(shí)代的到來!

    大數(shù)據(jù)時(shí)代的讀書心得及筆記(精選篇2)

    去年的“云計(jì)算”炒得熱火朝天的,今年的“大數(shù)據(jù)”又突襲而來。仿佛一夜間,各廠商都紛紛改旗換幟,推起“大數(shù)據(jù)”來了。于是乎,各企業(yè)的CIO也將熱度紛紛轉(zhuǎn)向關(guān)注“大數(shù)據(jù)”來了。有一張來自《程序員》微博的漫畫很形象。我覺得這張圖,很真實(shí)地反映了現(xiàn)實(shí)中小企業(yè)云計(jì)算,大數(shù)據(jù)的現(xiàn)狀。

    不過話又還得說回來,《大數(shù)據(jù)時(shí)代》是本好書。

    當(dāng)然,很多IT知名人士也大力推薦,寫了好多讀后感來表述對(duì)這本書的喜歡沒看此書之前,對(duì)所謂大數(shù)據(jù)的概念基本上是一頭霧水,雖則有了解關(guān)注過現(xiàn)在也比較火熱的BI,覺得也差不多,可能就是更多的數(shù)據(jù),更細(xì)致的數(shù)據(jù)分析與數(shù)據(jù)挖掘??催^此書后,感覺到之前的想法,只能算是中了一小半吧—。巨量的數(shù)據(jù),而另一前:著眼于數(shù)據(jù)關(guān)聯(lián)性,而非數(shù)據(jù)精確性,或許才是大數(shù)據(jù)與現(xiàn)時(shí)BI的不同,不僅僅是方法,更多的時(shí)思想方法。不過坦白講,到底是數(shù)據(jù)的關(guān)聯(lián)性重佳,還是數(shù)據(jù)的精確性更好,還真的需要時(shí)間來檢驗(yàn)一下,至少?gòu)默F(xiàn)在的數(shù)據(jù)分析方法來論,更多的傾向于數(shù)據(jù)的精確性。

    看完此書,我心中的一些問題:

    1、什么是大數(shù)據(jù)?

    查了查百度百科,是這樣定義的:大數(shù)據(jù)(bigdata),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity、Variety、Veracity這個(gè)好像是IBM的定義吧。

    以個(gè)人的觀點(diǎn)來看:數(shù)據(jù)海量,存儲(chǔ)海量都是大數(shù)據(jù)的基本原型吧。

    2、大數(shù)據(jù)適合什么樣的企業(yè)?

    誠(chéng)然,大數(shù)據(jù)的前提是海量的數(shù)據(jù),只有擁有巨量的數(shù)據(jù)資源,方能從中查找出數(shù)據(jù)的關(guān)聯(lián)性,才可以讓通過專業(yè)化的處理,讓其為企業(yè)產(chǎn)生價(jià)值。針對(duì)電信運(yùn)營(yíng),互聯(lián)網(wǎng)應(yīng)用這樣海量用戶的數(shù)據(jù)的大企業(yè),也是在應(yīng)用大數(shù)據(jù)的道路上擁有得天獨(dú)厚的條件,但是針對(duì)中小企業(yè)呢?銷售訂單數(shù)據(jù)?若非百年老店,估計(jì)數(shù)據(jù)也是少得可憐,能用的可能只有消費(fèi)者數(shù)據(jù)了吧。貌似大多數(shù)廠商,用來舉例的也就是消費(fèi)都購(gòu)買行為分析為最多。

    同樣,在公共事業(yè)類的政府機(jī)構(gòu),大數(shù)據(jù)的作用也許也能很好的發(fā)揮。反而感覺在大多數(shù)中小型企業(yè)應(yīng)用大數(shù)據(jù),似乎有點(diǎn)大題小作。書中說:大數(shù)據(jù)是企業(yè)競(jìng)爭(zhēng)力。誠(chéng)然,數(shù)據(jù)是一個(gè)企業(yè)的核心無形資源(利用得好的話),但是否所有的數(shù)據(jù),或都換則方式說:所有的企業(yè)都以大數(shù)據(jù)為競(jìng)爭(zhēng)力,是否真的合適么?是否在中小企業(yè)中,會(huì)顯示得小題大做呢?

    3、大數(shù)據(jù)帶來的影響

    當(dāng)一波又一波的IT技術(shù)熱潮源源不斷地向我們鋪面而來的時(shí)候,你甚至都沒有做好準(zhǔn)備,你都要開始迎接它所給你帶來的影響了。經(jīng)過物聯(lián)網(wǎng),云計(jì)算的推波助瀾下,大數(shù)據(jù)開始登場(chǎng)了。但它到底給我們帶來了什么呢?

    1)預(yù)測(cè)未來書中以Google成功預(yù)測(cè)了未來可能發(fā)生流感的案例來開篇,表明通過大數(shù)據(jù)的應(yīng)用,可以為我們的生活起一個(gè)保駕護(hù)航的指向標(biāo)。實(shí)質(zhì)很簡(jiǎn)單,技術(shù)改變世界。

    2)變革商業(yè)大數(shù)據(jù)所帶來的商機(jī),同時(shí)會(huì)衍生出一系列與大數(shù)據(jù)相關(guān)的商業(yè)機(jī)遇與商業(yè)模式,數(shù)據(jù)的潛在價(jià)值會(huì)源源不斷地發(fā)揮作用可以容易想到的是未來有專門的數(shù)據(jù)收集,數(shù)據(jù)分析,數(shù)據(jù)生成的一條數(shù)據(jù)產(chǎn)業(yè)鏈產(chǎn)生。影響的,當(dāng)然是IT公司

    3)變革思維書中所說:因?yàn)橛泻A康臄?shù)據(jù)作基礎(chǔ),未來,我們可能更關(guān)注數(shù)據(jù)的相關(guān),而非精細(xì)度。對(duì)這條,本人還是持保留意見的。

    大數(shù)據(jù)時(shí)代的讀書心得及筆記(精選篇3)

    如今說起新媒體和互聯(lián)網(wǎng),必提大數(shù)據(jù),似乎不這樣說就OUT了。而且人云亦云的居多,不少談?wù)撜呱踔吝€沒有認(rèn)真讀過這方面的經(jīng)典著作——舍恩佰格的《大數(shù)據(jù)時(shí)代》。維克托·邁爾舍恩伯格何許人也?他現(xiàn)任牛津大學(xué)網(wǎng)絡(luò)學(xué)院互聯(lián)網(wǎng)研究所治理與監(jiān)管專業(yè)教授,曾任哈佛大學(xué)肯尼迪學(xué)院信息監(jiān)管科研項(xiàng)目負(fù)責(zé)人。他的咨詢客戶包括微軟、惠普和IBM等全球企業(yè),他是歐盟互聯(lián)網(wǎng)官方政策背后真正的制定者和參與者,他還先后擔(dān)任多國(guó)政府高層的智囊。這位被譽(yù)為:大數(shù)據(jù)時(shí)代的。預(yù)言家“的牛津教授真牛!那么,這位大師說的都是金科玉律嗎?并不一定,讀大師的作品一定要做些功課才好讀懂,才能能與之進(jìn)行一場(chǎng)思想上的對(duì)話。

    舍恩伯格分三部分來討論大數(shù)據(jù),即思維變革、商業(yè)變革和管理變革。

    在第一部分”大數(shù)據(jù)時(shí)代的思維變革“中,舍恩伯格旗幟鮮明的亮出他的三個(gè)觀點(diǎn):

    一、更多:不是隨機(jī)樣本,而是全體數(shù)據(jù)。

    二、更雜:不是精確性,而是混雜性。

    三、更好:不是因果關(guān)系,而是相關(guān)關(guān)系。對(duì)于第一個(gè)觀點(diǎn),我不敢茍同。

    一方面是對(duì)全體數(shù)據(jù)進(jìn)行處理,在技術(shù)和設(shè)備上有相當(dāng)高的難度。另一方面是不是都有此必要,對(duì)于簡(jiǎn)單事實(shí)進(jìn)行判斷的數(shù)據(jù)分析難道也要采集全體數(shù)據(jù)嗎?

    我曾與香港城市大學(xué)的祝建華教授討論過。祝教授是傳播學(xué)研究方法和數(shù)據(jù)分析的專家,他認(rèn)為一定可以找到一種數(shù)理統(tǒng)計(jì)方法來進(jìn)行分析,并不一定需要全部數(shù)據(jù)。聯(lián)系到舍恩伯格第二個(gè)觀點(diǎn)中所說的相關(guān)關(guān)系,我理解他說的全體數(shù)據(jù)不是指數(shù)量而是指范圍,即大數(shù)據(jù)的隨機(jī)樣本不限于目標(biāo)數(shù)據(jù),還包括目標(biāo)以外的所有數(shù)據(jù)。我認(rèn)為大數(shù)據(jù)分析不能排除隨機(jī)抽樣,只是抽樣的方法和范圍要加以拓展。

    我同意舍恩伯格的第二觀點(diǎn),我認(rèn)為這是對(duì)他第一個(gè)觀點(diǎn)很好的補(bǔ)充,這也是對(duì)精準(zhǔn)傳播和精準(zhǔn)營(yíng)銷的一種反思?!贝髷?shù)據(jù)的簡(jiǎn)單算法比小數(shù)據(jù)的復(fù)雜算法更有效?!案哂泻暧^視野和東方哲學(xué)思維。對(duì)于舍恩伯格的第三個(gè)觀點(diǎn),我也不能完全贊同?!辈皇且蚬P(guān)系,而是相關(guān)關(guān)系。“不需要知道”為什么“,只需要知道”是什么“。傳播即數(shù)據(jù),數(shù)據(jù)即關(guān)系。在小數(shù)據(jù)時(shí)代人們只關(guān)心因果關(guān)系,對(duì)相關(guān)關(guān)系認(rèn)識(shí)不足,大數(shù)據(jù)時(shí)代相關(guān)關(guān)系舉足輕重,如何強(qiáng)調(diào)都不為過,但不應(yīng)該完全排斥它。大數(shù)據(jù)從何而來?為何而用?如果我們完全忽略因果關(guān)系,不知道大數(shù)據(jù)產(chǎn)生的前因后果,也就消解了大數(shù)據(jù)的人文價(jià)值。如今不少學(xué)者為了闡述和傳播其觀點(diǎn)往往語(yǔ)出驚人,對(duì)舊有觀念進(jìn)行徹底的否定。

    世間萬(wàn)物的復(fù)雜性多樣化并非非此即彼那么簡(jiǎn)單,舍恩伯格也是這種二元對(duì)立的幼稚思維嗎?其實(shí)不然,讀者在閱讀時(shí)一定要看清楚他是在什么語(yǔ)境下說的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說舍恩伯格在提出”不是因果關(guān)系,而是相關(guān)關(guān)系。“這一論斷時(shí),他在書中還說道:”在大多數(shù)情況下,一旦我們完成了對(duì)大數(shù)據(jù)的相關(guān)關(guān)系分析,而又不再滿足于僅僅知道‘是什么’時(shí),我們就會(huì)繼續(xù)向更深層次研究的因果關(guān)系,找出背后的‘為什么’?!癧i]由此可見,他說的全體數(shù)據(jù)和相關(guān)關(guān)系都在特定語(yǔ)境下的,是在數(shù)據(jù)挖掘中的選項(xiàng)。

    大數(shù)據(jù)研究的一大驅(qū)動(dòng)力就是商用,舍恩伯格在第二部分里討論了大數(shù)據(jù)時(shí)代的商業(yè)變革。舍恩伯格認(rèn)為數(shù)據(jù)化就是一切皆可”量化“,大數(shù)據(jù)的定量分析有力地回答”是什么“這一問題,但仍然無法完全回答”為什么“。因此,我認(rèn)為并不能排除定性分析和質(zhì)化研究。數(shù)據(jù)創(chuàng)新可以創(chuàng)造價(jià)值,這是毫無疑問的。舍恩伯格在討論大數(shù)據(jù)的角色定位時(shí)仍把它置于數(shù)據(jù)應(yīng)用的商業(yè)系統(tǒng)中,而沒有把它置于整個(gè)社會(huì)系統(tǒng)里,但他在第二部分大數(shù)據(jù)時(shí)代的管理變革中討論了這個(gè)問題。

    在風(fēng)險(xiǎn)社會(huì)中信息安全問題日趨凸顯。如何擺脫大數(shù)據(jù)的困境?舍恩伯格在最后一節(jié)”掌控“中試圖回答,但基本上屬于老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個(gè)問題?至少可以提供更多的思考維度。正如舍恩伯格在結(jié)語(yǔ)中所道:”大數(shù)據(jù)并不是一個(gè)充斥著算法和機(jī)器的冰冷世界,人類的作用依然無法被完全替代。大數(shù)據(jù)為我們提供的不是最終答案,只是參考的答案,幫助是暫時(shí)的,而更好的方法和答案還在不久的未來?!爸x謝舍恩伯格!讓大數(shù)據(jù)討論從自然科學(xué)回到人文社科。由此推斷,《大數(shù)據(jù)時(shí)代》不是最終答案,也不是標(biāo)準(zhǔn)答案,只是參考的答案。

    此外,在閱讀此書之前還必須具備一些數(shù)據(jù)科學(xué)的基本知識(shí)和基本概念,比如說什么叫數(shù)據(jù)?什么叫大數(shù)據(jù)?數(shù)據(jù)分析與數(shù)據(jù)挖掘的區(qū)別,數(shù)字化與數(shù)據(jù)化有什么不同?讀前做些功課讀起來就比較好懂了。

    大數(shù)據(jù)時(shí)代的讀書心得及筆記(精選篇4)

    信息時(shí)代的到來,我們感受到的是技術(shù)變化日新月異,隨之而來的是生活方式的轉(zhuǎn)變我們這樣評(píng)論著的信息時(shí)代已經(jīng)變?yōu)樵?jīng)。如今,大數(shù)據(jù)時(shí)代成為炙手可熱的話題。筆者在這說明信息和數(shù)據(jù),只是試圖首先說明信息、數(shù)據(jù)的關(guān)系和不同,也試圖說明,為什么信息時(shí)代轉(zhuǎn)變?yōu)榱舜髷?shù)據(jù)時(shí)代?大數(shù)據(jù)時(shí)代帶給了我們什么?

    信息和數(shù)據(jù)的定義。維基百科解釋:信息,又稱資訊,是一個(gè)高度概括抽象概念,是一個(gè)發(fā)展中的動(dòng)態(tài)范疇,是進(jìn)行互相交換的內(nèi)容和名稱,信息的界定沒有統(tǒng)一的定義,但是信息具備客觀、動(dòng)態(tài)、傳遞、共享、經(jīng)濟(jì)等特性卻是大家的共識(shí)。數(shù)據(jù):或稱資料,指描述事物的符號(hào)記錄,是可定義為意義的實(shí)體,它涉及到事物的存在形式。它是關(guān)于事件之一組離散且客觀的事實(shí)描述,是構(gòu)成信息和知識(shí)的原始材料。數(shù)據(jù)可分為模擬數(shù)據(jù)和數(shù)字?jǐn)?shù)據(jù)兩大類。數(shù)據(jù)指計(jì)算機(jī)加工的“原料”,如圖形、聲音、文字、數(shù)、字符和符號(hào)等。從定義看來,數(shù)據(jù)是原始的處女地,需要耕耘。信息則是已經(jīng)處理過的可以傳播的資訊。信息時(shí)代依賴于數(shù)據(jù)的爆發(fā),只是當(dāng)數(shù)據(jù)爆發(fā)到無法駕馭的狀態(tài),大數(shù)據(jù)時(shí)代應(yīng)運(yùn)而生。這是否是《大數(shù)據(jù)時(shí)代》一書所未曾闡述的背景材料?

    在《大數(shù)據(jù)時(shí)代》一書中,大數(shù)據(jù)時(shí)代與小數(shù)據(jù)時(shí)代的區(qū)別:

    1、思維慣例。大數(shù)據(jù)時(shí)代區(qū)別與轉(zhuǎn)變就是,放棄對(duì)因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語(yǔ)言絕對(duì),卻反思其本質(zhì)區(qū)別。數(shù)據(jù)的更多、更雜,導(dǎo)致應(yīng)用主意只能盡量觀察,而不是傾其所有進(jìn)行推理?這也是明智之舉。

    2、使用用途。小數(shù)據(jù)停留在說明過去,大數(shù)據(jù)用驅(qū)動(dòng)過去來預(yù)測(cè)未來。筆者認(rèn)為數(shù)據(jù)的用途意在何為,與數(shù)據(jù)本身無關(guān),而與數(shù)據(jù)的解讀者有關(guān),而相關(guān)關(guān)系更有利于預(yù)測(cè)未來。

    3、結(jié)構(gòu)。大數(shù)據(jù)更多的體現(xiàn)在海量非結(jié)構(gòu)化數(shù)據(jù)本身與處理方法的整合。大數(shù)據(jù)更像是理論與現(xiàn)實(shí)齊頭并進(jìn),理論來創(chuàng)立處理非結(jié)構(gòu)化數(shù)據(jù)的方法,處理結(jié)果與未來進(jìn)行驗(yàn)證。

    4、分析基礎(chǔ)。大數(shù)據(jù)是在互聯(lián)網(wǎng)背景下數(shù)據(jù)從量變到質(zhì)變的過程。筆者認(rèn)為,小數(shù)據(jù)時(shí)代也即是信息時(shí)代,是大數(shù)據(jù)時(shí)代的前提,大數(shù)據(jù)時(shí)代是升華和進(jìn)化,本質(zhì)是相輔相成,而并非相離互斥。

    數(shù)據(jù)未來的故事。數(shù)據(jù)的發(fā)展,給我們帶來什么預(yù)期和啟示?銀行業(yè)天然有大數(shù)據(jù)的潛質(zhì)??蛻魯?shù)據(jù)、交易數(shù)據(jù)、管理數(shù)據(jù)等海量數(shù)據(jù)不斷增長(zhǎng),海量機(jī)遇和挑戰(zhàn)也隨之而來,適應(yīng)變革,適者生存。我們可以有更廣闊的業(yè)務(wù)發(fā)展空間、可以有更精準(zhǔn)的決策判斷能力、可以有更優(yōu)秀的經(jīng)營(yíng)管理能力可以這些都基于數(shù)據(jù)的收集、整理、駕馭、分析能力,基于脫穎而出的創(chuàng)新思維和執(zhí)行。因此,建設(shè)“數(shù)據(jù)倉(cāng)庫(kù)”,培養(yǎng)“數(shù)據(jù)思維”,養(yǎng)成“數(shù)據(jù)治理”,創(chuàng)造“數(shù)據(jù)融合”,實(shí)現(xiàn)“數(shù)據(jù)應(yīng)用”才能擁抱“大數(shù)據(jù)”時(shí)代,從數(shù)據(jù)中攫取價(jià)值,笑看風(fēng)云變換,穩(wěn)健贏取未來。

    大數(shù)據(jù)時(shí)代的讀書心得及筆記(精選篇5)

    這本書里主要介紹的是大數(shù)據(jù)在現(xiàn)代商業(yè)運(yùn)作上的應(yīng)用,以及它對(duì)現(xiàn)代商業(yè)運(yùn)作的影響。

    《大數(shù)據(jù)時(shí)代》這本書的結(jié)構(gòu)框架遵從了學(xué)術(shù)性書籍的普遍方式。也既,從現(xiàn)象入手,繼而通過對(duì)現(xiàn)象的解剖提出對(duì)這一現(xiàn)象的解釋。然后在通過解釋在對(duì)未來進(jìn)行預(yù)測(cè),并對(duì)未來可能出現(xiàn)的問題提出自己看法與對(duì)策。

    下面來重點(diǎn)介紹《大數(shù)據(jù)時(shí)代》這本書的主要內(nèi)容。

    《大數(shù)據(jù)時(shí)代》開篇就講了Google通過人們?cè)谒阉饕嫔纤阉麝P(guān)鍵字留下的數(shù)據(jù)提前成功的預(yù)測(cè)了20__年美國(guó)的H1N1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。Google的預(yù)測(cè)比政府提前將近一個(gè)月,相比之下政府只能夠在流感爆發(fā)一兩個(gè)周之后才可以弄到相關(guān)的數(shù)據(jù)。同時(shí)Google的預(yù)測(cè)與政府?dāng)?shù)據(jù)的相關(guān)性高達(dá)97%,這也就意味著Google預(yù)測(cè)數(shù)據(jù)的置信區(qū)間為3%,這個(gè)數(shù)字遠(yuǎn)遠(yuǎn)小于傳統(tǒng)統(tǒng)計(jì)學(xué)上的常規(guī)置信區(qū)間5%!而這個(gè)數(shù)字就是大數(shù)據(jù)時(shí)代預(yù)測(cè)結(jié)果的相對(duì)準(zhǔn)確性與事件的可預(yù)測(cè)性的最好證明!通過這一事以及其他的案例,維克托提出了在大數(shù)據(jù)時(shí)代“樣本=總體”的思想。我們都知道當(dāng)樣本無限趨近于總體的時(shí)候,通過計(jì)算得到的描述性數(shù)據(jù)將無限的趨近于事件本身的性質(zhì)。而之前采取的“樣本<總體”的做法很大程度上無法做到更進(jìn)一步的描述事物,因?yàn)橹暗臅r(shí)代數(shù)據(jù)的獲取與存儲(chǔ)處理本身有很大的難度只導(dǎo)致人們采取抽樣的方式來測(cè)量事物。而互聯(lián)網(wǎng)終端與計(jì)算機(jī)的出現(xiàn)使數(shù)據(jù)的獲取、存儲(chǔ)與處理難度大大降低,因而相對(duì)準(zhǔn)確性更高的“樣本=總體”的`測(cè)算方式將成為大數(shù)據(jù)時(shí)代的主流,同時(shí)大數(shù)據(jù)時(shí)代本身也是建立在大批量數(shù)據(jù)的存儲(chǔ)與處理的基礎(chǔ)之上的。

    接下來,維克多又通過了IBM追求高精確性的電腦翻譯計(jì)劃的失敗與Google只是將所有出現(xiàn)過的相應(yīng)的文字語(yǔ)句掃描并儲(chǔ)存在詞庫(kù)中,所以無論需要翻譯什么,只要有聯(lián)系Google詞庫(kù)就會(huì)出現(xiàn)翻譯,雖然有的時(shí)候的翻譯很無厘頭,但是大多數(shù)時(shí)候還是正確的,所以Google的電腦翻譯的計(jì)劃的成功,表明大數(shù)據(jù)時(shí)代對(duì)準(zhǔn)確性的追求并不是特別明顯,但是相反大數(shù)據(jù)時(shí)代是建立在大數(shù)據(jù)的基礎(chǔ)住上的,所以大數(shù)據(jù)時(shí)代追求的是全方位覆蓋的數(shù)字測(cè)度而不管其準(zhǔn)確性到底有多高,因?yàn)榇罅康臄?shù)據(jù)會(huì)湮埋少數(shù)有問題的數(shù)據(jù)所帶來的影響。同時(shí)大量的數(shù)據(jù)也會(huì)無限的逼近事物的原貌。之后,維克托又預(yù)測(cè)了一個(gè)在大數(shù)據(jù)時(shí)代催生的重要職業(yè)——數(shù)據(jù)科學(xué)家,這是一群數(shù)學(xué)家、統(tǒng)計(jì)學(xué)與編程家的綜合體,這一群人將能夠從獲取的數(shù)據(jù)中得到任何他們想要的結(jié)果。換言之,只要數(shù)據(jù)充足我們的一切外在的與內(nèi)在的我們不想讓他人知道的東西都見會(huì)在這一群家伙的面前展現(xiàn)得淋漓盡致。所以為了避免個(gè)人隱私在大數(shù)據(jù)時(shí)代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數(shù)據(jù)為商業(yè)部門服務(wù),而另一群人則負(fù)責(zé)審查這一些人是否合法的獲得與應(yīng)用數(shù)據(jù),是否侵犯了個(gè)人隱私。

    無論如何,大數(shù)據(jù)時(shí)代將會(huì)到來,不管我們接受還是不接受!

    我覺得《大數(shù)據(jù)時(shí)代》這本書寫的很好,很值得一讀。因?yàn)闀?huì)給我們很多啟發(fā),比如你在相關(guān)的社交網(wǎng)站發(fā)表的言論或者照片都很有可能被“數(shù)據(jù)科學(xué)家”們利用,從而再將相關(guān)數(shù)據(jù)賣給各大網(wǎng)店。不過,事實(shí)就是我們將會(huì)成為被預(yù)測(cè)被引誘的對(duì)象。所以說,小心你在網(wǎng)上留下的痕跡。

    我喜歡這本書是因?yàn)樗o我展現(xiàn)了一個(gè)新的世界。

    363590