資料之巔讀書筆記
巔峰資料是一本有關大資料的書,以下是小編收集的讀書筆記,僅供大家閱讀參考!
資料之巔讀書筆記一
最近讀了塗子沛先生的《資料之巔》感慨良多,頗有不吐不快的感覺,資料之巔讀後感。塗先生作為將"大資料"概念引入中國的學者,其認識的深刻程度自然非同一般。而種深刻表現在對歷史大背景的理解上。我特別感興趣的,是大資料時代到來之前的故事。
"如果按照我倡導的原則去做,你們就能生產出高質量的產品。五年以內,日本產品將佔領整個國際市場。" 60多年前,質量管理之父戴明給日本企業家這樣的承諾。那時的日本產品,還是以"劣質"而聞名。所有人都將信將疑。但事實卻是:僅僅用了四年,日本的優質產品開始佔領世界。
戴明為什麼有這麼大的信心呢?當時的日本剛剛戰敗,多數人吃不飽肚子。戴明見到的卻是整潔的街道、守紀律的國民。戴明教給日本人的招數,是用資料統計的辦法管理質量;這種方法與日本民族做事認真、遵守紀律、一絲不苟的民族文化是吻合的。此後的20多年,日本製造一路走高,靠質量實現了"逆襲"、超越了美國。
這段時間,美國製造業又在做什麼呢?二戰以後,各國百廢待興,美國本土沒有經歷戰爭的破壞。在很長的時間裡,美國產品供不應求,成為世界各國的"搶手貨":生意好做了,對質量的重視程度也就不夠了,從而為日本的趕超提供了機會。直到日本人打到"家門口",美國人才如夢方醒。美國人驚奇地發現:這位"牆內開花牆外香"、對日本製造有巨大貢獻的戴明,居然居住在距離白宮不到六英里的地方。
戴明和他的方法來自於美國。美國為什麼會產生這種方法呢?恐怕這也與其文化有關:美國是個講究民主和法治的國家,凡事要爭論、要講道理。爭論要有是非曲直、最終要"用資料說話".但是,人們也意識到:資料不僅"會說話",也會"說大話"、"說謊話".所以,用資料說話,必須講究科學。這樣看來,戴明來自美國也就不足為怪了。
其實,戴明的質量管理方法早已傳到了中國。
但是,幾十年過去了,我們仍然難以擺脫"低質"、"山寨"的帽子、甚至有愈演愈烈的可能。由此可見:我們缺少的不是方法,而是深層次的原因。
改革開放以後,我們有接近40年高速發展的歷史。在這段時期,中國依靠廉價的勞動力,生產出物美價廉的產品。但所謂"物美價廉",往往是更重視成本。在保GDP、保就業的背景下,假冒偽劣產品受到了縱容,以至於市場出現了逆向淘汰。於是,原本信奉質量第一的企業被迫做出改變、搞質量的人被邊緣化了、企業質量意識就這樣淡薄了。
輕視質量還有很多間接的危害。例如,提高質量往往是創新最重要的直接目標之一。離開質量談創新,就失去了落地的基礎。中國科技界的很多問題與此有關:高校的技術創新往往脫離實際、產學研往往難以結合。可以說,離開高質量的追求,中國製造就缺少了脊樑骨。
我們在追求先進理念的時候,一般不會落後。我們常常聽到"用資料說話"的提法。但遺憾的是:現實中,卻常常變味,令人啼笑皆非。
究其原因,人們常常不重視資料的本身質量和分析方法的質量。《資料之巔》曾提到:美國人多次為了資料吵得不可開交,從而推動了相關的立法、提高了資料分析的合理性。事實上,只有可靠的資料加上可靠的分析方法,資料才能說出有用的實話。
然而,我們見到的許多資料卻是騙人的。例如:據說,獲得省部級科技進步獎的潛規則是七億元的效益。如果資料都是準確的',單純獲獎專案獲得的效益,就超過了很多地區的GDP增量,讀後感《資料之巔讀後感》。然而,儘管浮誇的資料如此明顯,卻長期得不到糾正。這使得科技界浮誇的歪風越來越盛,牛皮越來越大而實效卻越來越少。再如,評獎、評職稱都用專利、論文的數量衡量——其實,即便在重視數字的美國,也不主張這種做法。這種做法往往會讓科技工作者急功近利,而不願意去從事真正有價值的創新。不恰當的數字化將很多激勵變成了負激勵。
還有很多地方,數字化的規則制定得明顯不合理。例如,某企業計算某產品的效益時,要把生產裝置的折舊算攤上去——這樣的規定看似有道理,卻導致了昂貴裝置白白的閒置,從而造成了更大的浪費:沒有人願意用這臺裝置生產產品、寧可讓它閒置不用。所以,劣質的數字、劣質的數字化方法,不但不能促進企業的進步和質量的提高,反而有可能起到相反的作用。
我們再看看更深層的原因。人們明明知道這些不合理的現象存在,為什麼卻能長期持續存在?道理很簡單:在這些地方,"用資料說話"變成了一種形式,一種便於交差、便於表功、體現水平的形式。他們並不關心"用資料說話"的目的和最終結果。從本質上說,這種做法不是重視資料,只是用資料做掩飾;不是喜歡"真龍",而是"葉公好龍".
中國製造業要振興,必須從提升質量開始;關注質量,必須從關注資料和分析方法本身的"質量"開始。所有這一切,都需要有個踏實做事、實事求是的文化氛圍。"橘生淮南則為橘,生於淮北則為枳".好的方法必須與文化相匹配。離開良好的文化土壤,再好的辦法也無法發揮實效、也會變味。中國製造業的振興,根子上還是要關注文化。
資料之巔讀書筆記二
第一次讀大資料專題的書,談起讀後感肯定是班門弄斧了,就只是簡單的說一說我的一些看法。
塗子沛的這部《資料之巔》,全書共八章,我原以為所謂"資料之巔"應當是展望未來的大資料時代,沒想到全書竟是立足於過去,從歷史切入。前面六章的內容,以美國自獨立以來的發展歷程為主線,從資料應用的角度,講述美國政治制度,經濟建設以及軍事管理,每一章的結尾又分析中國的現狀,相應對比美國。一個國家的發展歷程,從不同角度切入,就會有不同的著重點:軍事家可能會串起每一次戰爭,分析軍事戰略;經濟學家可能會梳理整個宏觀經濟環境的發展方向;政治學家可能會強調立憲立法各種政治制度的重要性。而作者從資料的角度切入,可以說是別開生面,讓我們看到那些耳熟能詳的故事背後資料所起到的作用。以南北戰爭為例,可能你知道林肯的民心所向,知道奴隸制度順應潮流的消亡,但你未必知道謝爾頓將軍以資料分析為基礎進行的"向大海進軍"的行動。類似的例子有很多,我覺得作者雖然以一個國家的發展歷程為主線,但仍然寫得有些凌亂,好像想到哪個與資料有關的故事就寫哪個似的。美國立法治國過程中政治制度上的博弈、人口普查與統計學、參眾議院的席位設定,到資料在醫學上的應用、在農業上的應用、霍亂井、預算、訴訟實證、農業應用、商業市場調查與專案決策、戴明的質量控制等,然後又穿插講一些資料處理的技巧:資料視覺化、樣本與總體、問卷設計等,接著又跳回內開放:資料與知情權、用資料制衡;直到七八章才涉及一些現代化的資料應用。
可以說,我讀這本書最大的感受,其實是震撼於資料的應用之廣泛之深刻,因為前面六章內容幾乎就是在跟你講資料在美國、中國、日本等的歷史上曾經起到這樣這樣的作用,在美國關於資料的挖掘和處理辦法是怎樣一步步完善。我覺得,這六章內容,跟書名《資料之巔》有些偏頗,主題該是資料,前面一兩章講講資料在美國中國歷史上的作用,讓讀者感受一下資料的魅力,奠定一下基調就夠了,結果直到五六章還是停留在這個層面,讀來就有些膩了。如果書名改成類似《資料與歷史》之類的,反而更好,這些歷史已然是過去,資料之巔應該在未來。但我不得不承認,我確實為這些歷史所震撼,也真的感覺到資料的重要性,未來如果能夠做好資料的挖掘、處理、利用,應該是潛力無限的。
直至七八章,作者開始談及"大資料時代",大資料計算涉及其在社會領域以及物理環境領域兩個方面的應用。社會領域則是我們比較熟悉的,例如從消費記錄瞭解消費心理、捆綁銷售"啤酒與尿布"、阿里巴巴憑交易記錄迅速放貸等等的應用,這些可能也是提及"大資料時代"大眾的第一反應吧。物理環境領域的應用主要就是可穿戴裝置、感測器等等這一類了。從亞馬遜的"預判發貨"、谷歌無人駕駛、3D印表機、智慧學習的平臺等等這些新興事物,我們都可以看到資料在未來的一個發展前景。作者以"石油時代"類比人類即將迎來的"資料時代",其實非常直觀易懂。
第八章作者提出"智慧城市"的概念,講述了See Click、佛山"我的聲音"、舊金山311應用程式、社交媒體nextdoor等眾包、眾智、眾創平臺,講真啊,我不知道這些跟資料有個啥關係……但是作者提出的未來這種"讓大眾解決大眾的問題"的模式我倒很是贊同。這之中跟資料有關的可能是涉及資料的隱私問題吧。大資料時代是不可避免的發展趨勢,但隱私權確實是這個發展潮流中很重大、也必須解決的一個問題。
作者點明,所謂"資料之巔"就是"透過用資料訓練機器,讓機器獲得智慧,為人類提供自動化的服務".要有資料更要有計算,強大的識別演算法才能實現資料探勘,這是現有的階段,而未來應該向"機器學習"發展,亦即編寫"會自動調節的演算法".
這本書,還行。沒有大開腦洞的設想未來,從歷史出發,讓人感受到資料的魅力,在對比中,也讓人看到中國在資料方面與美國的差距,最後的展望,也是立足於現在。所以給人感覺比較踏實,對資料應用的理解更通透,而資料之巔在哪裡,我覺得是每個讀者在這個基礎上延伸出去的頭腦風暴。
真的是很凌亂的讀後感,我覺得被作者看到要吐血的吧…對大資料什麼的真的沒有比較深的瞭解,但是讀完這部《資料之巔》,以後會繼續關注、瞭解相關的內容。