电竞比分网-中国电竞赛事及体育赛事平台

分享

(大數(shù)據(jù))“思路變,天地寬”—用強相關(guān)性取代因果關(guān)系解決問題

 wenxuefeng360 2019-09-06

香農(nóng)提出的信息論,其實是一種全新的方法論。如果說機械思維的方法論是建立在確定性上的,而大數(shù)據(jù)思維的信息論就是建立在不確定性上面。大數(shù)據(jù)的本質(zhì)就是消除不確定性。大數(shù)據(jù)有三個特征,數(shù)據(jù)量大,多維度和完備性。我們從信息論出發(fā),可以這樣解釋,數(shù)據(jù)量的問題,就是通過計算機的發(fā)展,掌握大量的數(shù)據(jù)。多維度,可以聯(lián)系之前提到的“互信息”概念理解,我們想要搞清楚需要研究的問題,肯定是收集到的數(shù)據(jù)關(guān)聯(lián)性越強,就會越容易得出結(jié)論。完備性,就是說數(shù)據(jù)量覆蓋全面,不會有漏網(wǎng)之魚。

為什么說大數(shù)據(jù)思維是一種全新的思維革命?從它的方法論中就可以看出,機械思維的方法論是因果關(guān)系,而大數(shù)據(jù)思維的方法論是強相關(guān)關(guān)系,也就是關(guān)聯(lián)性。從藥品的開發(fā)案例就可以加以區(qū)分。19世紀中期,青霉素發(fā)明過程就是因果關(guān)系的產(chǎn)物。人們的目的很明確,必須殺死致病菌才能治好疾病,所以科學家都在研究如何將細菌殺死,而通過因果關(guān)系找到的解決方案,就讓人感覺十分的可信,其他新藥的研制過程也是這樣,首先分析致病產(chǎn)生的原因,再從源頭上出發(fā),殺死致病菌。這樣的思路是沒有問題的,但是在實際操作中,研制一場新藥的時間成本和費用成本都十分高昂。

而在大數(shù)據(jù)時代,研制一種新藥的時間和成本,都被大大地縮短了。因為醫(yī)學專家發(fā)現(xiàn),人們的處方藥,以及疾病的種類都是有限的??梢岳么髷?shù)據(jù)的思維,將現(xiàn)有藥品和人類疾病進行配對,就會得到意料之外的收獲,比如說,原先用來治療心臟病的藥物可以對胃病有效。有了這樣的結(jié)論,再推導原因就變得十分的簡單了,這樣一來,花在尋找新藥上的時間和成本都會降低。簡單說來,可以說是用大數(shù)據(jù)的思維,用已知結(jié)果而倒逼出原因。

書中還舉了另外一個例子,大數(shù)據(jù)思維甚至可以運用在法律上,用相關(guān)性決定了判罰的結(jié)果。在20世紀90年代的美國歷史上發(fā)生過一次世紀大訴訟。對戰(zhàn)雙方是密西西比州的總檢察長麥克和大煙草商。因為導致吸煙者疾?。ㄈ绶伟┑挠绊懸蛩睾芏?,單靠因果關(guān)系無法證明是吸煙所致。無奈之下,檢察官聘請了多位科學家進行數(shù)據(jù)收集工作,足跡遍布世界各地。最終用大數(shù)據(jù)的思維的方法論,得出了肺癌和吸煙之間的關(guān)系作為強有力的證據(jù),才讓煙草商賠了一大筆錢。

總的說來,在大數(shù)據(jù)時代,我們可以運用大數(shù)據(jù)直接獲得答案,再從答案推導出原因,或者直接利用答案解決問題,跳出機械思維因果關(guān)系的桎梏。這也是現(xiàn)今許多面對市場反應迅速的互聯(lián)網(wǎng)公司比傳統(tǒng)公司更勝一籌的原因。

    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多