今天早上讀到一篇關(guān)于因果推斷的文章。讓我想起北京大學(xué)的耿直老師。耿老師是我非常敬重的學(xué)者。十多年前,我從耿老師那里學(xué)到了這個(gè)概念,我覺得特別有意思。但我總是覺得有點(diǎn)不解:從數(shù)據(jù)上能推斷出因果關(guān)系嗎?
若干年后我終于想明白了:數(shù)學(xué)中的因果關(guān)系和客觀世界的因果關(guān)系其實(shí)并不一樣。數(shù)學(xué)領(lǐng)域的因果關(guān)系一定是有前提假設(shè)的。我估計(jì),這些假設(shè)應(yīng)該包括:“原因”是可見的、并且與其他變量有一定的獨(dú)立性。在這些條件邊界內(nèi),我們可以推斷變量之間是否有因果關(guān)系。但是,如果數(shù)據(jù)不滿足這些條件,數(shù)學(xué)上的因果關(guān)系就不是客觀世界的因果關(guān)系。比如,推定某個(gè)變量X1是“原因”時(shí),客觀世界的真正原因可能是某個(gè)未被采集的、并且與之相關(guān)的X2。
“因果推斷”是有價(jià)值的,價(jià)值在于幫助人們做分析。但做分析的前提必須人類去準(zhǔn)備、去判斷。但數(shù)據(jù)的準(zhǔn)備和判斷并不容易。我曾經(jīng)多次說:經(jīng)典統(tǒng)計(jì)學(xué)理論之所以被有些人認(rèn)定為“無效”,其實(shí)是因?yàn)閿?shù)據(jù)準(zhǔn)備不到位。而大數(shù)據(jù)時(shí)代的變化之一,就是便于我們選擇數(shù)據(jù)、準(zhǔn)備條件。
另外,今天早上還讀到一頁紙,對(duì)控制理論的方法進(jìn)行了綜述。應(yīng)該說,這一頁紙的總結(jié)相當(dāng)全面。但我內(nèi)心卻想:即便這些方法都掌握了,遇到現(xiàn)實(shí)問題可能仍然不會(huì)做。為什么呢?因?yàn)楹芏嗳瞬恢廊绾胃鶕?jù)現(xiàn)實(shí)條件選擇方法。
一般來說,現(xiàn)實(shí)的條件總是與理論上說的不一樣??辞宄F(xiàn)實(shí)條件的影響、做出恰當(dāng)?shù)募僭O(shè),是比用算法更大的能耐、需要更大的視野。
我們在小學(xué)、中學(xué)、大學(xué)乃至研究生階段受到的教育、學(xué)到的知識(shí),總是在一定的假設(shè)下成立的、是有邊界條件的。這樣會(huì)養(yǎng)成一種“封閉”的思維方式。但實(shí)際工作和讀書是不一樣的。做實(shí)際工作的時(shí)候,必須有更大的視野:你需要去思考一下,你的假設(shè)到底是不是成立。要學(xué)會(huì)根據(jù)實(shí)際情況選擇方法,而不是奢求實(shí)際服從你認(rèn)可的理論。
作者:郭朝暉(工學(xué)博士,教授級(jí)高工。企業(yè)研發(fā)一線工作20年;優(yōu)也科技信息公司首席科學(xué)家;東北大學(xué)、上海交大等多所院校兼職教授。國內(nèi)知名智庫、走向智能研究院的發(fā)起人之一。原寶鋼研究院首席研究員)