最近和幾位朋友談到同一個問題:從數(shù)據(jù)中獲得知識。有人談起,他們準備做工業(yè)大腦,大量應用機器學習。對這種做法的成效,我表示了擔憂。
人們很早就知道,可以從工業(yè)數(shù)據(jù)中獲得知識。但是,現(xiàn)實卻往往并不理想。一個重要的原因是:與數(shù)據(jù)分析師相比,工業(yè)人往往并不缺乏專業(yè)知識。所以,數(shù)據(jù)分析師看到的相關性,或者是假象、或者是工業(yè)人老早就了解的知識,很少增加新知識。所以,數(shù)據(jù)分析的實際作用,往往定位在比經(jīng)驗更準一點。其實,“更準一點”也不容易做到:因為工業(yè)現(xiàn)場數(shù)據(jù)的質量往往不理想,分析結果常常存在“有偏估計”。
從數(shù)據(jù)中難以得到新知識,還有一個原因:工業(yè)過程和工業(yè)對象都是人造的。在正常的情況下,往往反映的就是人類已知的知識。容易發(fā)現(xiàn)新知識的數(shù)據(jù),往往是那些有點“異常”的數(shù)據(jù)。正常生產(chǎn)的數(shù)據(jù)雖然很多,卻不容易蘊含新知識。這有點像人的創(chuàng)新:善于創(chuàng)新的人,往往是那些想到“盒子之外”的人。
但是,異常數(shù)據(jù)也不一定產(chǎn)生知識。在多數(shù)情況下,異常數(shù)據(jù)往往是數(shù)據(jù)的采集或收集過程出了問題。對數(shù)據(jù)分析師來說,真正的“異常過程”往往是可遇不可求的、是難得的機會。因為管理好的企業(yè),應該很少出現(xiàn)異常。而且,對數(shù)據(jù)分析師來說,“異?!焙芸赡苁菍I(yè)過程和對象的理解不到位導致的,屬于“少見多怪”。
根據(jù)筆者的經(jīng)驗,發(fā)現(xiàn)知識的一種可能性是“知識的融合”。不同的產(chǎn)品、不同的設備狀態(tài)、不同的流程背后都有人類積累的知識。但這些知識往往是碎片化的,僅僅適合特定的場景。把這些知識融合在一起,形成廣泛適用的知識,是非常值得做的事情。這樣的知識一旦形成,對創(chuàng)新和優(yōu)化的意義非常巨大,也有知識發(fā)現(xiàn)的空間。
數(shù)據(jù)分析有一個非常重大的意義,就是掌握現(xiàn)代化技術的抓手。
我國的許多先進技術都是從國外引進的。長期以來,我們并沒有把引進技術消化透。我們或許會用這些技術,卻不能很好地掌握這些技術。就像會開車的人不一定會修車、不一定會造車。這是個很大的麻煩,使得我們無法擺脫“引進落后,再引進再落后”的怪圈。
要擺脫這個怪圈,需要對引進技術深入理解。但如何才能深入理解呢?小平同志說:掌握新技術,要善于學習更要善于創(chuàng)新。實踐證明,只有在創(chuàng)新中才能學習到位。但這里又遇到一個困境:學都沒學好,如何創(chuàng)新呢?
答案是從改進型的“微創(chuàng)新”開始。員工小改小革發(fā)揮的作用或許不大,但通過小改小革,卻能深入地了解引進技術。小改小革的次數(shù)多了,也就容易掌握引進技術了。所以,小改小革是培養(yǎng)人、培養(yǎng)能力的抓手。
怎樣小改小革?我曾經(jīng)給某公司領導建議抓兩件事:“不犯二次錯、做得更好點”。產(chǎn)品質量或設備出現(xiàn)問題是難免的,要努力做到不犯第二次錯誤;每次生產(chǎn)都涉及到質量、成本、效率等問題,希望每次都有進步或者保持最好。這兩件事看起來很小,但卻能把數(shù)字化相關的技術拉動起來。這個道理我在過去的文章中講過,這里就不多說了。
做這兩件事的時候,幾乎一定會遇到數(shù)據(jù)分析:為什么出問題了?如何做得更好一點?所以,數(shù)據(jù)分析往往是支持“微創(chuàng)新”的必要手段。在數(shù)據(jù)分析過程中,我們可以從微觀角度深入地理解技術的本質。對高度自動化的企業(yè),更是如此。因為生產(chǎn)技術都寫入了計算機,都由數(shù)據(jù)表現(xiàn)出來了。當年寶鋼第一批技術業(yè)務專家,搞計算機的比例很大,總體上與此有關。
我們知道:在許多傳統(tǒng)制造行業(yè),美國原本是領頭羊,但日本制造卻不斷超越美國。這一點,很少國家能夠做到。在我看來,日本人做到這一點的重要原因,是有著精益求精的精神。在求精的過程中,真正認識、掌握新技術,從而超越了美國。我們的企業(yè)往往缺乏精益求精的精神,也就難以實現(xiàn)從跟隨到超越的轉變。
數(shù)字化時代的到來,給我們提供了新的機會。數(shù)據(jù)分析,幫助我們抓住機會。但我認為:對機器學習的作用不要過于迷信。智能化我往往是“用人明白的道理,讓機器做得更好”。我們做數(shù)據(jù)分析,往往首先是變成“人明白的道理”,然后再寫入計算機中。如果跨越了人的這一步,工廠敢讓機器去決策嗎?簡單決策可以,復雜就不行了。
作者:郭朝暉(工學博士,教授級高工。企業(yè)研發(fā)一線工作20年;優(yōu)也科技信息公司首席科學家;東北大學、上海交大等多所院校兼職教授。國內知名智庫、走向智能研究院的發(fā)起人之一。原寶鋼研究院首席研究員)
共有訪客發(fā)表了評論
網(wǎng)友評論