夜城直播_夜城直播app官方正版下载_夜城直播高品质美女在线视频互动社区

工業(yè)大數(shù)據(jù)建模的理論思考

2021/4/13 20:55:47 人評論 次瀏覽 分類:技術(shù)方案  文章地址:http://prosperiteweb.com/tech/3699.html

有個問題,我一直被問了20年:你建的是機理模型還是數(shù)據(jù)模型?其實,早在20年前,我就給出了答案:工業(yè)現(xiàn)場往往沒有純粹的機理模型、也沒有純粹的數(shù)據(jù)模型,而是兩者的融合;差別只是比重的不同。

我發(fā)現(xiàn)經(jīng)常有人過度強調(diào)數(shù)據(jù)算法。在工業(yè)大數(shù)據(jù)大賽結(jié)束后的發(fā)言中,我強調(diào)說:不要急著搞算法、不要急著搞算法、不要急著搞算法。意思是:先去研究一下業(yè)務相關(guān)的知識。


今天突然意識到,這個說法或許需要深化:算法和機理的側(cè)重點,隨著項目、要求和進度的變化而變化。


在許多公開的文章或報道中,作者往往強調(diào)算法的重要性。我過去總是對這種說法嗤之以鼻。但平心而論,也有部分項目是靠著算法贏得成功的。但這種做法存在兩種問題:1、過度依靠算法的模型往往可靠度低,不能用在可靠度要求高的場景。2、這種成功比較依賴于運氣。形象地說,在工業(yè)領(lǐng)域,單純依靠算法成功,就像在山里撿了一塊狗頭金,可遇不可求。


所以,我現(xiàn)在的觀點是:強烈依靠算法的建模方法也可能成功,但概率低、不確定性強,往往只能做要求簡單的事情。所以,如果用戶要求不高,不妨先找?guī)讉€算法試試。但是,隨著對模型可靠度要求的提升、建模工作必須深化,機理介入的深度會逐步加深。這就好比要從靠運氣“撿”金子,發(fā)展到挖礦、乃至用現(xiàn)代技術(shù)冶煉黃金。


理論深入的方向,似乎可以沿著“降低不確定性”的方向發(fā)展。


我有個經(jīng)驗:數(shù)據(jù)建模師,數(shù)據(jù)基礎(chǔ)非常重要。如果數(shù)據(jù)基礎(chǔ)不好,再好的算法都沒有用處。這就好比,在沒有金子的砂子里,再先進的冶煉方法都沒用。


而現(xiàn)在很多人的做法是:先用算法試試看;如果不理想就更換算法。這其實是用算法本身測試數(shù)據(jù)基礎(chǔ)。這種做法的問題是:遇到困難時,人們往往不甘心失敗,可能會在算法上花費大量的無用功。所以,需要研究的一個理論問題是:如何事先分析判斷數(shù)據(jù)基礎(chǔ)能否滿足分析要求。如果條件不理解,可以盡快放棄或者改變目標,避免時間浪費。這是典型的數(shù)學思維:先證明解的存在性,再設(shè)法求解。


在此基礎(chǔ)上,理論的發(fā)展方向應該是提高模型的可靠性,而不一定是精度。我認為:數(shù)據(jù)質(zhì)量不好時,模型精度和可靠性并不等價。在多數(shù)情況下,提高模型精度容易,提高可靠性難。如果模型精度高而可靠性低,往往是今天的模型在明天就不能用了。所以,單純追求精度,往往不利于實際應用。


在分析深化的過程中,要做兩件事:數(shù)據(jù)理解和業(yè)務理解。這個過程,就像英語水平不高的人,去讀一本翻譯不好的英文版《紅樓夢》:需要花精力把英語的意思搞清楚,又需要把通過英文去把握人的內(nèi)心世界。其中,工業(yè)現(xiàn)場的數(shù)據(jù)總是存在各種問題,這就像英文翻譯者的水平也不高。


當人們通過算法來理解數(shù)據(jù),往往更需要算法知識;通過算法理解業(yè)務時,建模往往需要更多的業(yè)務知識。兩種知識必須融合在一起,才能得到好的分析結(jié)果。這就好比,我們必須通過英文來理解中國人賈寶玉,而我們又用對中國文化的理解去分析判斷英文的含義。


當業(yè)務對模型的可靠度要求越高,這個過程越是漫長、對業(yè)務知識的要求也就越高。

相關(guān)閱讀
淺談遺傳算法的PID調(diào)節(jié)器參數(shù)整定
如何解決簡單算法好用卻不容易用好的矛盾

共有訪客發(fā)表了評論 網(wǎng)友評論

  客戶姓名:
郵箱或QQ:
驗證碼: 看不清楚?