|
無限荷香染暑衣,阮郎何處弄船歸。 自慚不及鴛鴦侶,猶得雙雙近釣磯。 所有的智能制造都要以“數(shù)據(jù)”為基礎(chǔ),流程工程學(xué)對智能制造的最大貢獻(xiàn)之一,就是認(rèn)識和理解數(shù)據(jù)的“工業(yè)特征”。 什么是數(shù)據(jù)的“工業(yè)特征”? 在企業(yè)實施智能化項目的層面,從數(shù)據(jù)分析挖掘角度,可以把數(shù)據(jù)特征分為以下三類:統(tǒng)計特征、機(jī)理特征和工業(yè)特征。 統(tǒng)計特征:通過數(shù)學(xué)統(tǒng)計分析方法,得到數(shù)據(jù)統(tǒng)計信息以及數(shù)據(jù)間的關(guān)聯(lián)關(guān)系,例如:平均值、方差、眾數(shù)、中位數(shù)、A與B正相關(guān)等等。 統(tǒng)計特征的提取往往只需要數(shù)學(xué)方法,不關(guān)心數(shù)據(jù)本身的物理含義,這類特征是數(shù)據(jù)分析挖掘的基礎(chǔ)。 機(jī)理特征:通過機(jī)理分析或原理分析方法,獲得的數(shù)據(jù)間的因果關(guān)系,例如:轉(zhuǎn)爐吹氧量與終點溫度的關(guān)系、軋鋼過程板坯溫度與軋制力的關(guān)系。 機(jī)理特征是機(jī)理模型的“數(shù)據(jù)化”,不同企業(yè)機(jī)理特征的定量關(guān)系可能是不一樣的,但定性關(guān)系一定時是一致的。 工業(yè)特征:基于工業(yè)場景的決策邏輯,通過數(shù)學(xué)建模,獲得的數(shù)據(jù)間的邏輯關(guān)系。 這么解釋有點抽象,舉個小例子,說明一下工業(yè)特征與統(tǒng)計特征和機(jī)理特征有什么不同。 在精煉工序操作過程中,經(jīng)常出現(xiàn)一種情況,由于轉(zhuǎn)爐出鋼溫度偏高,精煉需要假如調(diào)溫廢鋼進(jìn)行降溫處理。 通過歷史數(shù)據(jù)統(tǒng)計,得到調(diào)溫廢鋼加入量的平均值、方差、使用比例等,這是典型的統(tǒng)計特征;同時,我們可以通過相關(guān)性系數(shù)的計算方法,獲得廢鋼加入量與精煉出站溫度的相關(guān)性,這也是統(tǒng)計特征。 我們還可以換一種特征分析的方式,建立廢鋼熔化過程的能量平衡模型,獲得廢鋼加入量與出站溫度的因果關(guān)系,這就是機(jī)理特征。 但是,基于某企業(yè)的實際生產(chǎn)數(shù)據(jù),統(tǒng)計結(jié)果是調(diào)溫廢鋼加入量與出站鋼水溫度在數(shù)值計算上表現(xiàn)為不相關(guān),但機(jī)理模型分析的結(jié)果卻是具有顯著的因果關(guān)系,真實情況是怎樣呢? 當(dāng)我們還原了到操作場景中的具體決策過程,發(fā)現(xiàn)一個有趣的現(xiàn)象,精煉的四個班組,甲班是在鋼水進(jìn)站后就加入了廢鋼,而丁班是在最后一次測溫后、鋼水出站前加入廢鋼,乙班和丙班的加入時間比較隨機(jī)。這樣甲班的數(shù)據(jù)最符合機(jī)理模型分析的因果關(guān)系,即廢鋼加的越多,出站鋼水溫度越低,但丁班恰恰相反,出站鋼水溫度越高,廢鋼加的越多,結(jié)果綜合所有數(shù)據(jù)進(jìn)行統(tǒng)計分析,廢鋼加入量與出站鋼水溫度在數(shù)據(jù)上表現(xiàn)為幾乎不相關(guān)。 這種只有還原工業(yè)場景的決策過程,才能發(fā)現(xiàn)的數(shù)據(jù)規(guī)律,就是“工業(yè)特征”。 可能有些讀者第一感覺是,這不是一個分類或者聚類的問題嗎? 首先需要說明的是,為了易于讀者理解,這里舉了一個非常簡單的例子,“簡單”之處就是通過班組的標(biāo)識,為不同數(shù)據(jù)做好了標(biāo)簽,但工業(yè)場景中,大部分類似的問題是沒有明確的標(biāo)簽的,例如轉(zhuǎn)爐二次吹煉與終點溫度和氧含量的關(guān)系,班組分類分析的結(jié)果也不明顯,基于數(shù)據(jù)的聚類也難以找出有效的數(shù)據(jù)規(guī)律。 這類問題的本質(zhì)是數(shù)據(jù)之間、操作之間的非線性耦合關(guān)系的問題,如果沒有這個層面的認(rèn)識,一方面,非常容易忽視這些問題的存在,另一方面,更沒有辦法找到恰當(dāng)、合理的解決途徑。 為了使廣大的工程技術(shù)人員能夠清晰的認(rèn)識到,工業(yè)數(shù)據(jù)的分析不僅限于統(tǒng)計特征和機(jī)理特征的提取,還有工業(yè)特征的提取,“流程工程學(xué)”,基于對流程工業(yè)復(fù)雜系統(tǒng)的理解,通過對流程工業(yè)生產(chǎn)過程的規(guī)律分析,總結(jié)了三類典型的“工業(yè)特征”: (1)“漲落”現(xiàn)象 該特征表現(xiàn)為幾乎所有的數(shù)據(jù)都存在波動,例如:雖然加熱爐出坯溫度有制度要求,但實際出坯溫度會在一個范圍波動,同樣的,時間因素、成分?jǐn)?shù)據(jù)、質(zhì)量水平、單位成本等等,在生產(chǎn)過程中一直是波動的。 這個現(xiàn)象稱為漲落現(xiàn)象,而不叫波動性或穩(wěn)定性呢? 這就涉及到這類工業(yè)特征的本質(zhì)特點:數(shù)據(jù)的核心特征不是平均值或者方差,而是“最差值”,就像河道里的水位一樣,決定河床深度的不是平均水位,而是最小水位。 什么是“最差值”?為什么“最差值”是數(shù)據(jù)的核心特征? 如果某參數(shù)的數(shù)值越低越好,那高值就是最差值,例如:連鑄中間包鋼水溫度,我們希望低溫澆鑄,溫度高了容易拉漏,這時候鋼水溫度較高的值決定了連鑄機(jī)拉速,較高值出現(xiàn)的次數(shù)也決定了調(diào)整拉速的次數(shù),乃至鑄坯出現(xiàn)質(zhì)量問題的風(fēng)險,而鋼水溫度的平均值和方差卻難以全面、有效的反應(yīng)這些信息。 認(rèn)識到“漲落”現(xiàn)象,使我們在分析數(shù)據(jù)時,不止要關(guān)注統(tǒng)計特征,而且要還原其工業(yè)上的物理意義,關(guān)注其波動范圍內(nèi),不同取值而引起的不同決策過程,從而獲得更加全面、真實的數(shù)據(jù)分析結(jié)果。 (2)非線性耦合關(guān)系 目前已有的相關(guān)性分析方法,都有一個假設(shè)前提,就是兩個因素的線性相關(guān),對于兩個因素的非線性相關(guān)分析,成熟有效的方法有限,而對于多個因素耦合且非線性相關(guān),目前還有相應(yīng)的數(shù)學(xué)方法,但工業(yè)應(yīng)用中,絕大部分問題恰恰是這類多因素耦合的非線性相關(guān)問題。 這就導(dǎo)致絕大多數(shù)情況下,數(shù)據(jù)相關(guān)性分析需要依靠專業(yè)的機(jī)理分析。從上面對精煉過程調(diào)溫廢鋼加入量與出站溫度關(guān)系的分析,就能看出,機(jī)理分析具有很大的局限性。 根本原因在于,實際的工業(yè)過程,比機(jī)理模型所能涵蓋的內(nèi)容,要復(fù)雜的多,這里不只是時間維度上的復(fù)雜,還包括參數(shù)多樣性和不確定的復(fù)雜。 正是因為這樣的復(fù)雜性,針對這類數(shù)據(jù)特征的分析,就不僅僅是套用機(jī)理模型,更要還原到工業(yè)場景中進(jìn)行解剖。 (3)開放-不可逆性 這類工業(yè)特征的分析比較復(fù)雜,這里僅分享下如何認(rèn)識這類問題。 還是舉個小例子,有兩種情景: 情景一:某爐次轉(zhuǎn)爐TSC測溫為1650℃,符合規(guī)程要求,直接出鋼,經(jīng)過RH真空處理后,正好是精煉終點要求的1590℃; 情景二:另一爐次轉(zhuǎn)爐TSC測溫為1630℃,溫度偏低,補吹后出鋼,經(jīng)過RH真空處理后,精煉終點溫度也是1590℃; 經(jīng)檢測,兩個爐次常規(guī)成分檢測結(jié)果也一樣,問:兩個爐次的鋼水質(zhì)量一樣嗎? 在目前的生產(chǎn)過程,由于檢測結(jié)果是一樣的,自然認(rèn)為鋼水質(zhì)量也是一樣的。 但問題往往出在檢測手段之外,例如上例:情景二中,鋼水中的夾雜物要比情景一的多,鋼水受污染更嚴(yán)重,這個問題到連鑄可能還反應(yīng)不出來,但到了熱軋或冷軋,就會暴露出來,進(jìn)而體現(xiàn)為質(zhì)量的不穩(wěn)定。 這就是典型的“開放-不可逆性”的工業(yè)特征,產(chǎn)品最終質(zhì)量不是完全由某些節(jié)點檢測所能體現(xiàn)的,而是由整個加工過程所決定。 而加工過程一旦形成“某種結(jié)果”,即使通過其他手段改變了某些指標(biāo),也并不能完全抵消“某種結(jié)果”所產(chǎn)生的影響,這就是流程工業(yè)的“開放-不可逆性”。 這類工業(yè)特征在質(zhì)量追溯的項目中非常關(guān)鍵,如果僅僅是“指標(biāo)對指標(biāo)”的分析,很多問題難以追溯到相應(yīng)的原因,更難以找到問題的根本原因。 三類典型工業(yè)特征問題的總結(jié),是流程工程學(xué)理論為智能制造中“數(shù)據(jù)分析”做出的貢獻(xiàn)。 正是基于以上分析和分解,使我們在面對有關(guān)“數(shù)據(jù)分析”的工程項目時,針對那些看似不可知、不可控的問題,可以做到有的放矢、有路可循。 如何在工程實踐中,提取和解析數(shù)據(jù)的“工業(yè)特征”呢? 本文給出的方法是:決策調(diào)研+邏輯模型。 這里不得不說,工程實踐與具體工業(yè)場景緊密結(jié)合的重要性。 只有深入調(diào)研,了解現(xiàn)場的決策過程,才能建立合理的邏輯模型,來解構(gòu)工業(yè)特征。 同時,又不能拘泥于現(xiàn)場調(diào)研,通過調(diào)研,即使可以完全理清現(xiàn)在的決策過程,不可能預(yù)測未來可能的決策過程,但是,工業(yè)過程的工藝更新和管理完善是持續(xù)進(jìn)行的,只有能夠從根本上找出工業(yè)過程的內(nèi)在邏輯,才是工業(yè)特征的根本目的。 因此,要想做到工業(yè)特征的提取,調(diào)研決策過程是基礎(chǔ),構(gòu)建邏輯模型是關(guān)鍵,缺少模型的支撐,所提取的工業(yè)特征都具有時間局限性。 如果把工業(yè)特征與統(tǒng)計特征和機(jī)理特征放在一起對比,工業(yè)特征是后兩者的補充,在工程實踐中,屬于“萬里長征的最后一公里”。 假如粗略估計,在數(shù)據(jù)分析挖掘的工作中,統(tǒng)計特征的提取占60%,機(jī)理特征的提取占35%,工業(yè)特征的提取工作將不足5%。但是,絕大多數(shù)做的不錯的項目,但應(yīng)用效果卻越來越不好、項目模型無法遷移,基本都是忽略了這5%的工作,結(jié)果“最后一公里”走的異常艱難。 希望通過本文對流程工程學(xué)理論的一點分享,為各位大佬補上這“最后一公里”的路標(biāo),畢竟,有志于“為山九仞”者,都不想“功虧一簣”。 一言以蔽之 |
|
|