电竞比分网-中国电竞赛事及体育赛事平台

分享

生產(chǎn)數(shù)據(jù)的“工業(yè)特征” | 基礎(chǔ)8

 昵稱33542116 2020-03-11


定場詩

無限荷香染暑衣,阮郎何處弄船歸。 

自慚不及鴛鴦侶,猶得雙雙近釣磯。


(本篇偏長,欲了解核心內(nèi)容,可直接拉到最后的“一言以蔽之”部分。)

所有的智能制造都要以“數(shù)據(jù)”為基礎(chǔ),流程工程學(xué)對智能制造的最大貢獻(xiàn)之一,就是認(rèn)識和理解數(shù)據(jù)的“工業(yè)特征”。

什么是數(shù)據(jù)的“工業(yè)特征”?

在企業(yè)實施智能化項目的層面,從數(shù)據(jù)分析挖掘角度,可以把數(shù)據(jù)特征分為以下三類:統(tǒng)計特征機(jī)理特征工業(yè)特征。

統(tǒng)計特征:通過數(shù)學(xué)統(tǒng)計分析方法,得到數(shù)據(jù)統(tǒng)計信息以及數(shù)據(jù)間的關(guān)聯(lián)關(guān)系,例如:平均值、方差、眾數(shù)、中位數(shù)、A與B正相關(guān)等等。

統(tǒng)計特征的提取往往只需要數(shù)學(xué)方法,不關(guān)心數(shù)據(jù)本身的物理含義,這類特征是數(shù)據(jù)分析挖掘的基礎(chǔ)。

機(jī)理特征:通過機(jī)理分析或原理分析方法,獲得的數(shù)據(jù)間的因果關(guān)系,例如:轉(zhuǎn)爐吹氧量與終點溫度的關(guān)系、軋鋼過程板坯溫度與軋制力的關(guān)系。

機(jī)理特征是機(jī)理模型的“數(shù)據(jù)化”,不同企業(yè)機(jī)理特征的定量關(guān)系可能是不一樣的,但定性關(guān)系一定時是一致的。

工業(yè)特征:基于工業(yè)場景的決策邏輯,通過數(shù)學(xué)建模,獲得的數(shù)據(jù)間的邏輯關(guān)系。

這么解釋有點抽象,舉個小例子,說明一下工業(yè)特征與統(tǒng)計特征和機(jī)理特征有什么不同。


在精煉工序操作過程中,經(jīng)常出現(xiàn)一種情況,由于轉(zhuǎn)爐出鋼溫度偏高,精煉需要假如調(diào)溫廢鋼進(jìn)行降溫處理。

通過歷史數(shù)據(jù)統(tǒng)計,得到調(diào)溫廢鋼加入量的平均值、方差、使用比例等,這是典型的統(tǒng)計特征;同時,我們可以通過相關(guān)性系數(shù)的計算方法,獲得廢鋼加入量與精煉出站溫度的相關(guān)性,這也是統(tǒng)計特征。

我們還可以換一種特征分析的方式,建立廢鋼熔化過程的能量平衡模型,獲得廢鋼加入量與出站溫度的因果關(guān)系,這就是機(jī)理特征。

但是,基于某企業(yè)的實際生產(chǎn)數(shù)據(jù),統(tǒng)計結(jié)果是調(diào)溫廢鋼加入量與出站鋼水溫度在數(shù)值計算上表現(xiàn)為不相關(guān),但機(jī)理模型分析的結(jié)果卻是具有顯著的因果關(guān)系,真實情況是怎樣呢?

當(dāng)我們還原了到操作場景中的具體決策過程,發(fā)現(xiàn)一個有趣的現(xiàn)象,精煉的四個班組,甲班是在鋼水進(jìn)站后就加入了廢鋼,而丁班是在最后一次測溫后、鋼水出站前加入廢鋼,乙班和丙班的加入時間比較隨機(jī)。這樣甲班的數(shù)據(jù)最符合機(jī)理模型分析的因果關(guān)系,即廢鋼加的越多,出站鋼水溫度越低,但丁班恰恰相反,出站鋼水溫度越高,廢鋼加的越多,結(jié)果綜合所有數(shù)據(jù)進(jìn)行統(tǒng)計分析,廢鋼加入量與出站鋼水溫度在數(shù)據(jù)上表現(xiàn)為幾乎不相關(guān)。

這種只有還原工業(yè)場景的決策過程,才能發(fā)現(xiàn)的數(shù)據(jù)規(guī)律,就是“工業(yè)特征”。


可能有些讀者第一感覺是,這不是一個分類或者聚類的問題嗎?

首先需要說明的是,為了易于讀者理解,這里舉了一個非常簡單的例子,“簡單”之處就是通過班組的標(biāo)識,為不同數(shù)據(jù)做好了標(biāo)簽,但工業(yè)場景中,大部分類似的問題是沒有明確的標(biāo)簽的,例如轉(zhuǎn)爐二次吹煉與終點溫度和氧含量的關(guān)系,班組分類分析的結(jié)果也不明顯,基于數(shù)據(jù)的聚類也難以找出有效的數(shù)據(jù)規(guī)律。

這類問題的本質(zhì)是數(shù)據(jù)之間、操作之間的非線性耦合關(guān)系的問題,如果沒有這個層面的認(rèn)識,一方面,非常容易忽視這些問題的存在,另一方面,更沒有辦法找到恰當(dāng)、合理的解決途徑。

為了使廣大的工程技術(shù)人員能夠清晰的認(rèn)識到,工業(yè)數(shù)據(jù)的分析不僅限于統(tǒng)計特征和機(jī)理特征的提取,還有工業(yè)特征的提取,“流程工程學(xué)”,基于對流程工業(yè)復(fù)雜系統(tǒng)的理解,通過對流程工業(yè)生產(chǎn)過程的規(guī)律分析,總結(jié)了三類典型的“工業(yè)特征”:


(1)“漲落”現(xiàn)象


該特征表現(xiàn)為幾乎所有的數(shù)據(jù)都存在波動,例如:雖然加熱爐出坯溫度有制度要求,但實際出坯溫度會在一個范圍波動,同樣的,時間因素、成分?jǐn)?shù)據(jù)、質(zhì)量水平、單位成本等等,在生產(chǎn)過程中一直是波動的。

這個現(xiàn)象稱為漲落現(xiàn)象,而不叫波動性或穩(wěn)定性呢?

這就涉及到這類工業(yè)特征的本質(zhì)特點:數(shù)據(jù)的核心特征不是平均值或者方差,而是“最差值”,就像河道里的水位一樣,決定河床深度的不是平均水位,而是最小水位。

什么是“最差值”?為什么“最差值”是數(shù)據(jù)的核心特征?

如果某參數(shù)的數(shù)值越低越好,那高值就是最差值,例如:連鑄中間包鋼水溫度,我們希望低溫澆鑄,溫度高了容易拉漏,這時候鋼水溫度較高的值決定了連鑄機(jī)拉速,較高值出現(xiàn)的次數(shù)也決定了調(diào)整拉速的次數(shù),乃至鑄坯出現(xiàn)質(zhì)量問題的風(fēng)險,而鋼水溫度的平均值和方差卻難以全面、有效的反應(yīng)這些信息。

認(rèn)識到“漲落”現(xiàn)象,使我們在分析數(shù)據(jù)時,不止要關(guān)注統(tǒng)計特征,而且要還原其工業(yè)上的物理意義,關(guān)注其波動范圍內(nèi),不同取值而引起的不同決策過程,從而獲得更加全面、真實的數(shù)據(jù)分析結(jié)果。


(2)非線性耦合關(guān)系


目前已有的相關(guān)性分析方法,都有一個假設(shè)前提,就是兩個因素的線性相關(guān),對于兩個因素的非線性相關(guān)分析,成熟有效的方法有限,而對于多個因素耦合且非線性相關(guān),目前還有相應(yīng)的數(shù)學(xué)方法,但工業(yè)應(yīng)用中,絕大部分問題恰恰是這類多因素耦合的非線性相關(guān)問題。

這就導(dǎo)致絕大多數(shù)情況下,數(shù)據(jù)相關(guān)性分析需要依靠專業(yè)的機(jī)理分析。從上面對精煉過程調(diào)溫廢鋼加入量與出站溫度關(guān)系的分析,就能看出,機(jī)理分析具有很大的局限性。

根本原因在于,實際的工業(yè)過程,比機(jī)理模型所能涵蓋的內(nèi)容,要復(fù)雜的多,這里不只是時間維度上的復(fù)雜,還包括參數(shù)多樣性和不確定的復(fù)雜。

正是因為這樣的復(fù)雜性,針對這類數(shù)據(jù)特征的分析,就不僅僅是套用機(jī)理模型,更要還原到工業(yè)場景中進(jìn)行解剖。


(3)開放-不可逆性


這類工業(yè)特征的分析比較復(fù)雜,這里僅分享下如何認(rèn)識這類問題。

還是舉個小例子,有兩種情景:

情景一:某爐次轉(zhuǎn)爐TSC測溫為1650℃,符合規(guī)程要求,直接出鋼,經(jīng)過RH真空處理后,正好是精煉終點要求的1590℃;

情景二:另一爐次轉(zhuǎn)爐TSC測溫為1630℃,溫度偏低,補吹后出鋼,經(jīng)過RH真空處理后,精煉終點溫度也是1590℃;

經(jīng)檢測,兩個爐次常規(guī)成分檢測結(jié)果也一樣,問:兩個爐次的鋼水質(zhì)量一樣嗎?

在目前的生產(chǎn)過程,由于檢測結(jié)果是一樣的,自然認(rèn)為鋼水質(zhì)量也是一樣的。

但問題往往出在檢測手段之外,例如上例:情景二中,鋼水中的夾雜物要比情景一的多,鋼水受污染更嚴(yán)重,這個問題到連鑄可能還反應(yīng)不出來,但到了熱軋或冷軋,就會暴露出來,進(jìn)而體現(xiàn)為質(zhì)量的不穩(wěn)定。

這就是典型的“開放-不可逆性”的工業(yè)特征,產(chǎn)品最終質(zhì)量不是完全由某些節(jié)點檢測所能體現(xiàn)的,而是由整個加工過程所決定。

而加工過程一旦形成“某種結(jié)果”,即使通過其他手段改變了某些指標(biāo),也并不能完全抵消“某種結(jié)果”所產(chǎn)生的影響,這就是流程工業(yè)的“開放-不可逆性”。

這類工業(yè)特征在質(zhì)量追溯的項目中非常關(guān)鍵,如果僅僅是“指標(biāo)對指標(biāo)”的分析,很多問題難以追溯到相應(yīng)的原因,更難以找到問題的根本原因。


三類典型工業(yè)特征問題的總結(jié),是流程工程學(xué)理論為智能制造中“數(shù)據(jù)分析”做出的貢獻(xiàn)。

正是基于以上分析和分解,使我們在面對有關(guān)“數(shù)據(jù)分析”的工程項目時,針對那些看似不可知、不可控的問題,可以做到有的放矢、有路可循。



如何在工程實踐中,提取和解析數(shù)據(jù)的“工業(yè)特征”呢?

本文給出的方法是:決策調(diào)研+邏輯模型

這里不得不說,工程實踐與具體工業(yè)場景緊密結(jié)合的重要性。

只有深入調(diào)研,了解現(xiàn)場的決策過程,才能建立合理的邏輯模型,來解構(gòu)工業(yè)特征。

同時,又不能拘泥于現(xiàn)場調(diào)研,通過調(diào)研,即使可以完全理清現(xiàn)在的決策過程,不可能預(yù)測未來可能的決策過程,但是,工業(yè)過程的工藝更新和管理完善是持續(xù)進(jìn)行的,只有能夠從根本上找出工業(yè)過程的內(nèi)在邏輯,才是工業(yè)特征的根本目的。

因此,要想做到工業(yè)特征的提取,調(diào)研決策過程是基礎(chǔ),構(gòu)建邏輯模型是關(guān)鍵,缺少模型的支撐,所提取的工業(yè)特征都具有時間局限性。


如果把工業(yè)特征與統(tǒng)計特征和機(jī)理特征放在一起對比,工業(yè)特征是后兩者的補充,在工程實踐中,屬于“萬里長征的最后一公里”。

假如粗略估計,在數(shù)據(jù)分析挖掘的工作中,統(tǒng)計特征的提取占60%,機(jī)理特征的提取占35%,工業(yè)特征的提取工作將不足5%。但是,絕大多數(shù)做的不錯的項目,但應(yīng)用效果卻越來越不好、項目模型無法遷移,基本都是忽略了這5%的工作,結(jié)果“最后一公里”走的異常艱難。

希望通過本文對流程工程學(xué)理論的一點分享,為各位大佬補上這“最后一公里”的路標(biāo),畢竟,有志于“為山九仞”者,都不想“功虧一簣”。

一言以蔽之

針對數(shù)據(jù)分析工作,需要做統(tǒng)計特征、機(jī)理特征和工業(yè)特征三方面的提取。
工業(yè)特征是基于工業(yè)場景的決策邏輯,通過數(shù)學(xué)建模,獲得的數(shù)據(jù)間的邏輯關(guān)系。
從流程工程學(xué)理論出發(fā),典型的工業(yè)特征有三類:“漲落”現(xiàn)象、非線性耦合關(guān)系、開放-不可逆性。
提取和解析工業(yè)特征的方法是“決策調(diào)研+邏輯模型”。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多