2025年春節(jié)期間,國(guó)產(chǎn)大模型DeepSeek異軍突起,一夜之間,舉世關(guān)注,各種文章、教程、App及大模型接入方案紛紛涌現(xiàn)。面對(duì)“DeepSeek熱”,鋼企應(yīng)如何立足行業(yè)特性和企業(yè)實(shí)際,避免盲目追隨潮流,成為了一個(gè)值得深思的問(wèn)題。筆者認(rèn)為,其中的關(guān)鍵在于精準(zhǔn)把握企業(yè)需求,深諳各大模型特性,并將其與實(shí)際應(yīng)用場(chǎng)景融合,以最大化模型效能,加速企業(yè)數(shù)字化轉(zhuǎn)型與智能化升級(jí)。
DeepSeek:
開(kāi)源、免費(fèi)、低成本
DeepSeek-R1作為DeepSeek開(kāi)源的推理模型,擅長(zhǎng)處理復(fù)雜任務(wù)且免費(fèi)。尤其值得一提的是,在模型的后訓(xùn)練階段,DeepSeek-R1大規(guī)模運(yùn)用了強(qiáng)化學(xué)習(xí)技術(shù),使其推理能力得到極大提升,在數(shù)學(xué)、代碼以及自然語(yǔ)言推理等任務(wù)上,其性能足以與業(yè)界標(biāo)桿OpenAI-o1相抗衡。其標(biāo)簽——國(guó)產(chǎn)、免費(fèi)、開(kāi)源、強(qiáng)大、高效且成本優(yōu)化,不僅打破了技術(shù)壁壘,還大幅降低了進(jìn)入AI(人工智能)領(lǐng)域的門(mén)檻,為全球AI創(chuàng)新者提供了前所未有的參與機(jī)會(huì)。
在實(shí)際應(yīng)用中,DeepSeek展現(xiàn)出諸多優(yōu)勢(shì)。首先,DeepSeek通過(guò)創(chuàng)新的算法優(yōu)化和低精度訓(xùn)練技術(shù)(如int8),訓(xùn)練成本僅為同類(lèi)產(chǎn)品的1/8,推理成本更是比OpenAI低出不少,這將極大推動(dòng)AI(人工智能)在鋼企研發(fā)、生產(chǎn)等各個(gè)環(huán)節(jié)的廣泛應(yīng)用。同時(shí),DeepSeek-R1的推理速度實(shí)現(xiàn)了飛躍式提升,比傳統(tǒng)GPU(中央處理器)快57倍,結(jié)合為鋼鐵行業(yè)量身定制的專(zhuān)用模型,能夠?qū)崟r(shí)響應(yīng)生產(chǎn)調(diào)度、庫(kù)存管理等核心需求。
此外,DeepSeek開(kāi)放模型權(quán)重,采用MIT開(kāi)源協(xié)議(麻省理工學(xué)院許可證),允許用戶(hù)利用模型進(jìn)行二次開(kāi)發(fā)、蒸餾。用戶(hù)基于DeepSeek開(kāi)發(fā)或使用專(zhuān)用模型,能夠精準(zhǔn)分析行業(yè)數(shù)據(jù),為庫(kù)存管理、供應(yīng)鏈預(yù)測(cè)、生產(chǎn)流程優(yōu)化等決策提供科學(xué)依據(jù)。值得一提的是,DeepSeek還具備出色的跨平臺(tái)兼容性,已順利接入華為云、百度智能云等平臺(tái),用戶(hù)無(wú)需徹底更換原有系統(tǒng),即可輕松實(shí)現(xiàn)混合部署,極大地降低了遷移成本。
然而,DeepSeek也存在一些劣勢(shì)。首先,地緣政治限制可能影響其國(guó)際業(yè)務(wù)。美國(guó)已禁止政府設(shè)備使用DeepSeek-V3,若鋼鐵企業(yè)涉及國(guó)際業(yè)務(wù),需評(píng)估數(shù)據(jù)跨境傳輸風(fēng)險(xiǎn)。其次,開(kāi)源模型可能增加代碼漏洞風(fēng)險(xiǎn),需加強(qiáng)本地化部署的安全防護(hù)。再次,DeepSeek無(wú)法像百度等企業(yè)一樣實(shí)現(xiàn)數(shù)據(jù)分級(jí)分層受控,企業(yè)在引入AI技術(shù)時(shí),務(wù)必重視數(shù)據(jù)安全與合規(guī)性,嚴(yán)格權(quán)限管理,確保數(shù)據(jù)不被非法獲取或泄露,避免因技術(shù)漏洞引發(fā)經(jīng)濟(jì)損失。最后,過(guò)度依賴(lài)DeepSeek可能導(dǎo)致技術(shù)路徑單一,若其后續(xù)閉源或調(diào)整策略,企業(yè)需重新評(píng)估替代方案。同時(shí),華為、百度等廠(chǎng)商已快速接入DeepSeek,可能通過(guò)捆綁服務(wù)削弱鋼鐵企業(yè)的議價(jià)能力。
需求聚焦:
關(guān)注核心,規(guī)避“大而全”誤區(qū)
在大模型落地過(guò)程中,我們需時(shí)刻保持警惕,避免落入“偽需求”陷阱,不盲目追求“大而全”,而是優(yōu)先聚焦于生產(chǎn)、質(zhì)量、成本等核心痛點(diǎn),確保所選場(chǎng)景與DeepSeek的特點(diǎn)高度契合。
具體而言,鋼鐵企業(yè)可以著重關(guān)注供應(yīng)鏈協(xié)同優(yōu)化,通過(guò)整合采購(gòu)、庫(kù)存及物流數(shù)據(jù),預(yù)測(cè)原材料價(jià)格波動(dòng)及運(yùn)輸風(fēng)險(xiǎn),從而優(yōu)化采購(gòu)計(jì)劃及庫(kù)存管理水平。同時(shí),致力于運(yùn)營(yíng)優(yōu)化,借助數(shù)據(jù)驅(qū)動(dòng)的決策機(jī)制,大幅提升生產(chǎn)效率與資源配置效率。在設(shè)備預(yù)測(cè)方面,鋼企應(yīng)結(jié)合企業(yè)原有的模型,利用生產(chǎn)設(shè)備傳感器數(shù)據(jù),通過(guò)先進(jìn)的大模型分析技術(shù),精準(zhǔn)把握設(shè)備運(yùn)行狀態(tài),預(yù)測(cè)故障周期,特別是對(duì)于高爐、軋機(jī)等關(guān)鍵設(shè)備尤為重要。
此外,在企業(yè)管理運(yùn)營(yíng)中,鋼企可借助AI技術(shù)輔助生成精準(zhǔn)文案,構(gòu)建崗位知識(shí)庫(kù),整合行業(yè)資訊與操作手冊(cè),進(jìn)一步提升工作效率,有效降低人力成本。
數(shù)據(jù)治理:
構(gòu)建基石,提高質(zhì)量
企業(yè)數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)準(zhǔn)化建設(shè)以及專(zhuān)業(yè)知識(shí)庫(kù)的搭建,共同為DeepSeek等AI應(yīng)用的實(shí)施構(gòu)建了穩(wěn)固的數(shù)據(jù)基石。
針對(duì)企業(yè)ERP(企業(yè)資源計(jì)劃)、MES(制造執(zhí)行系統(tǒng))等核心系統(tǒng)中累積的歷史數(shù)據(jù),首要任務(wù)是建立一套統(tǒng)一的數(shù)據(jù)標(biāo)簽體系,從而清除冗余信息、填補(bǔ)數(shù)據(jù)空白、糾正錯(cuò)誤數(shù)據(jù),并確保數(shù)據(jù)的兼容性,特別是時(shí)序數(shù)據(jù)與結(jié)構(gòu)化數(shù)據(jù)的無(wú)縫整合,從而為AI模型的精準(zhǔn)訓(xùn)練提供可靠且高質(zhì)量的數(shù)據(jù)源。
與此同時(shí),為了深化AI模型對(duì)鋼鐵行業(yè)特定應(yīng)用場(chǎng)景的理解,鋼企需將行業(yè)專(zhuān)有術(shù)語(yǔ)(諸如連鑄坯熱送熱裝率、噸鋼綜合能耗等)及工藝標(biāo)準(zhǔn)內(nèi)嵌于大模型之中?;诖?,DeepSeek依托百度的千帆大模型的行業(yè)知識(shí)增強(qiáng)能力,能夠定制化訓(xùn)練垂直領(lǐng)域的專(zhuān)業(yè)子模型,從而在專(zhuān)業(yè)領(lǐng)域展現(xiàn)出更加卓越的應(yīng)用效能與精確度。
實(shí)施策略:
小步快跑,驗(yàn)證迭代
鋼鐵企業(yè)在穩(wěn)健推進(jìn)DeepSeek應(yīng)用的過(guò)程中,可采取“試點(diǎn)先行”策略,根據(jù)企業(yè)特點(diǎn),選擇一個(gè)具體產(chǎn)線(xiàn)或車(chē)間(例如煉鋼車(chē)間)作為試驗(yàn)田。
在這一階段,鋼企利用大模型的分析能力,優(yōu)先聚焦于優(yōu)化轉(zhuǎn)爐配料比例、預(yù)測(cè)鑄坯質(zhì)量以及進(jìn)行根因分析等生產(chǎn)關(guān)鍵任務(wù)。在評(píng)定周期內(nèi),鋼企應(yīng)重點(diǎn)考察一系列關(guān)鍵指標(biāo),如能耗降低的具體百分比、產(chǎn)品質(zhì)量的明顯提升幅度等,來(lái)評(píng)估DeepSeek的應(yīng)用成效。在試點(diǎn)項(xiàng)目取得顯著成效并經(jīng)過(guò)充分驗(yàn)證后,企業(yè)可采取分階段的方式,逐步將DeepSeek的應(yīng)用范圍拓展至全企業(yè)。
這一策略旨在避免一次性全面部署可能帶來(lái)的資源過(guò)度消耗和風(fēng)險(xiǎn),確保每一步都走得穩(wěn)健而高效,最終推動(dòng)DeepSeek在整個(gè)企業(yè)范圍內(nèi)實(shí)現(xiàn)全面且深入的應(yīng)用。
技術(shù)與組織協(xié)同并進(jìn):
避免“重技術(shù)、輕管理”
為確保大模型能夠與企業(yè)現(xiàn)有系統(tǒng)實(shí)現(xiàn)無(wú)縫對(duì)接,鋼企必須密切關(guān)注數(shù)據(jù)流的連續(xù)性,避免任何可能導(dǎo)致數(shù)據(jù)斷點(diǎn)的環(huán)節(jié)。針對(duì)部分老舊或特殊系統(tǒng),鋼企可靈活采用中間件或API網(wǎng)關(guān)技術(shù),實(shí)現(xiàn)輕量化、低成本集成,確保平穩(wěn)過(guò)渡。
在技術(shù)推進(jìn)的同時(shí),鋼企也要深刻認(rèn)識(shí)到員工賦能與變革管理的重要性。為此,鋼企可輔助開(kāi)展一系列“AI+工藝”融合培訓(xùn),幫助工程師深入理解模型輸出的內(nèi)在邏輯,比如為何在特定情境下,模型會(huì)建議調(diào)整軋制速度,從而增強(qiáng)他們的主動(dòng)決策能力,而非僅僅作為被動(dòng)執(zhí)行者;還可建立一套激勵(lì)機(jī)制,積極鼓勵(lì)一線(xiàn)員工主動(dòng)反饋模型在實(shí)際應(yīng)用中遇到的問(wèn)題,通過(guò)正面引導(dǎo)和激勵(lì),有效消除員工可能存在的抵觸情緒,確保先進(jìn)技術(shù)能夠真正落地生根,避免技術(shù)資源的閑置浪費(fèi)。
風(fēng)險(xiǎn)管控與成本優(yōu)化:
細(xì)致評(píng)估,協(xié)商計(jì)費(fèi)
在風(fēng)險(xiǎn)控制與成本優(yōu)化方面,鋼企需細(xì)致評(píng)估私有化部署DeepSeek所需的硬件升級(jí)成本,尤其是針對(duì)高性能需求(如GPU服務(wù)器集群)的投入,以及組建兼具鋼鐵工藝知識(shí)與AI技能的運(yùn)維團(tuán)隊(duì)所需的資源。
同時(shí),鋼企可通過(guò)協(xié)商采用靈活的計(jì)費(fèi)模式,例如按調(diào)用量階梯定價(jià),防止成本超支;確保生產(chǎn)數(shù)據(jù)的本地化安全存儲(chǔ),并運(yùn)用聯(lián)邦學(xué)習(xí)等先進(jìn)技術(shù),實(shí)現(xiàn)數(shù)據(jù)的“可用不可見(jiàn)”,既保障數(shù)據(jù)利用的效率,又有效防范供應(yīng)鏈斷供等安全風(fēng)險(xiǎn),確保合規(guī)性與業(yè)務(wù)連續(xù)性。
總體來(lái)看,鋼鐵企業(yè)的AI落地實(shí)踐需將技術(shù)理性與行業(yè)深度洞察(Know-How)緊密結(jié)合。短期內(nèi),鋼企應(yīng)聚焦于設(shè)備維護(hù)、工藝優(yōu)化等具體且可量化的核心“硬場(chǎng)景”,通過(guò)實(shí)實(shí)在在的降本增效成果,彰顯AI技術(shù)的價(jià)值;長(zhǎng)期來(lái)看,則需依托數(shù)據(jù)的持續(xù)積累與組織文化的深刻變革,推動(dòng)AI深度融入企業(yè)的生產(chǎn)管理體系,避免陷入“技術(shù)至上、脫離實(shí)際”的誤區(qū)。在此過(guò)程中,鋼企通過(guò)大模型技術(shù)支持,可構(gòu)建統(tǒng)一的數(shù)據(jù)分析與決策平臺(tái),即構(gòu)建AI中臺(tái)能力,不僅滿(mǎn)足當(dāng)前需求,更為未來(lái)擴(kuò)展至碳排放管理、數(shù)字孿生等新興領(lǐng)域預(yù)留空間。
筆者認(rèn)為,我們的最終目標(biāo)是讓大模型真正成為那位“深諳鋼鐵行業(yè)的老師傅”,而非僅僅是擺在那里的“昂貴裝飾品”,從而引領(lǐng)企業(yè)邁向更加智能、高效的未來(lái)。
來(lái)源:李昕昱[作者系中天鋼鐵集團(tuán)(南通)有限公司信息管理處處長(zhǎng)]