新聞通訊員 王晉昊 楊柯 汪如意

“最初拿到中國航天研究院的項(xiàng)目需求時,我們完全摸不著頭腦!”近日,2025年度中國青年科技創(chuàng)新“揭榜掛帥”擂臺賽傳來捷報(bào),湖北工業(yè)大學(xué)本科生團(tuán)隊(duì)“面向綜合集成研討的戰(zhàn)略博弈智能體構(gòu)建技術(shù)”項(xiàng)目,在新一代信息技術(shù)領(lǐng)域脫穎而出,榮獲全國特等獎。這支以大三學(xué)生為核心的團(tuán)隊(duì),歷時5個月攻堅(jiān),在不完全信息博弈建模、智能算法優(yōu)化等方面實(shí)現(xiàn)突破,成功攻克航天領(lǐng)域技術(shù)難題。
五個月攻堅(jiān),從“看不懂”到“啃下來”
項(xiàng)目源自中國航天研究院的戰(zhàn)略博弈技術(shù)需求,初期僅明確研發(fā)智能算法,核心規(guī)則與操作平臺遲遲未公布,讓以大數(shù)據(jù)管理與應(yīng)用專業(yè)學(xué)生為主的團(tuán)隊(duì)陷入困惑。直到7月初,研究院發(fā)布基于卡牌游戲的仿真平臺,包含9類國家身份、4個階段隨機(jī)事件,對戰(zhàn)雙方需在未知對方身份與決策邏輯的情況下投入資源博弈,本質(zhì)是典型的不完全信息博弈問題。
“游戲化平臺讓寬泛的技術(shù)需求有了明確方向?!眻F(tuán)隊(duì)負(fù)責(zé)人田俊杰介紹,項(xiàng)目自6月啟動以來,全國19支高校隊(duì)伍參與角逐,11支隊(duì)伍晉級決賽。初賽需擊敗官方基礎(chǔ)智能體,決賽采用“兩兩PK”循環(huán)對戰(zhàn)模式,每兩隊(duì)完成1000場對戰(zhàn)。
備賽路上挑戰(zhàn)重重。最初,在指導(dǎo)老師胡昌龍的建議下,團(tuán)隊(duì)計(jì)劃采用大語言模型技術(shù),卻在7月中旬接到“算法需本地部署、禁止聯(lián)網(wǎng)”的規(guī)則限制,依賴聯(lián)網(wǎng)數(shù)據(jù)的大模型效果大幅下滑,前期研究近乎白費(fèi)。面對困境,團(tuán)隊(duì)拆分6個研究方向分組攻關(guān),有的小組嘗試數(shù)學(xué)建模羅列所有場景,有的借鑒已發(fā)表論文的算法框架,還有的聚焦算法輕量化優(yōu)化。為了篩選最優(yōu)方案,團(tuán)隊(duì)內(nèi)部PK,通過數(shù)萬場模擬對戰(zhàn)記錄數(shù)據(jù),保留效果最佳的算法并持續(xù)迭代。
平臺Bug的出現(xiàn)更讓團(tuán)隊(duì)遭遇重創(chuàng)。7月中旬,研究院修復(fù)身份顏色對應(yīng)錯誤問題,而團(tuán)隊(duì)此前基于錯誤映射訓(xùn)練的模型與提示詞全部失效,半個月的心血付諸東流?!拔覀冞B夜調(diào)整代碼,重新建立身份與策略的對應(yīng)關(guān)系,同時優(yōu)化算法結(jié)構(gòu),確保在不聯(lián)網(wǎng)環(huán)境下也能保持決策精度。”田俊杰說,為了兼顧決策速度與收益,他們舍棄了復(fù)雜的深度學(xué)習(xí)框架,采用輕量化算法設(shè)計(jì),最終實(shí)現(xiàn)0.02秒快速響應(yīng),既滿足比賽時間限制,又保證了對戰(zhàn)勝率。
團(tuán)隊(duì)備賽
團(tuán)隊(duì)的高效協(xié)作是攻堅(jiān)關(guān)鍵。團(tuán)隊(duì)建立了“一日一調(diào)度、兩日一會議”的工作機(jī)制,每周指導(dǎo)老師還會進(jìn)行一對一輔導(dǎo)。成員們分工明確,部分成員負(fù)責(zé)代碼編寫與算法調(diào)優(yōu),其他成員承擔(dān)文獻(xiàn)查閱、數(shù)據(jù)記錄、平臺測試等工作,甚至主動聯(lián)系航天研究院技術(shù)人員溝通規(guī)則細(xì)節(jié),確保研發(fā)不偏離方向。
技術(shù)落地可期,拓展多場景應(yīng)用價值
經(jīng)過數(shù)月打磨,團(tuán)隊(duì)研發(fā)的智能算法在決賽中表現(xiàn)亮眼,不僅在千場對戰(zhàn)中保持高勝率,其快速決策能力與穩(wěn)定性能也獲得評委認(rèn)可。該算法通過精準(zhǔn)分析已知對戰(zhàn)信息,動態(tài)調(diào)整資源投入策略,在不完全信息環(huán)境下實(shí)現(xiàn)收益最大化,其核心邏輯不僅適用于航天領(lǐng)域的戰(zhàn)略博弈場景,還可拓展至應(yīng)急資源調(diào)度、金融投資決策、智慧城市管理等多個領(lǐng)域。
“應(yīng)急調(diào)度本質(zhì)上也是一種不完全信息下的決策問題,比如災(zāi)害發(fā)生后,如何在信息不充分的情況下優(yōu)化資源分配,我們的算法思路可以提供解決方案?!焙埍硎?,目前已有多個相關(guān)項(xiàng)目表達(dá)了技術(shù)借鑒意向,團(tuán)隊(duì)未來計(jì)劃進(jìn)一步深化研究,推動技術(shù)在實(shí)際場景中落地。
“從最初的興趣驅(qū)動,到后來的責(zé)任擔(dān)當(dāng),這段經(jīng)歷讓我們明白科技創(chuàng)新既要敢想敢試,更要腳踏實(shí)地。”團(tuán)隊(duì)成員羅友真說,作為本科生,他們在備賽過程中不僅提升了代碼編寫、算法設(shè)計(jì)等專業(yè)能力,更學(xué)會了在挫折中調(diào)整方向、在協(xié)作中凝聚力量。
“最珍貴的不是比賽結(jié)果,而是學(xué)生在參賽過程中的轉(zhuǎn)變?!苯?jīng)濟(jì)與管理學(xué)院黨委副書記余貞說。此次獲獎不僅是對團(tuán)隊(duì)努力的認(rèn)可,更堅(jiān)定了他們深耕信息技術(shù)領(lǐng)域、用科技解決實(shí)際問題的決心。
“學(xué)科的邊界正在模糊,創(chuàng)新的前沿往往生于交叉地帶?!焙埍硎?,這個項(xiàng)目或許只是一個起點(diǎn),但它清晰地揭示了一種可能:當(dāng)管理思維與前沿?cái)?shù)字技術(shù)深度融合時,傳統(tǒng)的“軟學(xué)科”便能鍛造出解決時代“硬問題”的真本領(lǐng)。