8月8日,由中央網(wǎng)信辦網(wǎng)絡(luò)安全協(xié)調(diào)局指導(dǎo)、中國網(wǎng)絡(luò)安全產(chǎn)業(yè)聯(lián)盟(CCIA)主辦的“2025年網(wǎng)絡(luò)安全優(yōu)秀創(chuàng)新成果大賽”完成公示。永信至誠申報(bào)的“基于「數(shù)字風(fēng)洞」的AI大模型測評解決方案”憑借突出的技術(shù)創(chuàng)新能力與行業(yè)應(yīng)用價值,榮獲“人工智能與機(jī)器人安全專題賽”優(yōu)勝獎。
隨著AI大模型在各行業(yè)的快速落地,政企用戶對于模型智能水平、安全風(fēng)險、適配性等多維能力的評估需求日益增長。但在實(shí)際應(yīng)用中,用戶仍面臨諸如評估標(biāo)準(zhǔn)不統(tǒng)一、測試門檻高、結(jié)果難判定等共性挑戰(zhàn),尤其在復(fù)雜業(yè)務(wù)場景下,難以有效刻畫模型能力邊界與潛在風(fēng)險。
立足這一現(xiàn)實(shí)需求,永信至誠打造AI大模型測評「數(shù)字風(fēng)洞」平臺,并結(jié)合“產(chǎn)品乘服務(wù)”理念,形成基于「數(shù)字風(fēng)洞」的AI大模型測評解決方案,為行業(yè)用戶提供標(biāo)準(zhǔn)化、常態(tài)化的大模型評估能力支持。
該方案依托永信至誠獨(dú)創(chuàng)的“ISAC24”測評標(biāo)準(zhǔn),結(jié)合超500萬真實(shí)測評用例,從智能度(Intelligibility)、安全度(Safety)、匹配度(Applicability)、一致度(Consistency)四大核心維度,構(gòu)建模型評估指標(biāo)體系,通過“以模測模、以模強(qiáng)模”測評大模型能力邊界、穩(wěn)定性與風(fēng)險水平。
目前,該方案已廣泛服務(wù)于政務(wù)大模型測評、企業(yè)大模型測評、通用大模型測評、工控AI系統(tǒng)安全測評、物聯(lián)網(wǎng)智慧AI 數(shù)據(jù)引擎系統(tǒng)測評、多模態(tài)大模型測評等業(yè)務(wù)場景,幫助用戶系統(tǒng)識別模型潛在風(fēng)險、驗(yàn)證實(shí)際性能。平臺已接入ChatGPT、DeepSeek、百度千帆、通義千問、月之暗面等50余個AI大模型,圍繞DeepSeek-r1、Llama2-7b、OpenAI GPT-4o等主流大模型發(fā)布測評報(bào)告,提供專業(yè)的評估結(jié)果和調(diào)試建議。同時,基于系列技術(shù)成果,永信至誠已獲得多項(xiàng)專利,并深度參與大模型測評標(biāo)準(zhǔn)制定工作。
隨著AI技術(shù)在各行業(yè)的加速應(yīng)用,大模型能力評估成為保障數(shù)字業(yè)務(wù)穩(wěn)定運(yùn)行的關(guān)鍵基礎(chǔ)。作為數(shù)字安全測試評估賽道領(lǐng)跑者、網(wǎng)絡(luò)靶場和人才建設(shè)領(lǐng)軍者,永信至誠表示將依托「數(shù)字風(fēng)洞」產(chǎn)品體系,持續(xù)為行業(yè)用戶提供測試評估服務(wù)和專有人才支撐,助力行業(yè)智能化、數(shù)字化轉(zhuǎn)型,保障數(shù)字健康,帶給世界安全感。
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!