S/N | 企業(yè) |
---|---|
1 | 深度求索(DeepSeek) |
2 | 阿里巴巴·通義 |
3 | 華為·盤古視頻大模型·倉頡大模型 |
4 | 字節(jié)跳動·剪映/火山方舟團(tuán)隊 |
5 | 騰訊·混元大模型視頻團(tuán)隊 |
6 | 階躍星辰(StepFun) |
7 | 面壁智能(MiniMax) |
8 | 月之暗面(Moonshot AI) |
9 | 科大訊飛·星火大模型 |
10 | 美圖(MiracleVision) |
11 | Tiamat(天工AI) |
12 | 商湯科技(SenseTime) |
13 | 生數(shù)科技(UniDiff) |
14 | 智譜AI·CodeGeeX |
15 | 冪律智能(PowerLaw AI) |
16 | 曠視科技(Megvii) |
17 | 云從科技(Cloudwalk) |
18 | 依圖科技(Yitu Technology) |
19 | 極視角(Extreme Vision) |
20 | 虹軟科技(ArcSoft) |
2025.07 DBC德本咨詢/CIW互聯(lián)網(wǎng)周刊/eNet16 |
深度求索(DeepSeek)
通用語言模型(GLM)。部分實際意義:DeepSeek-R系列在金融量化分析、工業(yè)故障診斷、科研文獻(xiàn)挖掘等領(lǐng)域落地,為招商證券、國家電網(wǎng)等客戶替代專家人力,決策效率提升多倍;開源模型DeepSeek-Coder全球開發(fā)者下載量超千萬,推動AI普惠。部分創(chuàng)新意義:首創(chuàng)“LLM as OS”架構(gòu),將大模型作為智能體操作系統(tǒng),支持工具學(xué)習(xí)、代碼解釋器、長程記憶管理全閉環(huán);在數(shù)學(xué)推理(GSM8K 92.6%)、代碼生成(HumanEval 81.7%)等硬指標(biāo)上達(dá)到全球第一梯隊。
AI搜索。部分實際意義:DeepSeek-R1在金融、法律、科研等專業(yè)領(lǐng)域?qū)崿F(xiàn)復(fù)雜問題結(jié)構(gòu)化解析與溯源推理;企業(yè)用戶通過私有化部署,將內(nèi)部文檔庫、代碼倉轉(zhuǎn)化為可對話知識引擎,查詢效率提升多倍。部分創(chuàng)新意義:首創(chuàng)“生成式檢索架構(gòu)”(GRS),融合檢索(Retrieval)與生成(Generation)過程,實現(xiàn)答案的可驗證、可迭代、可執(zhí)行(如直接生成數(shù)據(jù)分析代碼);突破傳統(tǒng)搜索的信息碎片化局限。
AI編程(AI for Coding)。部分實際意義:DeepSeek-Coder系列模型在代碼生成、數(shù)學(xué)推理、單測覆蓋、代碼解釋能力上達(dá)到國際頂尖水平(HumanEval榜首);已集成至企業(yè)IDE插件,為金融、云服務(wù)廠商提供自動化代碼審查、遺留系統(tǒng)遷移、文檔生成服務(wù),實測提升開發(fā)者效率30%+。部分創(chuàng)新意義:首創(chuàng)“全棧式代碼智能體”架構(gòu),支持需求→設(shè)計→編碼→測試→部署全流程閉環(huán);其RAG for Code技術(shù)實現(xiàn)企業(yè)私有代碼庫的高效知識注入,解決定制化開發(fā)痛點;開源6B/33B模型推動行業(yè)技術(shù)普惠。
AI智能體(Agent)。部分實際意義:推出DeepSeek-R系列大模型及DeepSeek-Coder,在代碼生成、數(shù)學(xué)推理、工具調(diào)用能力上達(dá)到國際前沿水平;其智能體框架支持復(fù)雜任務(wù)自動拆解、代碼解釋器(Code Interpreter)無縫集成、多輪自主調(diào)試,已在開發(fā)者工具、金融量化分析、教育解題等場景落地。部分創(chuàng)新意義:提出“LLM as OS”架構(gòu)理念,將大模型作為智能體系統(tǒng)的核心“操作系統(tǒng)”,在長程記憶管理、工具學(xué)習(xí)效率、安全可控性上實現(xiàn)突破。其開源策略推動中國智能體生態(tài)基礎(chǔ)能力提升。
阿里巴巴·通義
AI圖像生成。部分實際意義:為淘寶1688平臺提供“AI一鍵換裝/換場景”,商家商品圖制作周期從以天計縮至以分鐘計;犀牛智造用其生成數(shù)萬款服裝設(shè)計稿,爆款率提升。部分創(chuàng)新意義:提出“供應(yīng)鏈感知生成”框架,將面料成本、生產(chǎn)工藝約束融入設(shè)計生成(如避免生成無法量產(chǎn)的復(fù)雜結(jié)構(gòu));突破“紡織物物理仿真”技術(shù),實現(xiàn)褶皺、光影的物理準(zhǔn)確渲染。
AI搜索。部分實際意義:通義“企業(yè)知識探針”在釘釘、阿里云集成,支持跨系統(tǒng)文檔(郵件/會議記錄/代碼/報表)的聯(lián)合檢索與摘要生成,日均服務(wù)百萬企業(yè)用戶。部分創(chuàng)新意義:研發(fā)“多模態(tài)企業(yè)圖譜引擎”,融合文本、表格、圖像語義,實現(xiàn)搜索→分析→行動建議全鏈路自動化(如自動生成周報、觸發(fā)審批流程);重新定義企業(yè)信息中樞。
AI編程(AI for Coding)。部分實際意義:基于通義千問CodeQwen大模型,為淘寶、高德、菜鳥等超百萬行代碼項目提供跨文件上下文理解、自動化Bug修復(fù)、智能日志分析;在雙11等高壓場景中,自動處理千級并發(fā)代碼變更請求,保障系統(tǒng)穩(wěn)定性。部分創(chuàng)新意義:構(gòu)建“AI-SDLC”(AI驅(qū)動的軟件開發(fā)生命周期)平臺,將智能體深度嵌入DevOps流水線;其“代碼數(shù)字孿生”技術(shù)動態(tài)映射系統(tǒng)架構(gòu),實現(xiàn)需求變動→代碼影響的實時推演,重構(gòu)大型系統(tǒng)協(xié)作模式。
AI智能體(Agent)。部分實際意義:通義千問Agent已在淘寶商家運營、菜鳥供應(yīng)鏈調(diào)度、高德交通治理中部署,電商運營Agent,自動完成選品-定價-促銷全鏈路決策;物流調(diào)度Agent,實時優(yōu)化百萬級包裹路徑規(guī)劃;城市治理Agent,融合多源數(shù)據(jù)預(yù)測擁堵并生成管控策略。部分創(chuàng)新意義:提出“Business Agent Operating System”(BAOS)概念,將商業(yè)規(guī)則、實時數(shù)據(jù)、人類經(jīng)驗注入智能體架構(gòu);其“AI超市”模式允許企業(yè)按需調(diào)用專業(yè)化Agent(如法務(wù)Agent、設(shè)計Agent),推動生態(tài)化發(fā)展。
華為·盤古視頻大模型·倉頡大模型
AI視頻生成。部分實際意義:在工業(yè)仿真領(lǐng)域生成設(shè)備故障推演視頻,用于電網(wǎng)、礦山安全生產(chǎn)培訓(xùn),替代傳統(tǒng)3D建模,交付周期大幅縮短;智慧城市中實時生成交通擁堵推演方案。部分創(chuàng)新意義:提出“因果鏈視頻生成”技術(shù),基于設(shè)備傳感器數(shù)據(jù)生成故障過程視頻(如軸承磨損→溫度升高→斷裂),實現(xiàn)物理機(jī)制可解釋性;突破AI視頻在專業(yè)領(lǐng)域的可信瓶頸。
AI編程。部分實際意義:基于盤古代碼大模型的智能編程助手,在華為內(nèi)部支撐15萬+開發(fā)者,日均生成代碼30萬行;在5G協(xié)議棧開發(fā)、芯片驅(qū)動編寫等高精度領(lǐng)域,實現(xiàn)函數(shù)級代碼生成與驗證閉環(huán)。部分創(chuàng)新意義:提出“形式化驗證驅(qū)動的代碼生成”框架,將程序規(guī)約(Specification)作為約束條件注入大模型,確保生成代碼符合功能安全要求(ISO 26262/ IEC 61508);突破AI編程在軍工、航空等強(qiáng)規(guī)范領(lǐng)域的應(yīng)用瓶頸。
AI智能體(Agent)。部分實際意義:基于盤古大模型3.0的行業(yè)智能體在制造、礦山、藥物研發(fā)領(lǐng)域?qū)崿F(xiàn)突破,工業(yè)質(zhì)檢智能體,自主調(diào)度多模態(tài)傳感器,實時診斷設(shè)備故障;礦山安全Agent,動態(tài)規(guī)劃巡檢路徑,預(yù)測地質(zhì)災(zāi)害;醫(yī)藥分子Agent,設(shè)計-模擬-優(yōu)化全閉環(huán),加速新藥發(fā)現(xiàn)。部分創(chuàng)新意義:構(gòu)建“物理世界-數(shù)字孿生-Agent”三位一體架構(gòu),實現(xiàn)與真實物理系統(tǒng)的實時交互驗證;在多智能體協(xié)同、不確定環(huán)境決策、因果推理等關(guān)鍵技術(shù)上建立壁壘。
字節(jié)跳動·剪映/火山方舟團(tuán)隊
AI圖像生成。部分實際意義:“AI商品圖”功能在抖音電商落地,為中小商家自動生成高點擊率主圖,GMV提升;“AI漫畫推文”日更數(shù)萬條,重構(gòu)短劇內(nèi)容供應(yīng)鏈。部分創(chuàng)新意義:構(gòu)建“多模態(tài)爆款知識庫”,基于抖音熱銷商品數(shù)據(jù)優(yōu)化生成效果(如食品的食欲感、服飾的垂墜感);研發(fā)Dragon-Style引擎實現(xiàn)全網(wǎng)熱點風(fēng)格的分鐘級遷移,推動內(nèi)容工業(yè)化生產(chǎn)。
AI視頻生成。部分實際意義:“AI圖文成片”功能日均生成百萬條電商短視頻,替代基礎(chǔ)拍攝剪輯,效率大幅提升;“Dreamina”支持專業(yè)級分鏡生成,用于西瓜視頻紀(jì)錄片、TikTok廣告制作,顯著節(jié)省了制作成本。部分創(chuàng)新意義:自研“時空擴(kuò)散模型+行業(yè)知識庫”雙引擎架構(gòu),實現(xiàn)商品特征一致性保持(如口紅試色不色偏)、多鏡頭自動銜接。定義短視頻工業(yè)化生產(chǎn)新標(biāo)準(zhǔn)。
騰訊·混元大模型視頻團(tuán)隊
AI視頻生成。部分實際意義:為《王者榮耀》《元夢之星》生成高一致性游戲劇情動畫,節(jié)省外包成本;騰訊廣告AI視頻工坊年生成數(shù)十萬條個性化廣告,點擊率提升。部分創(chuàng)新意義:首創(chuàng)“物理引擎引導(dǎo)的視頻生成”框架,通過游戲引擎實時反饋修正運動軌跡(如布料模擬、流體效果),解決生成視頻違反物理規(guī)律問題;推動AI從“輔助工具”升級為“內(nèi)容生產(chǎn)基座”。
階躍星辰(StepFun)
通用語言模型(GLM)。部分實際意義:聚焦金融風(fēng)控與政務(wù)決策,其GLM在招商銀行反洗錢系統(tǒng)、深圳政務(wù)大腦中處理千億級實時數(shù)據(jù)流,風(fēng)險識別準(zhǔn)確率提升,誤報率降低。部分創(chuàng)新意義:開發(fā)“領(lǐng)域認(rèn)知引擎”,將行業(yè)規(guī)則、政策文件、歷史案例注入模型預(yù)訓(xùn)練,解決通用模型專業(yè)深度不足痛點;首創(chuàng)“可審計決策鏈”技術(shù),實現(xiàn)AI決策的全程可追溯,突破金融/政務(wù)可信應(yīng)用瓶頸。
AI編程(AI for Coding)。部分實際意義:聚焦企業(yè)級遺留系統(tǒng)現(xiàn)代化改造,其智能體在金融、能源行業(yè)實現(xiàn)COBOL→Java遷移、核心交易系統(tǒng)重構(gòu),準(zhǔn)確率超95%,節(jié)省數(shù)百萬人工工時;客戶包括國有銀行及電網(wǎng)公司。部分創(chuàng)新意義:開發(fā)“領(lǐng)域自適應(yīng)代碼翻譯引擎”,結(jié)合業(yè)務(wù)規(guī)則庫與歷史變更記錄,保證遷移后邏輯一致性;首創(chuàng)“代碼風(fēng)險熵”模型,量化評估重構(gòu)過程中的穩(wěn)定性風(fēng)險,推動AI編程在關(guān)鍵領(lǐng)域的可信落地。
AI智能體(Agent)。部分實際意義:聚焦“企業(yè)級AI Agent工廠”,為金融、能源、政務(wù)客戶提供可定制的任務(wù)型智能體;其產(chǎn)品在合規(guī)審查、合同解析、風(fēng)險評估等場景實現(xiàn)全流程自動化,替代傳統(tǒng)人工+規(guī)則引擎模式。部分創(chuàng)新意義:首創(chuàng)“場景原子化-智能體組裝”平臺,允許企業(yè)通過低代碼方式組合預(yù)訓(xùn)練的能力模塊(如文檔理解、邏輯校驗、流程觸發(fā)),快速構(gòu)建復(fù)雜業(yè)務(wù)智能體;推動Agent技術(shù)從實驗室走向產(chǎn)業(yè)核心流程。
面壁智能(MiniMax)
通用語言模型(GLM)。部分實際意義:Abab大模型驅(qū)動智能客服在平安、招聯(lián)金融落地,替代90%人工坐席,投訴率下降;游戲NPC引擎為網(wǎng)易《逆水寒》構(gòu)建動態(tài)敘事生態(tài),玩家留存提升。部分創(chuàng)新意義:提出“社會性智能”架構(gòu),融合多模態(tài)情感理解與人格一致性建模,實現(xiàn)人類意圖深度對齊;自研“蒸發(fā)冷卻”訓(xùn)練框架,在1/3算力下達(dá)到GPT-4 90%性能,突破訓(xùn)練效率天花板。
AI搜索。部分實際意義:其海螺AI搜索在電商、游戲行業(yè)落地,實現(xiàn)用戶行為序列建?!枨箢A(yù)測→精準(zhǔn)商品/內(nèi)容推薦閉環(huán),美團(tuán)、小紅書等客戶GMV提升。部分創(chuàng)新意義:提出“搜索即決策”(Search as Decision-Making)框架,將用戶模糊意圖轉(zhuǎn)化為馬爾可夫決策過程(MDP),通過強(qiáng)化學(xué)習(xí)動態(tài)優(yōu)化結(jié)果;重構(gòu)搜索與推薦邊界。
AI智能體(Agent)。部分實際意義:其Abab大模型驅(qū)動的智能體已在游戲NPC、虛擬社交、智能客服等場景實現(xiàn)高擬人化交互與長程目標(biāo)保持;與多家車企合作研發(fā)車載情感伴侶Agent,提供主動服務(wù)與個性化交互。部分創(chuàng)新意義:在多模態(tài)情感理解、記憶演化機(jī)制、社會性模擬技術(shù)上領(lǐng)先,使智能體具備“人格一致性”與上下文連貫性;提出“Social Agent”架構(gòu),探索AI對人類社交行為的深度理解與反饋。
月之暗面(Moonshot AI)
通用語言模型(GLM)。部分實際意義:Kimi智能助手服務(wù)中信建投、麥肯錫等企業(yè),實現(xiàn)200萬字上下文的全行業(yè)研報分析、競爭策略生成,替代初級分析師70%工作量;日均處理專業(yè)級長文本請求超500萬次。部分創(chuàng)新意義:突破“超長上下文無損壓縮”技術(shù),自研Moonshot-1T架構(gòu)支持128K→1M token無損擴(kuò)展,定義長文本推理新標(biāo)準(zhǔn);提出“思維森林”推理框架,實現(xiàn)復(fù)雜問題的多路徑探索與自我驗證。
AI搜索。部分實際意義:Kimi智能助手支持200萬字超長上下文,為投行、咨詢公司提供全行業(yè)報告深度分析、競品動態(tài)追蹤服務(wù),替代人工信息整合;日均處理專業(yè)級長文檔搜索請求超百萬次。部分創(chuàng)新意義:構(gòu)建“大模型原生搜索?!?,拋棄傳統(tǒng)倒排索引,通過端到端語義壓縮與重建技術(shù)直接理解海量非結(jié)構(gòu)化數(shù)據(jù);定義長文本推理為新型搜索范式。
科大訊飛·星火大模型
通用語言模型(GLM)。部分實際意義:在教育、醫(yī)療、司法領(lǐng)域深度滲透,智慧課堂覆蓋全國學(xué)校,自動生成個性化教案/試題;醫(yī)療輔診系統(tǒng)接入醫(yī)院,診斷建議符合率高;智慧法庭生成法律文書,辦案效率提升。部分創(chuàng)新意義:構(gòu)建“行業(yè)大腦”預(yù)訓(xùn)練范式,通過醫(yī)療知識圖譜、教育課程標(biāo)準(zhǔn)等專業(yè)數(shù)據(jù)強(qiáng)化領(lǐng)域認(rèn)知;突破多方言混合語音理解,支持23種方言實時轉(zhuǎn)譯,攻克普惠AI最后一公里。
美圖(MiracleVision)
AI圖像生成。部分實際意義:服務(wù)超電商商家,日均生成商品主圖/場景圖超百萬張,替代攝影棚拍攝,設(shè)計成本大幅度降低;AI寫真在婚紗、證件照領(lǐng)域?qū)崿F(xiàn)規(guī)?;顿M,復(fù)購率高。部分創(chuàng)新意義:首創(chuàng)“商業(yè)化美學(xué)評估體系”,將消費者偏好數(shù)據(jù)注入模型訓(xùn)練,解決AI生成圖“好看不賣貨”痛點;自研ControlNet-Mix技術(shù)實現(xiàn)人體姿態(tài)、商品形態(tài)的像素級控制,達(dá)到工業(yè)級可用性。
AI視頻生成。部分實際意義:AI電商視頻工具服務(wù)商家,一鍵生成商品展示視頻,制作成本降低至百元級;AI寫真視頻支持多姿態(tài)/表情連貫生成,付費用戶復(fù)購率高。部分創(chuàng)新意義:研發(fā)“人類意圖對齊控制網(wǎng)絡(luò)”,通過用戶寥寥數(shù)筆草圖精準(zhǔn)控制人物動作/場景構(gòu)圖(如“手指此處轉(zhuǎn)身”);將專業(yè)級視頻控制能力下沉至大眾端。
Tiamat(天工AI)
AI圖像生成。部分實際意義:聚焦專業(yè)設(shè)計領(lǐng)域,為奧美、藍(lán)色光標(biāo)等4A公司提供品牌視覺方案生成,項目周期縮短;游戲原畫生成在網(wǎng)易、米哈游項目落地,顯著節(jié)省了美術(shù)外包費用。部分創(chuàng)新意義:開發(fā)“設(shè)計語義解析器”,將抽象需求(如“賽博朋克+東方禪意”)解構(gòu)為可執(zhí)行參數(shù);首創(chuàng)分層編輯技術(shù),支持生成后對光影、材質(zhì)、構(gòu)圖的專業(yè)級調(diào)整,保留PSD工程文件。
商湯科技(SenseTime)
AI圖像生成。部分實際意義:在汽車設(shè)計領(lǐng)域生成高精度工業(yè)渲染圖,替代傳統(tǒng)油泥模型,縮短新車研發(fā)周期;智慧地產(chǎn)中實時生成室內(nèi)設(shè)計方案,客戶轉(zhuǎn)化率提升。部分創(chuàng)新意義:融合物理引擎與生成模型,確保工業(yè)品結(jié)構(gòu)符合空氣動力學(xué)/工程力學(xué);自研StyleDNA技術(shù)實現(xiàn)品牌視覺基因的提取與遷移(如保時捷線條語言→電動自行車設(shè)計)。
視覺識別。部分實際意義:在智慧城市(安防、交通管理)、智能手機(jī)(影像增強(qiáng))、醫(yī)療影像(AI輔助診斷)、汽車(智能座艙、自動駕駛感知)等領(lǐng)域大規(guī)模部署;其城市級視覺中樞系統(tǒng)管理著海量攝像頭,切實提升公共安全與交通效率。部分創(chuàng)新意義:長期投入基礎(chǔ)研究(如深度學(xué)習(xí)框架、大模型),擁有大量核心專利;率先提出“AI大裝置”概念,推動AI工業(yè)化生產(chǎn)。在醫(yī)療、自動駕駛等前沿領(lǐng)域持續(xù)探索突破性應(yīng)用。
生數(shù)科技(UniDiff)
AI視頻生成。部分實際意義:為央視、東方衛(wèi)視生成新聞虛擬播報視頻,口型與音頻同步誤差<0.1秒;影視劇組用其預(yù)演關(guān)鍵場景,減少實拍試錯成本超300萬/項目。部分創(chuàng)新意義:攻克“高精度口型驅(qū)動”與“微表情可控生成”技術(shù),通過跨模態(tài)對比學(xué)習(xí)實現(xiàn)音畫幀級對齊;自研UniDiff-XL架構(gòu)支持4K分辨率長視頻生成,突破行業(yè)天花板。
智譜AI·CodeGeeX
AI編程(AI for Coding)。部分實際意義:CodeGeeX2系列模型支持130+編程語言,為騰訊、字節(jié)等企業(yè)提供跨語言代碼翻譯、文檔自動化生成服務(wù);其VS Code插件月活開發(fā)者數(shù)十萬,在開源社區(qū)形成生態(tài)壁壘。部分創(chuàng)新意義:創(chuàng)新“多模態(tài)代碼理解”技術(shù),融合代碼結(jié)構(gòu)、注釋、流程圖信息提升生成準(zhǔn)確性;推出“AI結(jié)對編程”協(xié)作協(xié)議,實現(xiàn)人-AI實時協(xié)作編寫復(fù)雜模塊,定義新一代IDE交互標(biāo)準(zhǔn)。
冪律智能(PowerLaw AI)
AI搜索。部分實際意義:聚焦法律與合規(guī)垂直領(lǐng)域,其AI搜索引擎在法院、律所、企業(yè)法務(wù)部部署,實現(xiàn)案例判決預(yù)測、合同風(fēng)險掃描、法規(guī)變動推演,準(zhǔn)確率較高,替代數(shù)千小時人工檢索。部分創(chuàng)新意義:開發(fā)“法律知識圖譜增強(qiáng)型大模型”,將條文、判例、學(xué)理關(guān)系編碼為可計算網(wǎng)絡(luò),支持多跳因果推理;推動法律搜索從“法條查詢”升級為“策略生成”。
曠視科技(Megvii)
視覺識別。部分實際意義:在供應(yīng)鏈物流(智慧倉儲、工廠自動化)領(lǐng)域成就顯著,其機(jī)器人倉解決方案極大提升分揀效率和準(zhǔn)確率;智慧建筑(樓宇園區(qū)管理)解決方案廣泛落地;消費電子(手機(jī)解鎖、影像優(yōu)化)滲透率高。部分創(chuàng)新意義:在物體檢測、識別(尤其是復(fù)雜場景下)技術(shù)領(lǐng)先;其Brain++平臺致力于提升AI研發(fā)效率;創(chuàng)新性地將AIoT技術(shù)與垂直行業(yè)深度結(jié)合,重塑物流、制造等行業(yè)的運作流程。
云從科技(Cloudwalk)
視覺識別。部分實際意義:在金融領(lǐng)域(身份認(rèn)證、風(fēng)控)、智慧治理(城市管理、疫情防控)、交通(機(jī)場智能化)等場景深度應(yīng)用,尤其在人機(jī)協(xié)同操作系統(tǒng)與行業(yè)知識結(jié)合方面有特色。部分創(chuàng)新意義:強(qiáng)調(diào)“人機(jī)協(xié)同”理念,探索AI如何更好地輔助人類決策;在跨鏡追蹤、3D人體重建等技術(shù)上有突破;其CWOS操作系統(tǒng)是整合AI能力與行業(yè)應(yīng)用的創(chuàng)新平臺。
依圖科技(Yitu Technology)
視覺識別。部分實際意義:在醫(yī)療健康(醫(yī)學(xué)影像AI輔助診斷,尤其在影像組學(xué)、病理分析)、智慧城市(安防、交通)領(lǐng)域有深厚積累和實際部署;其醫(yī)療AI產(chǎn)品已在多家頂級醫(yī)院臨床使用。部分創(chuàng)新意義:在計算機(jī)視覺與自然語言處理、語音識別等多模態(tài)融合方面有深入探索;在芯片設(shè)計(如“求索”芯片)上尋求軟硬一體優(yōu)化,提升AI算力效率;醫(yī)療AI的科研探索處于前沿。
極視角(Extreme Vision)
視覺識別。部分實際意義:開創(chuàng)了“視覺算法商城”模式,匯聚了大量長尾、碎片化的工業(yè)視覺檢測需求(如生產(chǎn)線上的產(chǎn)品缺陷檢測、設(shè)備狀態(tài)監(jiān)控、農(nóng)業(yè)養(yǎng)殖監(jiān)測等),連接了算法開發(fā)者與企業(yè)用戶,解決了傳統(tǒng)視覺方案定制成本高、周期長的問題。部分創(chuàng)新意義:商業(yè)模式創(chuàng)新顯著;構(gòu)建了開放的視覺算法生態(tài)平臺,降低了AI視覺技術(shù)的應(yīng)用門檻,極大地拓展了AI視覺在傳統(tǒng)工業(yè)、農(nóng)業(yè)等領(lǐng)域的滲透率和應(yīng)用廣度,推動了“AI普惠”。
虹軟科技(ArcSoft)
視覺識別。部分實際意義:全球智能手機(jī)視覺算法核心供應(yīng)商,其影像解決方案(美顏、HDR、夜景、防抖等)應(yīng)用于數(shù)十億臺移動設(shè)備,深刻影響了移動影像體驗;在智能駕駛艙(DMS/OMS)領(lǐng)域也在快速落地。部分創(chuàng)新意義,在移動端嵌入式視覺算法的優(yōu)化和落地經(jīng)驗極其豐富,技術(shù)壁壘高;將復(fù)雜的視覺技術(shù)高度產(chǎn)品化、標(biāo)準(zhǔn)化,實現(xiàn)了大規(guī)模、低成本部署;是技術(shù)產(chǎn)品化商業(yè)化的典范。
關(guān)于AI圖像生成,真正具備實際意義(解決行業(yè)核心痛點、創(chuàng)造經(jīng)濟(jì)價值)和創(chuàng)新意義(技術(shù)突破或重構(gòu)工作流)的,含超越基礎(chǔ)文生圖,具備高精度可控生成、多對象邏輯關(guān)系建模、長尾需求覆蓋、商業(yè)級一致性輸出能力;規(guī)?;a(chǎn)業(yè)落地,在電商設(shè)計、游戲美術(shù)、影視概念、工業(yè)設(shè)計等場景替代傳統(tǒng)流程,實現(xiàn)降本增效量化驗證;技術(shù)自主性與壁壘,擁有自主訓(xùn)練的大模型或獨家控制架構(gòu),解決手部崩壞、文本渲染、風(fēng)格遷移等關(guān)鍵難題;推動生產(chǎn)范式革新,重構(gòu)創(chuàng)意工作鏈條或定義新應(yīng)用場景。
關(guān)于AI視頻生成,真正具備實際意義(解決行業(yè)核心痛點、創(chuàng)造可量化價值)和創(chuàng)新意義(突破技術(shù)瓶頸或重構(gòu)工作流)的,含超越簡單文生視頻,具備長時序一致性、物理邏輯建模、多鏡頭控制、動態(tài)細(xì)節(jié)生成能力,而非僅生成短視頻片段;規(guī)模化商業(yè)落地,在影視制作、電商營銷、游戲開發(fā)、工業(yè)仿真等高價值場景替代傳統(tǒng)流程,顯著降本增效;技術(shù)壁壘與自主性,擁有自主訓(xùn)練的視頻大模型或獨家架構(gòu),解決運動模糊、時空一致性等核心難題;以及推動行業(yè)范式革新,重構(gòu)內(nèi)容生產(chǎn)鏈條或創(chuàng)造新應(yīng)用場景。
關(guān)于AI搜索,真正具備實際意義(重構(gòu)信息獲取效率、解決傳統(tǒng)搜索瓶頸)和創(chuàng)新意義(技術(shù)架構(gòu)或交互范式突破)的,含超越關(guān)鍵詞匹配:具備語義理解、多模態(tài)檢索、個性化推理與生成式答案能力,而非僅優(yōu)化排序算法;規(guī)?;瘍r值驗證,在高價值場景(如專業(yè)領(lǐng)域知識庫、企業(yè)決策、科研探索)中替代傳統(tǒng)搜索,顯著提升信息獲取效率;技術(shù)自主性與壁壘,擁有自主訓(xùn)練的大模型、專用索引架構(gòu)或交互引擎,解決長尾查詢、數(shù)據(jù)孤島等核心痛點;推動范式革新,重新定義“搜索”行為(如從檢索到任務(wù)求解、從列表到智能體交互)。
關(guān)于AI編程(AI for Coding),真正具備實際意義(顯著提升生產(chǎn)力、解決開發(fā)瓶頸)和創(chuàng)新意義(突破傳統(tǒng)編程范式、重構(gòu)開發(fā)流程)的,含技術(shù)深度超越代碼補(bǔ)全,具備代碼理解、邏輯推理、系統(tǒng)設(shè)計、自動化調(diào)試與優(yōu)化能力,而非僅提供片段級補(bǔ)全或語法修正;規(guī)?;こ搪涞仳炞C,在企業(yè)級代碼庫、復(fù)雜系統(tǒng)開發(fā)、核心生產(chǎn)環(huán)境中部署,顯著提升研發(fā)效率(如降低Bug率、縮短交付周期);技術(shù)自主性與壁壘,擁有自主訓(xùn)練的大模型或?qū)S眉軜?gòu),在代碼生成質(zhì)量、長上下文理解、工具鏈集成等關(guān)鍵指標(biāo)上具備優(yōu)勢;推動開發(fā)范式革新:實現(xiàn)從“輔助工具”到“協(xié)作智能體”的跨越,改變軟件研發(fā)工作流。
關(guān)于AI智能體(Agent),真正符合實際意義(解決復(fù)雜決策問題、實現(xiàn)自主任務(wù)閉環(huán))和創(chuàng)新意義(技術(shù)架構(gòu)突破、新范式定義)的,含核心能力超越簡單問答/工具調(diào)用,具備復(fù)雜推理、動態(tài)規(guī)劃、環(huán)境感知、多步執(zhí)行與自我優(yōu)化能力,而非僅依賴大模型生成文本或調(diào)用單一API;規(guī)?;涞仳炞C,在高價值場景(如工業(yè)控制、金融決策、科研探索、復(fù)雜客服)中實現(xiàn)部署,產(chǎn)生可量化的效率提升或成本優(yōu)化;技術(shù)壁壘與自主性,擁有自主可控的智能體框架(如記憶管理、任務(wù)分解、工具學(xué)習(xí)、安全機(jī)制),非單純基于開源項目微調(diào);推動范式革新,定義新的人機(jī)協(xié)作模式或解決傳統(tǒng)自動化無法處理的非結(jié)構(gòu)化問題。
關(guān)于視覺識別,真正兼具實際意義(大規(guī)模解決現(xiàn)實問題)和創(chuàng)新意義(技術(shù)/模式突破)的,它們或在基礎(chǔ)技術(shù)研發(fā)、或在規(guī)?;涞亍⒒蛟诮鉀Q行業(yè)核心痛點、或在開創(chuàng)商業(yè)模式上,做出了經(jīng)得起市場檢驗的實質(zhì)性貢獻(xiàn),是推動中國AI視覺產(chǎn)業(yè)發(fā)展的中堅力量。
所有,均旨在聚焦于真正產(chǎn)生核心價值。
(文/不離其宗)
e-Mail:lab@enet16.com