2025年4月29日凌晨,阿里巴巴發(fā)布新一代通義千問(wèn)Qwen3模型。該模型為混合推理大模型,創(chuàng)新性地將“快思考”與“慢思考”集成于一體,極大地節(jié)省了算力消耗。阿里方面指出,在部署成本上,Qwen3相較于Deepseek等大模型顯著降低。
據(jù)介紹,Qwen3系列運(yùn)用“混合專家(MoE)架構(gòu)”,能夠模擬人類思考問(wèn)題的方式。對(duì)于復(fù)雜問(wèn)題,可進(jìn)行多步驟“深度思考”;面對(duì)簡(jiǎn)單需求,則能以低算力實(shí)現(xiàn)“秒回”答案,大幅削減了算力消耗。阿里稱,這種混合推理模型還能靈活契合AI應(yīng)用以及不同場(chǎng)景對(duì)性能和成本的多元需求。
當(dāng)前,阿里巴巴正圍繞Qwen系列構(gòu)建AI戰(zhàn)略版圖。2025年2月,阿里巴巴集團(tuán)CEO吳泳銘提及,公司“首要目標(biāo)”已轉(zhuǎn)向?qū)崿F(xiàn)通用人工智能(AGI),即打造具備人類級(jí)認(rèn)知能力的智能系統(tǒng)。未來(lái)三年,阿里將投入超3800億元人民幣,用于建設(shè)云和AI硬件基礎(chǔ)設(shè)施,總額超過(guò)過(guò)去十年總和。