太初元碁正式發(fā)布:高兼容性虛擬指令集 PCX,高性能工業(yè)級編譯器 PCXAC

當前,AI算力需求呈指數(shù)級增長,國內AI產業(yè)迎來前所未有的發(fā)展窗口期,構建自主可控、高效安全的AI基礎設施已成為產業(yè)發(fā)展的核心所在。然而,軟件生態(tài)的兼容性與編譯效率始終是制約國產AI加速卡規(guī)?;瘧玫年P鍵——國際主流指令集的技術壁壘、編譯器的性能瓶頸,導致不同硬件平臺間遷移成本高、硬件算力難以充分釋放。
太初元碁首次正式發(fā)布高兼容性虛擬指令集PCX、高性能工業(yè)級編譯器PCXAC,為上述行業(yè)痛點提供切實解決方案。PCX虛擬指令集的強兼容特性,能夠顯著降低跨硬件平臺的遷移成本;PCXAC編譯器,在性能上目前已超越業(yè)界主流的 LLVM,充分釋放硬件算力,將硬件算力極致、穩(wěn)定地釋放給每一行代碼。
PCXAC是PCX虛擬指令集的編譯系統(tǒng),由太初元碁自主研發(fā),能夠將PCX虛擬指令轉換為指定系列的太初AI加速卡的機器指令,從而屏蔽不同系列硬件的底層差異,即同一版本的PCX指令集可以在太初元碁多種系列的硬件上直接編譯并高效執(zhí)行,將程序與不同系列的硬件解耦。有效解決硬件迭代快,軟件適配成本高的問題。

產品亮點
高性能:精準適配太初元碁硬件,釋放異構眾核架構算力
PCX虛擬指令集深度匹配太初元碁的硬件特性,支持用戶在SDAA C程序中嵌入PCX指令,實現(xiàn)對關鍵計算路徑的精細優(yōu)化,有效提升程序在太初元碁系列硬件上的執(zhí)行效率,充分釋放太初元碁異構眾核架構的澎湃潛力。
強兼容:無縫適配不同系列硬件,屏蔽硬件底層差異
PCX能夠屏蔽太初元碁不同系列的硬件的指令差異?;赑CX開發(fā)的應用程序,無需修改,重新編譯后,即可在不同系列的太初元碁硬件上運行。嚴格的向后兼容性,有效保障軟件資產的長期可用性,降低因硬件系列不同所帶來的遷移成本。
輕量級:輕量級架構設計,資源占用少
PCXAC是一個輕量級的編譯器,僅需基礎編譯環(huán)境即可運行,減少開發(fā)環(huán)境搭建的復雜度與兼容性問題,用戶可快速啟動編譯工作,降低環(huán)境配置成本;且在編譯過程中對系統(tǒng)資源占用少,避免因編譯器運行導致的資源爭搶,提升資源利用率。
低成本:簡化開發(fā)流程,降低技術門檻
PCX通過屏蔽底層物理指令集的復雜性,大幅降低太初元碁眾核異構架構的開發(fā)復雜度。PCX無需用戶深入掌握不同系列硬件的差異,只需專注核心算法邏輯的設計與優(yōu)化,減少硬件適配的重復開發(fā)工作;同時,支持由SDAA C的編譯器TecoCC自動生成PCX指令,有效降低編碼門檻與調試成本,提升開發(fā)效率。
功能全:工具集豐富,問題場景覆蓋全面
PCX提供完整的開發(fā)分析工具集,覆蓋從編碼到運行的全流程。靜態(tài)檢查工具,在PCX程序編譯期間,提前預警內存泄漏等隱患;動態(tài)檢查工具,在PCX程序執(zhí)行期間,動態(tài)檢測越界訪問、未初始化使用等深層問題。助力用戶更早發(fā)現(xiàn)、更快定位潛在缺陷,提升開發(fā)效率與代碼質量。

性能實測
在太初元碁 T100 加速卡上,太初元碁對深度學習算子(卷積、規(guī)約等)進行嚴格的單卡性能對比測試。實測結果顯示:使用 PCX 虛擬指令集編譯生成的程序,其運行時性能較基于 LLVM 編譯的版本有大幅提升。
實測數(shù)據(jù)表明,PCX 能夠深度適配國產硬件,且其編譯器 PCXAC 能夠充分將硬件算力轉化為性能優(yōu)勢。PCXAC 相較 LLVM 的性能提升,不僅證明 PCXAC 編譯器在國產算力轉化效率上的領先性,更預示著在實際場景中能夠大幅降低訓練與推理的時間成本。
學習資源
更多詳細信息,可以登錄太初官方文檔中心(http://docs.tecorigin.com/),或掃描下方二維碼,快速獲取太初元碁PCX虛擬指令集的學習資源。

以兼容破壁壘、以性能釋算力,PCX 與 PCXAC 的正式發(fā)布,不僅是國產基礎軟件領域的一次關鍵突破,更是國產 AI 產業(yè)從 “硬件突圍” 邁向 “生態(tài)自立” 的重要里程碑。
未來,太初元碁將持續(xù)深耕軟硬件協(xié)同創(chuàng)新,以開放姿態(tài)攜手行業(yè)伙伴共建自主可控的算力生態(tài),共同推動國產 AI 計算底座走向更高水平的自主與繁榮。



