<pre id="k8ye9"><tfoot id="k8ye9"><fieldset id="k8ye9"></fieldset></tfoot></pre>
  1. <blockquote id="k8ye9"></blockquote>

    <wbr id="k8ye9"><sup id="k8ye9"></sup></wbr>

        亚洲人成色777777老人头,久久精品欧美日韩精品,久艹视频免费看,国产成a人片在线观看视频下载,凸凹人妻人人澡人人添,四虎影视永久在线精品,农民人伦一区二区三区,午夜福制92视频
        歡迎訪問深圳市中小企業公共服務平臺電子信息窗口

        美國禁止高端GPU“外流”,卻也給了國產GPU又一次發展機遇

        2023-11-10 來源:賢集網
        4345

        關鍵詞: GPU 人工智能 芯片

        被美國商務部將其列入“實體清單”后,國產顯卡大廠摩爾線程表現的十分不爽。

        11月6日,摩爾線程創始人兼首席執行官張建中給公司全體員工發出一封信,信中寫道:在這個挑戰與機遇并存的時間點,我想說的是,中國GPU不存在“至暗時刻”,只有星辰大海。

        摩爾線程從始至終只有一項事業:打造中國最好的全功能GPU,我們會將這項事業進行到底,任何事情都不會影響我們堅定走下去的決心。

        按照摩爾的說法,加快自主研發與創新。目前他們的已獲授權專利數量暫時實現了國內領先,但是距離公司的目標還需更努力。


        張建中還表示,要打造高效團隊。加強組織管理,聚焦全功能GPU核心技術研發,保持團隊高效和敏捷。


        國產GPU的發展浪潮

        要論國內的芯片熱潮,主要是兩次發展。第一次是在智能算法和技術加持下的AI芯片,其中包括圖形處理器單元(GPU)、現場可編程門陣列(FPGA)以及專門用于人工智能的特定應用集成電路(ASIC)。

        不管是早期入門的寒武紀,還是斥巨資入局的比特大陸、云知聲等企業,都已經獲得了數千萬美元的投資,是指近日,有的已經成長為行業獨角獸,有的成功上市,還有的被成功并購。

        第二波浪潮是在2020年,芯片行業在GPU領域的創業熱潮。眾所周知,GPU主要被用作圖形計算領域,在人工智能技術的加持下,GPU也因為擁有大規模運行并計算的能力而吸引了更多資本的入局,定義了GPU的英偉達就在2021年成為全球市值最高的芯片公司。

        在芯片短缺的當下,我國也越來越認識到擁有國產芯片的重要性,于是推出了各種政策支持國產GPU的發展。同時,GPU也比一般科技領域的探索更加燒錢,因此需要大量的資本扶持。目前已經有很多早進入、已有陳品的公司開始和客戶一起落地合作,不斷完善其軟件系統,后成立的公司也在研發過程中積極尋找自己潛在的合作伙伴,在GPU芯片創業浪潮的推動下,芯片的“落地”成為了重要需求。

        我國的芯片黃金時代已經來臨,國產GPU正在強勢崛起,不管是GPU芯片、AI芯片還是計算芯片“新貴”DPU賽道,都熱鬧非凡。但不管是在那個領域,只有擁有真獲贈的技術和拿的出售的產品才能掌握市場的話語權。


        CPU+GPU都要才不被卡脖子

        2022 年 10 月 7 日美國商務部工業安全局(BIS)發布《美國商務部對中華人民共和國(PRC)關于先進計算和半導體實施新的出口管制制造》細則中管制物項包含高性能 AI 芯片產品, Nvidia A100 和 H100 均在管制行列。在此背景下,Nvidia推出性能閹割的中國特供版芯片A800和H800天價向國內出售,而隨著A800和H800的停產,Nvidia將對中國提供進一步閹割的A40和T40。未來在AI芯片,特別是 GPU上這種受制于人的狀態勢必會對中國 AI 產業提出極大的挑戰。因此在國內自主可控的大背景下,國內AI產業對國產GPU芯片的需求也同樣迫切。

        當代人工智能建立在統計學基礎上,是數據驅動型的表現,本質是在AI芯片上運行算法計算海量數據,訓練AI模型,推理結論。在人工智能領域,AI芯片可以分為大概分為GPGPU、FPGA和ASIC。GPGPU芯片采用統一渲染架構,計算通用性最強,可以適用于多種算法,在很多算法前言的領域,GPGPU是最佳選擇。 GPGPU服務器占據86%的市場份額,在人工智能的計算市場銷售額占比最大,其中Nvidia約占96.1%。FPGA是一種半定制芯片,對芯片硬件層可以靈活編譯,缺點是當處理的任務重復性不強、邏輯較為復雜時,效率會比較差。ASIC是一種為專門目的而設計的芯片(全定制),是根據特定算法定制的芯片架構,針對特性算法算力強大,但算法一旦改變,計算能力會大幅下降,如:基于神經網絡算法與加速的 NPU。

        根據參與運算數據精度的不同,可把算力分為雙精度算力(64位,FP64)、單精度算力(32位,FP32)、半精度算力(16位,FP16)及整型算力(INT8、INT4)。數字位數越高,意味著精度越高,能夠支持的運算復雜程度就越高,適配的應用場景也就越廣。在需要處理的數字范圍大而且需要精確計算的科學計算、工程計算領域,都需要雙精度算力(FP64)的支持;在AI大模型、自動駕駛、深度學習等人工智能模型的訓練領域,一般需要單精度算力(FP32)的支持;而像數字孿生、人臉識別等利用訓練完畢的模型進行推理的業務,適用于半精度算力(FP16)或者整型算力(INT8、INT4)。



        我們國產的GPU廠商,包括GPGPU架構的海光、天數智芯壁仞科技、摩爾線程等,其中海光是目前唯一一家大規模量產出貨且規模應用的GPGPU芯片,能實現64位雙精度、32位單精度、16位半精度和8位整型算力的全面覆蓋;另外就是NPU架構體系的華為、燧原、寒武紀等。而不同架構體系對精度的實現也是不同的:

        GPGPU芯片一般會布局大量的雙精度和單精度的計算區域,同時也覆蓋到半精和整形算力。GPGPU的算力精度涵蓋較廣,應用的領域也更廣泛,整個產業的生態相對完整,但是芯片設計相對比較復雜,前一陣美國限制向中國出口的AI芯片也是高端的GPGPU芯片。

        NPU的優勢是大部分時間集中在低精度的算法,芯片算力一般以半精度算力(FP16)和整型算力(INT8、INT4)為主,擅長處理視頻、圖像類的海量多媒體數據,不涉及高精度算力應用的領域。因此NPU芯片主要是覆蓋低精度,應用領域比較受限,特別是很多NVIDIA的業務如果遷移到NPU環境下,在需要大量的遷移適配工作的同時,也會面臨模型遷移后而遇到的算法和引擎識別精度下降的問題。

        值得注意的是,現階段AI應用中,大量的算法、模型、庫、開發框架、軟件和應用都基于通用加速卡架構開發出來,且具備較高的成熟度。在國產AI產業發展之路上,隨著超大規模預訓練模型對算力需求的持續攀升,使用GPGPU的通用架構對Nvidia進行替換和業務模型的高效便捷移植,建設CPU+高精度通用GPGPU的算力中心,是自主可控發展的必由之路。


        軟件是更高的壁壘

        比起硬件性能上可接受的差異,軟件適配與兼容讓客戶接受更難。

        當大模型和應用層面的競爭拉響,從商業角度思考,采用國產AI芯片參戰并不是好的選擇。

        從硬件性能上,使用國產AI芯片計算會比采用英偉達A100慢,在分秒必爭的當下,“慢”是企業最不愿意看到的場景。

        此外,哪怕能通過堆芯片的方式堆出一個算力相當的產品,從服務器運營的角度,它的主板開銷、電費、運營費,以及需要考慮的功耗、散熱等問題,都會大大增加數據中心的運營成本。

        因為算力資源常需要以池化的形式呈現,數據中心通常更愿意采用同一種芯片,或者同一公司的不同芯片,來降低算力池化難度。

        對客戶而言,把國產AI芯片用起來并不容易。

        算力的釋放需要復雜的軟硬件配合,才能將芯片的理論算力變為有效算力。國產AI芯片想要替換英偉達的GPU,需要突破CUDA生態和整個產業生態的壁壘。

        摩爾線程有著自己的全功能GPU芯片,且推出了AIGC平臺,李豐告訴36氪:“最難的是生態的建立,我們要兼顧很多的生態兼容性。

        先說CUDA,為了把GPU的算力能力進一步發揮,英偉達花了10年時間,投入3000多人打造了一個CUDA框架。這套框架里集成了很多調用GPU算力所需的代碼,工程師可以直接使用這些代碼,無須一一編寫。

        如果沒有這套編碼語言,軟件工程師發揮硬件價值的難度會變得極大。一位關注基礎軟件的投資人告訴36氪:“沒有CUDA ,調用GPU的代碼會寫到地老天荒,不可能所有的東西都自己寫。”

        尚處于創業階段的芯片設計公司,很難在生態上投入如此大的人力財力。大多會選擇兼容CUDA架構,來降低客戶使用門檻。

        也有部分公司會選擇自研加速器,如寒武紀就構建了自己的加速平臺;昆侖芯也面向開發者提供了類似英偉達CUDA的軟件棧,希望打造自己的生態,也能擺脫硬件需受CUDA更新的困擾。

        即使有了這個編程框架,整個產業生態上的人也很難把這個芯片用起來。

        目前世界上主流的深度學習框架都有基于CUDA進行加速的,整個產業中下游軟件、驅動廠家等都基于此進行適配。這構成了一個極強大的生態壁壘,就像蘋果系統內部的閉環生態,和window操作系統+上層應用軟件一樣。

        對于企業來說,更換云端 AI 芯片要承擔一定的遷移成本和風險,除非新產品存在性能優勢,或者能在某個維度上提供其他人解決不了的問題,否客戶更換的意愿很低。

        祥峰投資管理合伙人夏志進也告訴36氪:“軟件生態是好用不好用的問題,沒有CUDA會提高門檻,不是不可以用,只是需要花很多額外的功夫。”



        芯片需要適配硬件系統、工具鏈、編譯器等多個層級,需要很強的適配性,否則會出現這款芯片在某個場景能跑出90%的算力,在另一場景只能跑出80%效能的情景。

        即使英偉達,為了更好發揮硬件的功效,對于大客戶也會提供一些人力,幫忙做軟件適配調試,軟硬兩方仍需要針對客戶做部署、調試。

        對性能要求較高的大廠,還會設置專門的軟件部署師對硬件進行適配,來發揮硬件的最大性能。這也是很多手機廠商會自研芯片來更好適配產品的原因。


        共建生態,尋求解法

        目前,國內從業者已經在構建生態上做努力。

        在一個AI生態中,支撐大模型訓練需求,需要底層硬件、中間深度學習平臺、上層應用軟件的整體適配,互相支持。

        硬件對上層軟件的支持情況,必須代碼寫出后,有人一步步躺坑,才能知道問題所在,改進硬件對軟件的支持效果。

        一家C輪應用型軟件公司告訴36氪,自己需要對不同類型、不同版本的基礎軟硬件進行適配,每年花在適配上的支出超出千萬元。

        百度飛槳已在推動和國內芯片適配。

        2022年4月時,百度飛槳已完成和包括百度昆侖芯、華為昇騰在內的22家國內外硬件廠商,31種芯片的適配和優化,基本覆蓋國內主流芯片。

        目前,昆侖芯和飛槳完成3級兼容性適配,登臨科技和飛槳也完成2級適配,沐曦集成電路和飛槳完成1級兼容性測試。

        近期,華為的MindSpore被報道和愛可生向量數據庫兼容。有信息顯示,沐曦之前也已加入昇思MindSpore社區。

        另一個大模型領域重要玩家,智源研究院,其九鼎智算平臺也在和多家國內AI芯片公司合作。

        未來,大模型訓練對算力的需求會越來越大。比如,科研場景或訓練視頻類信息,都需要更大的算力支持。

        英偉達等廠商也會不斷追求研發更高性能的芯片,海外企業可以購買英偉達算力更高的芯片,推動大模型訓練。比如,微軟已經和宣布加強和英偉達和合作,將GPU 從此前的 A100 升級到 H100。

        參戰大模型競賽,算法、算力、數據環環相扣。在最卡脖子的環節,如何縮小GAP,成為一個求共解的命題。



        主站蜘蛛池模板: 视频一区二区三区四区五区| 天干天干天啪啪夜爽爽99| 亚洲色一色噜一噜噜噜| 无码人妻精品一区二区三区蜜桃| 欧美福利电影A在线播放| 奉节县| 日韩伦理片| 久久久久免费看少妇高潮A片| 99久久99这里只有免费费精品| A级毛片100部免费看| 日本免费最新高清不卡视频| 亚洲色大成网站www久久九九| 欧美人妻久久精品| 四虎影视国产精品永久在线| 国产精品欧美福利久久| 久久综合色一综合色88| 四虎成人在线观看免费| 国产在线无码不卡播放| 中文字幕日韩精品东京热| 麻豆精品久久久久久久99蜜桃| 正在播放肥臀熟妇在线视频| 亚洲区一区二区三区视频| 欧美人与zoxxxx另类| 亚洲偷自拍另类一区二区| 成人欧美一区二区三区在线观看| 日本深夜福利在线观看| 亚洲中文一区二区av| 亚洲av午夜福利精品一区二区| 成人区人妻精品一区二蜜臀| 精品亚洲国产成人av| 亚洲精品成人区在线观看| 亚洲欧美日韩在线码| 欧美日本国产va高清cabal| 亚洲欧美高清在线精品一区二区| 国产精品蜜臀av在线一区| 精品无码久久久久国产电影| 尤物蜜芽国产成人精品区| 成人国产片视频在线观看| 日韩av日韩av在线| 亚洲综合一区二区国产精品| 国产福利精品一区二区|