聚焦AI Infra賽道,硅基流動(dòng)AI應(yīng)用的“賣鏟人”
前言:
在當(dāng)前的年度背景下,特別是針對(duì)國(guó)內(nèi)市場(chǎng),大模型的落地實(shí)施將主要聚焦于to B服務(wù)領(lǐng)域。
隨著大模型推理部署的成本持續(xù)下降,to C的應(yīng)用探索也將逐漸增多,這有望為市場(chǎng)帶來(lái)更多創(chuàng)新型的超級(jí)應(yīng)用,從而推動(dòng)整個(gè)行業(yè)的進(jìn)一步發(fā)展。
作者 | 方文三
圖片來(lái)源 | 網(wǎng) 絡(luò)
硅基流動(dòng)成AI應(yīng)用[賣鏟人]
近日,硅基流動(dòng)(SiliconFlow)成功完成了總金額接近億元人民幣的天使+輪融資。
此次融資由某知名產(chǎn)業(yè)方擔(dān)任領(lǐng)投角色,跟投方涵蓋了智譜AI、360以及水木清華校友基金等業(yè)內(nèi)知名企業(yè)及機(jī)構(gòu),同時(shí),老股東耀途資本亦繼續(xù)以超額額度參與本輪融資。
針對(duì)公司未來(lái)的發(fā)展規(guī)劃,硅基流動(dòng)將重點(diǎn)聚焦于技術(shù)產(chǎn)品創(chuàng)新以及全球商業(yè)化的推進(jìn)。
公司將持續(xù)優(yōu)化自主研發(fā)的SiliconLLM和OneDiff推理引擎,致力于提升模型的推理效率和用戶體驗(yàn)。
此外,硅基流動(dòng)還將對(duì)SiliconCloud平臺(tái)進(jìn)行進(jìn)一步升級(jí),持續(xù)推出高效能、低成本的AI模型云服務(wù)。
硅基流動(dòng)的創(chuàng)始人袁進(jìn)輝,曾任OneFlow和微軟亞洲研究院的主管研究員,其研發(fā)的LightLDA系統(tǒng)曾榮獲微軟亞洲研究院院長(zhǎng)的特別嘉獎(jiǎng)。
硅基流動(dòng)成立于2023年8月,旨在構(gòu)建規(guī);、標(biāo)準(zhǔn)化、高效能的生成式AI計(jì)算基礎(chǔ)設(shè)施平臺(tái)。
公司提供包括模型云服務(wù)平臺(tái)SiliconCloud、大語(yǔ)言模型推理引擎SiliconLLM、高性能文生圖/視頻加速庫(kù)OneDif等在內(nèi)的多款產(chǎn)品,助力企業(yè)和個(gè)人用戶高效部署AI模型。
自2016年起,袁進(jìn)輝所帶領(lǐng)的OneFlow團(tuán)隊(duì)作為世界范圍內(nèi)唯一專注于研發(fā)工業(yè)級(jí)通用深度學(xué)習(xí)框架的創(chuàng)業(yè)團(tuán)隊(duì),成功推出了高性能分布式深度學(xué)習(xí)框架。
隨著以大模型GPT為代表的技術(shù)熱潮興起,OneFlow團(tuán)隊(duì)所積累的大模型訓(xùn)練技術(shù)和認(rèn)知得到了充分驗(yàn)證。
2023年,OneFlow團(tuán)隊(duì)在處于大模型風(fēng)口之際,被原美團(tuán)聯(lián)合創(chuàng)始人王慧文所創(chuàng)立的大模型公司[光年之外]并購(gòu)。
隨后,[光年之外]因故被美團(tuán)并購(gòu),袁進(jìn)輝帶領(lǐng)團(tuán)隊(duì)創(chuàng)立了新公司[硅基流動(dòng)]。
與大廠相比,硅基流動(dòng)的核心優(yōu)勢(shì)體現(xiàn)在兩方面。
①公司具備深厚的大模型技術(shù)積累與創(chuàng)新,擁有頂尖的AI Infra技術(shù)能力團(tuán)隊(duì)和作品,原班技術(shù)團(tuán)隊(duì)在業(yè)界已打造出開(kāi)源訓(xùn)練框架OneFlow。
②其次,作為創(chuàng)業(yè)團(tuán)隊(duì),硅基流動(dòng)能夠快速捕捉到行業(yè)需求的變化,并靈活作出相應(yīng)的適配。
截至目前,硅基流動(dòng)已經(jīng)歷了兩輪融資。今年1月,公司完成了上一輪5000萬(wàn)元的天使輪融資,由創(chuàng)新工場(chǎng)領(lǐng)投,耀途資本、奇績(jī)創(chuàng)壇、美團(tuán)聯(lián)合創(chuàng)始人王慧文等跟投,投后估值達(dá)數(shù)億元人民幣。
核心產(chǎn)品體系已初步成型
硅基流動(dòng)自主研發(fā)的SiliconLLM大模型推理引擎,經(jīng)過(guò)對(duì)內(nèi)核、框架、機(jī)制及模型的深度優(yōu)化,實(shí)現(xiàn)了業(yè)界頂尖的推理效率,其速度相較于同類開(kāi)源產(chǎn)品,顯著提升超過(guò)十倍。
在應(yīng)對(duì)MoE架構(gòu)、超長(zhǎng)上下文處理和超低延遲等復(fù)雜場(chǎng)景時(shí),硅基流動(dòng)的產(chǎn)品展現(xiàn)出業(yè)界領(lǐng)先的實(shí)力。
硅基流動(dòng)近期推出了一站式云服務(wù)平臺(tái)SiliconCloud,該平臺(tái)致力于提供高效能、低成本的多品類AI模型服務(wù)(MaaS)。
SiliconCloud不僅集成了全球最新、最頂尖的開(kāi)源模型,還通過(guò)自研的推理引擎套件(SiliconLLM & OneDiff)顯著降低了大模型推理的成本,為用戶提供了卓越的性能體驗(yàn)。
這使得開(kāi)發(fā)者能夠?qū)W⒂诋a(chǎn)品創(chuàng)新,無(wú)需擔(dān)憂大規(guī)模推廣所帶來(lái)的高昂算力成本。
SiliconCloud匯聚了眾多主流大模型,包括阿里旗下的通義大模型Qwen2、智譜旗下的GLM-4、幻方量化旗下的DeepSeek V2系列開(kāi)源模型,以及文生圖模型SDXL、SDXL Lightning、PhotoMaker、InstantID等。
基于硅基流動(dòng)在AI Infra領(lǐng)域的深厚積累,SiliconCloud平臺(tái)上的大模型展現(xiàn)出更快的響應(yīng)速度和更低的算力成本,極大提升了AI應(yīng)用開(kāi)發(fā)效率,并顯著降低了部署成本。
例如,使用SiliconCloud調(diào)用文生圖模型Stable Diffusion,可以實(shí)現(xiàn)1秒出圖的高效能;
而調(diào)用大模型DeepSeek V2時(shí),其響應(yīng)速度可達(dá)50 Tokens/s。
這得益于SiliconCloud集成的視頻生成推理引擎OneDiff,它使文生圖模型SDXL的性能加速最高可達(dá)3倍。
AI Infra的重要性逐步顯現(xiàn)讓賽道收益
AI Infra(人工智能基礎(chǔ)設(shè)施)指的是在大模型生態(tài)系統(tǒng)中,除了算力之外,為支持大模型訓(xùn)練和部署流程所構(gòu)建的一系列底層軟件技術(shù)設(shè)施。
這些設(shè)施為開(kāi)發(fā)者提供了便捷高效的設(shè)計(jì)模型或使用模型的環(huán)境,無(wú)需過(guò)多關(guān)注底層算力資源的調(diào)配。
AI Infra層,作為銜接AI應(yīng)用層與算力芯片層的中間環(huán)節(jié),其在當(dāng)前大模型時(shí)代背景下扮演著類似[操作系統(tǒng)]的核心角色。
面對(duì)如何優(yōu)化大模型訓(xùn)練與推理的效率,充分發(fā)掘底層硬件的潛能,并降低生成式AI應(yīng)用開(kāi)發(fā)的門檻與成本等挑戰(zhàn),AI Infra層承擔(dān)著解決這些關(guān)鍵問(wèn)題的重任。
隨著ChatGPT等技術(shù)的火熱,大模型及其相關(guān)應(yīng)用持續(xù)涌現(xiàn),作為連接算力和應(yīng)用的AI中間層基礎(chǔ)設(shè)施,AI Infra的技術(shù)和商業(yè)發(fā)展前景備受矚目。
當(dāng)前,大模型的發(fā)展尚處于初期階段,快速構(gòu)建和訓(xùn)練調(diào)優(yōu)模型成為行業(yè)關(guān)注的焦點(diǎn)。
然而,隨著行業(yè)的逐漸成熟和應(yīng)用層的蓬勃發(fā)展,基礎(chǔ)設(shè)施的支撐作用將日益凸顯。
AI Infra不僅為應(yīng)用開(kāi)發(fā)者搭建了與硬件和模型之間的橋梁,提升了開(kāi)發(fā)效率和創(chuàng)新能力,還能有效滿足市場(chǎng)對(duì)高性能、低成本AI解決方案的迫切需求。
在國(guó)內(nèi),AI Infra領(lǐng)域的創(chuàng)新企業(yè)包括無(wú)問(wèn)芯穹、清程極智等,二者均背靠清華大學(xué),得到了來(lái)自智譜AI等投資者的支持。
其中,無(wú)問(wèn)芯穹由清華大學(xué)電子工程系主任汪玉發(fā)起,創(chuàng)始人夏立雪為其學(xué)生;而清程極智的創(chuàng)始人則來(lái)自清華計(jì)算機(jī)系。
在國(guó)際上,英偉達(dá)、亞馬遜、Lepton AI、OctoAI等企業(yè)以及伯克利大學(xué)開(kāi)發(fā)的vLLM等也在此領(lǐng)域展開(kāi)競(jìng)爭(zhēng)。
與文心一言、通義千問(wèn)等應(yīng)用層大模型產(chǎn)品相比,硅基流動(dòng)所聚焦的AI Infra賽道更注重連接算力和應(yīng)用的AI中間層基礎(chǔ)設(shè)施,涵蓋了數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、模型部署和應(yīng)用整合等多個(gè)環(huán)節(jié)。
據(jù)中金數(shù)據(jù)預(yù)測(cè),目前AI Infra產(chǎn)業(yè)正處于高速增長(zhǎng)的發(fā)展初期,預(yù)計(jì)未來(lái)3—5年各細(xì)分賽道有望保持超過(guò)30%的高速增長(zhǎng)。
結(jié)尾:
展望未來(lái),隨著模型的不斷升級(jí)、架構(gòu)的優(yōu)化以及定制芯片等降本增效措施的深入推進(jìn),AI應(yīng)用的盈利能力有望實(shí)現(xiàn)顯著提升,進(jìn)而逐步凸顯AI應(yīng)用層的價(jià)值。
在此過(guò)程中,與開(kāi)發(fā)者緊密關(guān)聯(lián)的AI Infra生態(tài)位將展現(xiàn)出顯著的優(yōu)勢(shì)。
同時(shí),值得注意的是,未來(lái)AI模型的參數(shù)量將呈現(xiàn)持續(xù)增長(zhǎng)的趨勢(shì)。
當(dāng)模型規(guī)模擴(kuò)大,現(xiàn)有的深度學(xué)習(xí)框架可能無(wú)法滿足開(kāi)發(fā)者的實(shí)際需求,這就要求對(duì)底層的AI框架進(jìn)行重構(gòu)。
這不僅是技術(shù)進(jìn)步的必然,也為創(chuàng)業(yè)公司提供了新的發(fā)展機(jī)遇。
部分資料參考:創(chuàng)投日?qǐng)?bào):《智譜AI、360都投了這家AI應(yīng)用[賣鏟人]》,智能涌現(xiàn):《袁進(jìn)輝新公司「硅基流動(dòng)」獲近億元天使+輪融資》,每日經(jīng)濟(jì)新聞:《硅基流動(dòng)完成近億元天使+輪融資》,金角財(cái)經(jīng):《國(guó)產(chǎn)AI,逃過(guò)一劫》,IPO早知道:《硅基流動(dòng)再獲近億元天使+輪融資》,晚點(diǎn)LatePost:《光年之外聯(lián)創(chuàng)再出發(fā),與袁進(jìn)輝聊 AI Infra到底做什么》,AI科技評(píng)論:《OneFlow 袁進(jìn)輝再創(chuàng)業(yè),成立新公司「硅基流動(dòng)」》
原文標(biāo)題 : AI芯天下丨產(chǎn)業(yè)丨聚焦AI Infra賽道,硅基流動(dòng)AI應(yīng)用的“賣鏟人”
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-10.29立即報(bào)名>> 2024德州儀器嵌入式技術(shù)創(chuàng)新發(fā)展研討會(huì)
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車
-
11月14日立即報(bào)名>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
推薦專題
- 1 Intel宣布40年來(lái)最重大轉(zhuǎn)型:年底前裁員15000人、拋掉2/3房產(chǎn)
- 2 因美封殺TikTok,字節(jié)股價(jià)骨折!估值僅Meta1/5
- 3 宏山激光重磅發(fā)布行業(yè)解決方案,助力智能制造產(chǎn)業(yè)新飛躍
- 4 國(guó)產(chǎn)AI芯片公司破產(chǎn)!白菜價(jià)拍賣
- 5 具身智能火了,但規(guī)模落地還需時(shí)間
- 6 國(guó)產(chǎn)英偉達(dá)們,抓緊沖刺A股
- 7 三次錯(cuò)失風(fēng)口!OpenAI前員工殺回AI編程賽道,老東家捧金相助
- 8 英特爾賦能智慧醫(yī)療,共創(chuàng)數(shù)字化未來(lái)
- 9 英偉達(dá)的麻煩在后頭?
- 10 將“網(wǎng)紅”變成“商品”,AI“爆改”實(shí)力拉滿
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市