算法訓(xùn)練幾乎0成本!梧桐大模型讓首批用戶吃上“螃蟹”
【CPS中安網(wǎng) cps.com.cn】 行業(yè)大模型正在爆炸式集中推出,關(guān)注大模型的人士都知道了行業(yè)大模型的簡單公式,通用大模型+行業(yè)場景+訓(xùn)練調(diào)優(yōu)=行業(yè)大模型,因此訓(xùn)練調(diào)優(yōu)是企業(yè)自研大模型不可避開的重要環(huán)節(jié)。
然在其他企業(yè)還在觀望,推出,演示或者調(diào)優(yōu)的當(dāng)下,宇視作為推出AIoT行業(yè)大模型的第一人,6月9號(hào),其小范圍召開了大模型“梧桐”種子合作伙伴簽約會(huì)并公開了“梧桐”未來的規(guī)劃。
目前“梧桐”針對(duì)需求計(jì)劃細(xì)化出三種不同模型:
CV(計(jì)算機(jī)視覺)行業(yè)大模型
提供AI訓(xùn)練、AI在線學(xué)習(xí)等服務(wù),預(yù)計(jì)將在7月底上線,現(xiàn)階段已經(jīng)在小范圍測試。
NLP(自然語言處理)行業(yè)大模型
提供資料中心、大數(shù)據(jù)平臺(tái)、代碼開發(fā)等服務(wù),這是一款自用行業(yè)大模型,目前階段只在宇視內(nèi)部使用,主要用在內(nèi)部生產(chǎn),精準(zhǔn)度要求更高。
MM(多模態(tài))行業(yè)大模型
提供Vlog等服務(wù),目前已在樂園景區(qū)、鄉(xiāng)村振興等場景的視頻宣傳上有豐富的落地案例。
那打出“AIGC平權(quán)”旗幟的宇視將怎么把技術(shù)平權(quán)和知識(shí)平權(quán)真正融進(jìn)中小型企業(yè)業(yè)務(wù)里?
CPS中安網(wǎng)作為特邀媒體就此疑問與部分宇視核心高管面對(duì)面進(jìn)行了“圓桌對(duì)話”。
01.
大模型趨勢下
中小型企業(yè)怎么用好數(shù)據(jù)?
中小企業(yè)作為中國經(jīng)濟(jì)發(fā)展的重要主體之一,據(jù)工信部公布的數(shù)據(jù),2022年我國日均新設(shè)企業(yè)達(dá)2.38萬戶,中小微企業(yè)數(shù)量已超過5200萬戶,在如今大模型熱潮下,不少中小企業(yè)都在關(guān)注行業(yè)大模型將會(huì)如何為自身企業(yè)真正做到降本增效。
雖然數(shù)字化轉(zhuǎn)型理念愈來愈普及,不少中小企業(yè)都想搭上“高效”這趟車,但“數(shù)據(jù)怎么用?”“花費(fèi)多少成本?”這兩大疑慮把大部分中小企業(yè)攔在了車門外。
除此之外,雖說行業(yè)都在認(rèn)可“ALL in AI”這一現(xiàn)狀,但不少中小型企業(yè)對(duì)于AI的理解可能仍局限性停留在人臉識(shí)別。
宇視云智能產(chǎn)品部部長湯利波告訴CPS中安網(wǎng),作為直接接觸到市場動(dòng)向脈搏的中小型企業(yè),其完全可以利用數(shù)據(jù)針對(duì)性訓(xùn)練一些細(xì)分業(yè)務(wù)場景的算法?!巴ㄟ^場景化算法指標(biāo)能力的提升,有機(jī)會(huì)去提升解決方案的增值性,包括服務(wù)收益的增值性?!?/p>
舉個(gè)簡單的例子,在游樂園娛樂等場所,大部分人可能認(rèn)為攝像頭只是起到安全防控的作用,但假設(shè)負(fù)責(zé)這個(gè)場景業(yè)務(wù)的企業(yè),愿意讓攝像頭搭載上提前訓(xùn)練好的大模型,訓(xùn)練好的大模型經(jīng)過推理后,將其視頻數(shù)據(jù)進(jìn)行自動(dòng)分割、自動(dòng)識(shí)別、剪輯美化,游樂園就能從原有的出售游客圖片的業(yè)務(wù)升級(jí)到游客專屬vlog,這便讓原本只是躺在存儲(chǔ)里的數(shù)據(jù)得到了進(jìn)一步調(diào)動(dòng)應(yīng)用。
可以明顯看到,在大模型趨勢下,對(duì)于中小型企業(yè)而言,其如何通過大模型利用數(shù)據(jù)達(dá)到降本增效的作用,結(jié)果還是開源或者節(jié)流,省下人力、時(shí)間、精力成本的同時(shí)對(duì)現(xiàn)有業(yè)務(wù)進(jìn)行升級(jí)賦能,將服務(wù)收益最大化或許才是正解。
基于此,對(duì)于判斷市場上任意一項(xiàng)新技術(shù)或者新產(chǎn)品是否值得應(yīng)用,中小型企業(yè)往往更加在意實(shí)際投入成本幾何。關(guān)于成本問題,會(huì)上,宇視的大模型也給出了階段性答案。
02.
幾乎0成本訓(xùn)練
梧桐CV行業(yè)大模型將上線
“我們需要更多的渠道能夠有這種能力,更好的和宇視合作,而不是只有幾家壟斷的市場?!庇钜旵PO朱兵說。
具體來說,宇視的賦能之道是,在訓(xùn)練側(cè)上,用戶企業(yè)可以遠(yuǎn)程通過互聯(lián)網(wǎng)訪問之后來訓(xùn)練算法,宇視會(huì)承擔(dān)云的租用費(fèi)用,為用戶企業(yè)省去前期訓(xùn)練需要的成本,企業(yè)可以幾乎0成本獲得宇視開通的大模型訓(xùn)練賬號(hào),在訓(xùn)練過程中,會(huì)有宇視專門的技術(shù)團(tuán)隊(duì)進(jìn)行支持。
在推理側(cè)上,宇視通過將場景化的算法進(jìn)行剝離,也就是將相對(duì)小模型的算法部署到宇視邊緣端的設(shè)備上,一定程度上避免合作伙伴為此額外部署一個(gè)幾千萬起步的超算機(jī)房。
此外,算法拓展在目前階段仍屬于煙囪式,即使用戶需求很相近,但由于對(duì)象的不同還是需要重新生成算法,容易導(dǎo)致投入產(chǎn)出比和客戶需求之間的矛盾,而預(yù)計(jì)7月底正式上線的“梧桐CV行業(yè)大模型”可以較好解決這個(gè)問題。
舉個(gè)例子,假設(shè)現(xiàn)在有60多萬個(gè)體育館,300多萬套器材,這60多萬個(gè)體育館的器材放置地點(diǎn)都不同,此時(shí)項(xiàng)目方需要知道所有館的器材的使用頻率和大眾愿意使用哪類健身器材,這時(shí)候如果用小模型就需要采集各個(gè)體育館的數(shù)據(jù)進(jìn)行對(duì)比再針對(duì)性地多次訓(xùn)練,而“梧桐CV行業(yè)大模型”卻能在比較小的數(shù)據(jù)量情況下,做到泛化識(shí)別和推理,即使器材對(duì)象千差萬別,但省去了二次訓(xùn)練、學(xué)習(xí)的環(huán)節(jié)。
場景多N倍,算法獲得率提升80%,算法精準(zhǔn)度從85%提升至95%,讓IT工程訓(xùn)練師訓(xùn)練算法,更容易解決行業(yè)Know-How問題,入門門檻更低,大模型梧桐的優(yōu)勢也由此凸顯,
目前“梧桐CV行業(yè)大模型”已經(jīng)和第一批合作伙伴完成落地計(jì)劃的簽約,率先在體育、教育、交通、零售等領(lǐng)域進(jìn)行首發(fā)落地。
相信在未來,大模型的“訓(xùn)練”“推理”兩個(gè)關(guān)鍵詞優(yōu)勢將會(huì)日益凸顯,據(jù)了解,為保障大模型的順利運(yùn)行,宇視目前部署在云邊端芯片款型超過50款,支持的算法種類超過1000個(gè),模型數(shù)過萬,產(chǎn)品款型過千。
前期成本宇視承擔(dān),合作伙伴幾乎0成本接入,這么大的支持力度,相信業(yè)內(nèi)人士都會(huì)十分好奇,宇視到底靠梧桐大模型怎么實(shí)現(xiàn)盈利?
03.
瞄準(zhǔn)生態(tài)價(jià)值
力爭高效落地
傳統(tǒng)意義上,做了一個(gè)軟件,投入100萬,就要力爭賣到200萬,最后賺100萬,光明正大的追求利潤是企業(yè)繞不開的話題。
但這次,宇視并沒有打算使用傳統(tǒng)的賣軟件直接獲利策略,而是通過讓利給合作伙伴,讓合作伙伴通過使用“梧桐”得到多個(gè)專屬的“行業(yè)軟件工程師”?!白層钜暤那烙?,讓他們有進(jìn)入一些新的業(yè)務(wù)模式的可能?!敝毂f道。
在這個(gè)平權(quán)時(shí)代,支撐宇視此次這么大膽的行徑的信心和念想究竟來自哪里?
“平權(quán)時(shí)代,最大的競爭力在于你的效率,在于公司看清楚自己的定位之后能夠第一時(shí)間全力撲上去做?!?/p>
2012年,宇視捕捉到人工智能的發(fā)展趨勢,同年便開始在深度學(xué)習(xí)領(lǐng)域進(jìn)行投入,2016年,宇視推出初代基于DL的AIoT產(chǎn)品,如今來到大模型爆炸階段,宇視又成為第一個(gè)推出“AIoT行業(yè)大模型”的第一人。
2023年,宇視這次對(duì)于“梧桐”大模型的定位到底是什么?
沒錯(cuò),就是落地化,工程化。正如微軟將GPT-4對(duì)接Office、金山將其大模型產(chǎn)品“WPS AI”接入WPS,大模型最終的落地還得是在硬件上。
那宇視怎么快速落地實(shí)現(xiàn)工程化?總結(jié)為以下幾點(diǎn):
原有的深度學(xué)習(xí)積累和產(chǎn)品工程化落地可繼承
站在通用大模型的肩膀上開發(fā)自己的行業(yè)大模型
通過“剪枝”和“蒸餾”等技術(shù),實(shí)現(xiàn)行業(yè)大模型的邊緣側(cè)部署
開放能力給合作伙伴,同時(shí)有專門的培訓(xùn)和技術(shù)服務(wù)體系保障
也許正如此次宇視簽約種子伙伴之一的萬店掌所言,眾多行業(yè)大模型中為什么選擇宇視,其實(shí)占比很大一部分原因是其本身已經(jīng)和宇視有過合作,對(duì)宇視這個(gè)品牌已經(jīng)存在一定的認(rèn)知力和認(rèn)可度,剛好宇視在這個(gè)階段推出了大模型就相當(dāng)于為合作伙伴提供了一條龍服務(wù),省去了對(duì)其他新品牌的學(xué)習(xí)、切換成本,選擇宇視會(huì)適配度更高。
當(dāng)然,在這個(gè)數(shù)據(jù)量爆炸的時(shí)代下,不少企業(yè)還是會(huì)十分在意保密性,而目前由于大部分中小企業(yè)不具備私有云的部署能力,因此愿意上云的企業(yè)的數(shù)據(jù)會(huì)相對(duì)集中在公有云上,一旦拿出來訓(xùn)練是否會(huì)產(chǎn)生泄漏的風(fēng)險(xiǎn)?
“我們前期在接觸合作伙伴過程中,也有客戶有安全性的疑慮,主要疑慮在原有數(shù)據(jù)是否外泄和訓(xùn)練成果收否會(huì)被無償占用兩方面”湯利波說道。而宇視“梧桐”也將通過相關(guān)技術(shù)進(jìn)行分權(quán)、分域,建立完善的權(quán)限管理和安全管控制度,融合等方式保證訓(xùn)練成果的安全性和獨(dú)享性。
04.
大模型戰(zhàn)場已開局
是開始還是結(jié)束?
風(fēng)起于青萍之末,浪成于微瀾之間。
相對(duì)之前企業(yè)拼數(shù)據(jù)樣本,拼私有的訓(xùn)練平臺(tái),拼技術(shù)架構(gòu)的小模型AI時(shí)代,如今隨著大模型相繼開源后,有基礎(chǔ)的企業(yè)大都可以基于開源組件進(jìn)行自身大模型的自研,先用通用大模型把原始的大量行業(yè)場景的知識(shí)數(shù)據(jù)清洗一遍,再把顯著目標(biāo)值給提取出來,去重后形成行業(yè)數(shù)據(jù)庫,最終投喂給通用大模型訓(xùn)練出一個(gè)行業(yè)大模型。
Open AI用了上萬塊英偉達(dá)GPU喂出了一個(gè)ChatGPT,浪潮掀到中國,國內(nèi)千模大戰(zhàn)已拉開,行業(yè)大模型或?qū)⑹俏磥砀鱾€(gè)領(lǐng)域都會(huì)去追尋的模式。
縱觀安防行業(yè)幾十年的發(fā)展,從模擬階段的爭奪攝像頭代理權(quán),到網(wǎng)絡(luò)數(shù)字階段的系統(tǒng)業(yè)務(wù)成焦點(diǎn),再到智能化階段的ALL in AI,如今已到大模型卷入階段,或許正如宇視CEO張鵬國曾在深圳安博會(huì)舉辦期間抒發(fā)的經(jīng)典語錄所言:“意識(shí)到這是場戰(zhàn)爭的時(shí)候,戰(zhàn)爭已經(jīng)結(jié)束了,機(jī)會(huì)不會(huì)等待后知后覺的傲慢。”