中文字幕乱码亚洲无线码在线_亚洲Aⅴ一区二区_亚洲久悠悠色悠在线播_亚洲成AV人片在线观看WW_国产精品久久久久久久久久98

騰訊靠什么突圍“百模大戰(zhàn)”?
來源:BT財經     時間:2023-07-12 08:38:20

大模型的“百模大戰(zhàn)”,騰訊終于下場。

從6月19日發(fā)布自己的行業(yè)大模型,到7月16日召開的世界人工智能大會,騰訊云行業(yè)大模型率先登場,越來越清晰的事實背后,凸顯著騰訊對于大模型領域的思考。


(資料圖片)

尤其是跟BAT其他兩家的選擇不同,騰訊上來首先端出的是行業(yè)大模型,而不是通用大模型。這意味著騰訊其實找到了在這個領域放大自身優(yōu)勢的方式。

因為是國內互聯(lián)網企業(yè)最早點出要推動數字融合,推進產業(yè)互聯(lián)網發(fā)展的平臺,騰訊從一開始接觸到大模型,想到的就是如何與產業(yè)相結合。

關鍵,讓人意想不到的是,秉持這個邏輯下場,騰訊其實直奔解決大模型研發(fā)方一直糾結的一個問題:那就是大模型該如何保證長期可持續(xù)發(fā)展。

只有做到這一點,任何大模型才能談得上有未來。

大模型是用來解決問題的

騰訊集團高級執(zhí)行副總裁、云與智慧產業(yè)事業(yè)群CEO湯道生,在世界互聯(lián)網大會產業(yè)發(fā)展論壇做主題演講時表示,通用大模型有很強的能力,但并不能解決很多企業(yè)的具體問題?!捌髽I(yè)的大模型應用需要綜合考慮行業(yè)專業(yè)性、數據安全、持續(xù)迭代和綜合成本等因素。基于行業(yè)大模型,構建自己的專屬模型,也許是企業(yè)更優(yōu)的選項”。

這恰恰說出了當下大模型產業(yè)發(fā)展的一個現(xiàn)實。

從Open AI發(fā)布ChatGPT3.5開始,浮躁成為這個行業(yè)的外顯標簽之一。越來越多的企業(yè)開始在這個領域炫技。

高峰時期,美國硅谷每天會產生幾十個大模型相關的論文,上百個與大模型相關的創(chuàng)業(yè)產品DEMO視頻?!懊總€視頻讓人看得血脈賁張,我們紛紛表示太酷炫了,但是靜下心來,我們對于技術該怎么用一般都沒有答案?!贝竽P椭芯空?,計算機工程碩士李莉認為,現(xiàn)在很多模型的研究者和應用的制作者,考慮的是如何讓別人記住自己,所以效果特別視覺化。“如果真正放到經濟中,你會發(fā)現(xiàn)根本用不上?!?/p>

在她看來,這已成為行業(yè)通病。

同樣國內大模型的紛至沓來,相關的事情也沒少做。例如讓大模型直接作詩或者用方言將相關的內容讀出來,甚至做成視頻之類,頻繁出現(xiàn)在模型研發(fā)方發(fā)布會的現(xiàn)場。

這其實是一種市場推廣行為,但并不意味著大模型真正要在這個方面實現(xiàn)應用。

最近Newsweek有一個商業(yè)調查顯示,ChatGPT的用戶數量已經比一二月份高峰時期下降了近95%。在統(tǒng)計原因中,“感覺ChatGPT對工作的促進能力沒有想象那么強”,是用戶選擇最多的一個結果。

“從技術看這個是一個特別正常的結果”,李莉表示類似ChatGPT這樣的通用大模式,其訓練數據來自互聯(lián)網所有能找到的相關數據,無論對錯全部輸給模型學習,只在輸出的時候由人工來核實部分結果并標注結果輸出的邊界?!耙虼?,通用大模型往往變成那種看起來像專家的答案,但真正被行業(yè)內人士分析就發(fā)現(xiàn)似是而非?!?/p>

在她看來,未來大模型發(fā)展最快的肯定不是ChatGpt這類通用模型,“產業(yè)模型或者細分行業(yè)模型有很大機會,因為只有在專業(yè)領域由專業(yè)的人員輔助大模型學習專業(yè)知識,才能真正為行業(yè)提供需要的人工智能輔助”。

對此,騰訊集團高級執(zhí)行副總裁、云與智慧產業(yè)事業(yè)群CEO湯道生也表示,通用大模型一般是基于廣泛的公開文獻與網絡信息來訓練的,許多專業(yè)知識與行業(yè)數據積累不足,導致回答的行業(yè)針對性與精準度不夠。“通用大模型可以在100個場景中,解決70%-80%的問題,但未必能100%滿足企業(yè)某個場景的需求?!钡脩魧ζ髽I(yè)提供的專業(yè)服務,要求高、容錯性低,企業(yè)一旦向公眾提供了錯誤信息,可能引起嚴重后果。

TO B才是大模型未來發(fā)展核心

其實ChatGPT也不是沒想過要進入行業(yè)應用市場,但在理想與現(xiàn)實之間有了一個巨大的鴻溝。

眾所周知,通用大模型是利用互聯(lián)網知識進行培訓的,即所謂通用數據。其中既要花費大量的數據和資金進行訓練,可能效果還不是很好;另一方面又要維持日常運營,相關投入也非常大,讓一般的通用大模型壓力很大。

OpenAI的創(chuàng)始人在接受硅谷媒體的訪談時,也曾就ChatGPT3.5的邏輯和思維展現(xiàn)能力進行過闡述,然而他并不清楚ChatGPT3.5是如何實現(xiàn)這一功能的。事實上,他們在訓練ChatGPT的過程中,一直在不斷地將微軟必應搜索中的結果和用戶的對話數據輸入其中。

在訪談的最后,他也承認ChatGPT的出現(xiàn)只是一個美麗的誤會,但他們所能做的就是不斷為這樣的大模型提供資源,無論是軟件還是硬件都在此列。據觀看了這場訪談的李莉了解,OpenAI在短短三年內就已經燒掉了180億美元,現(xiàn)在又緊急融資了100億美元。這一事實恰恰印證了這一點。

但由于他們在行業(yè)上數據搜集能力不強,造成通用模型對于行業(yè)應用適用程度較低,沒有想象的好用。

另一方面,自2018年騰訊啟動930變革以來,中美互聯(lián)網技術的發(fā)展出現(xiàn)了明顯的路線差異。

各家互聯(lián)網企業(yè)以數實融合為開發(fā)產品和技術的基本思路,這體現(xiàn)了中國互聯(lián)網企業(yè)在滿足制造業(yè)和實際生產需求方面更為緊密的聯(lián)系。

從這一角度來看,中國互聯(lián)網企業(yè)將在推動社會經濟發(fā)展方面具有更清晰明確的角色。

有趣的是,大模型的成長和訓練需要大量數據的支持。ChatGPT和谷歌Bard等領先的模型都是在通用大模型領域進行訓練的,它們的背后都有搜索引擎帶來的龐大數據支持。然而,盡管這些數據量龐大,但在特定行業(yè)的數據量和數據活躍度上,尚未完全滿足用戶的需求。

這實際上為中國企業(yè)提供了彎道超車的機會。中國龐大的人口基數使其在各個行業(yè)擁有比美國甚至世界其他國家更豐富的數據積累。無論是醫(yī)療、法律、物流還是細分行業(yè)的生產。在國家數據安全法的指導下,這些數據天然地與海外大模型隔離,保證了數據安全。

因此,這些B端數據被認為是中國大模型企業(yè)的巨大優(yōu)勢。

比如,中國已榮升為全球最大的工業(yè)機器人生產國和消費國,全球機器人市場中的75%是由中國的企業(yè)所購買。這些購買機器人的企業(yè),通常都將其機器人應用于核心工藝和核心流程中。

這一現(xiàn)象意味著,如果這些企業(yè)希望通過引入人工智能模型以提高管理效率,它們就必須部署自己的私有人工智能模型。他們需要通過訓練自己生產中的數據,以滿足企業(yè)的發(fā)展需求。

如果能從中國一線企業(yè)采集到絕大多數機器人使用的參數和對應的數據,就能以最快的速度幫助這些企業(yè)建立和訓練屬于自己的人工智能模型。

在這一點上,中國企業(yè)具有天然的優(yōu)勢。

為什么是騰訊先落子

專屬行業(yè)大模型,目前國內騰訊是首先落子的領軍者之一。

在所有人都開始關注行業(yè)大模型的時候,在百度、阿里、科大訊飛等國內大模型開發(fā)方都開始轉型行業(yè)大模型的時候,為什么騰訊能最先發(fā)布自己的行業(yè)大模型呢?

這可能跟騰訊在國內率先提出互聯(lián)網平臺要跟產業(yè)相結合有關。

一方面,這幾年騰訊利用互聯(lián)網技術和AI技術,在實體經濟和生產一線做了很多嘗試,推動了很多新模式的落地,這已經成為中國數實融合的樣板。騰訊在其中積累了很多面對行業(yè)企業(yè)的服務經驗和數據,同時也對行業(yè)企業(yè)的需求非常清楚,這為其建立行業(yè)大模型提供了良好的基礎。

另一方面,騰訊專門為行業(yè)大模型打造了自己的技術平臺。

這里面首先是星脈網絡,這是騰訊云正式發(fā)布新一代HCC高性能計算集群。該集群采用騰訊云星星海自研服務器,服務器之間采用業(yè)界最高的3.2T超高互聯(lián)帶寬,為大模型訓練、自動駕駛、科學計算等提供高性能、高帶寬和低延遲的集群算力。實測顯示,騰訊云新一代集群的算力性能較前代提升高達3倍,是國內性能最強的大模型計算集群。

其次是騰訊云專門為行業(yè)大模型打造的AI 原生(AI Native)向量數據庫。該數據庫能夠被廣泛應用于大模型的訓練、推理和知識庫補充等場景,是國內首個從接入層、計算層、到存儲層提供全生命周期AI化的向量數據庫。

正是有了這樣的技術基礎,加上騰訊這些年服務行業(yè)客戶的經驗和獲得的數據,讓騰訊有了率先推出行業(yè)大模型的底氣。

騰訊云副總裁、騰訊云智能負責人、優(yōu)圖實驗室負責人吳運聲在人工智能大會期間接受媒體專訪時表示,騰訊希望在每個特定場景里面100%解決客戶的問題,“而不是找100個產品解決70%到80%的問題”。

在他看來,騰訊會聚焦找一些特定的行業(yè)跟客戶深入打磨解決行業(yè)的問題,“比如說文旅行業(yè)跟客戶做一些深入探討,比如說OTA領域的客戶在業(yè)務流程里面用大模型的技術,結合自身的業(yè)務場景,還有數據相關的東西對大模型進行精調,解決他的問題”。

關鍵,騰訊云從產業(yè)客戶需求場景出發(fā),基于大模型高性能計算集群,依托騰訊云TI平臺打造模型精選商店,為客戶提供MaaS一站式服務和“量體裁衣、普惠適用”的行業(yè)模型解決方案,全面降低落地門檻,助力客戶構建專屬大模型及智能應用。

騰訊云TI平臺行業(yè)精調解決方案,支持客戶用自己的數據一站式訓練精調,構建自己的專屬大模型。具備五大優(yōu)勢:提供高質量的行業(yè)大模型、完善的平臺工具、成熟的流程服務、全面的配套服務、領先的安全能力保障。

比如騰訊云升級行業(yè)大模型應用場景,行業(yè)大模型加持的金融風控解決方案,相比之前有了10倍效率提升。騰訊云風控大模型融合了騰訊過去20多年黑灰產對抗經驗,和上千個真實業(yè)務場景,整體反欺詐效果比傳統(tǒng)模式有20%左右的提升。企業(yè)可以基于prompt模式,迭代風控能力,從樣本收集、模型訓練到部署上線,實現(xiàn)全流程零人工參與,建模時間也從2周減少到僅需2天。

再比如過去的同傳技術,往往需要大量樣本數據進行訓練,尤其涉及一些特別專業(yè)領域的翻譯,也需要人工加持進行調優(yōu),才能保障翻譯效果?;谛袠I(yè)大模型技術,不再需要百萬級的訓練數據,使用小樣本訓練便也可以獲得不錯的翻譯結果,讓每一次交互翻譯,都對下句的翻譯提升發(fā)揮實時作用……

換句話說,騰訊既準備好自己的技術基礎,又有行業(yè)數據知道行業(yè)想要什么,還做了一整套幫助企業(yè)落地大模型在自身業(yè)務應用的產品,形成了一整套推動大模型行業(yè)化的能力。

當然,騰訊對行業(yè)大模型是持開放態(tài)度的,他們覺得大模型是需要多分共同努力的結果。吳運聲就表示,大模型時代開放是非常重要的一個特點,“底層的技術變化太快,技術的這些外延的能力會非常廣,這種情況下發(fā)揮最大的價值只有開放,通過開放提升讓更多人加入進來,更多行業(yè)的專家,各類的角色人員加入進來,我們才能讓這個生態(tài),整個體系更加的健康,產生更多的可能性”。

對此,騰訊集團高級執(zhí)行副總裁、云與智慧產業(yè)事業(yè)群CEO湯道生也認為,伴隨著大語言模型的發(fā)展,產業(yè)和社會也將從數字化、網絡化,走向智能化?!霸谶@個過程中,騰訊始終認為,人工智能發(fā)展的根本目標是落地于產業(yè),服務于人”。

因為,只有能真正解決用戶需求、距離場景和數據更近的企業(yè),才能擁有大模型的未來。

文丨BT財經張津京

關鍵詞: