1. 創(chuàng)業(yè)頭條
  2. 前沿領域
  3. 人工智能
  4. 正文

垂直行業(yè)大模型“封神”背后,AI數(shù)據(jù)服務走入“深水區(qū)”

 2023-09-26 13:33  來源:A5專欄  我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

文 | 智能相對論

作者 | 沈浪

由ChatGPT掀起的這股大模型浪潮,從通用領域席卷垂直領域?,F(xiàn)階段,越來越多的行業(yè)都在開發(fā)專用垂直細分賽道的大模型產品,以加速AI應用的場景化落地進程。

譬如,在電商領域,平臺和商家正在利用大模型重塑各個零售環(huán)節(jié)。如智能導購,可基于消費者的海量消費數(shù)據(jù)為其提供商品推薦、商品挑選攻略、行程建議等。同時,大模型還能理解海量商品的詳情數(shù)據(jù),快速生成電商運營需要的商品主圖、營銷海報、詳情頁等等。

除此之外,電商垂類大模型在智能客服、供應鏈優(yōu)化等場景上也都能基于海量數(shù)據(jù)的深度學習,快速掌握特定的售前售后話術、供應鏈訂單處理等,全方位革新電商領域的零售模式和消費體驗。

隨著應用成果的落地,垂直行業(yè)大模型的價值正在釋放,數(shù)字生產力持續(xù)提升。而作為人工智能三駕馬車之一的數(shù)據(jù)要素也在這個時刻被提上新的戰(zhàn)略高度——不難發(fā)現(xiàn),垂直行業(yè)大模型的價值釋放離不開海量數(shù)據(jù)的支持。

對應的,上游的AI數(shù)據(jù)服務商已經(jīng)針對數(shù)據(jù)層面提出了新的解決方案。在2023年中國國際服務貿易交易會期間,國內頭部AI數(shù)據(jù)服務廠商云測數(shù)據(jù)在去年發(fā)布的“AI工程化的數(shù)據(jù)解決方案”基礎上全面升級,重點面向垂直行業(yè)大模型提出了全生命周期的AI數(shù)據(jù)解決方案,為大模型應用落地提供關鍵支撐。

以大模型應用為支點,在大量市場場景需求的撬動下,人工智能產業(yè)鏈上下游的板塊正在迎來全新變革,數(shù)據(jù)層面的升級已經(jīng)躍然紙上。

大模型應用“封神”的背后,是什么樣的AI數(shù)據(jù)服務在支持?

大模型的爆發(fā)加速了人工智能的應用進程,同時也對整個算法產業(yè)鏈帶來了新的挑戰(zhàn)。在數(shù)據(jù)層面,過去生產數(shù)據(jù)、收集數(shù)據(jù)、加工數(shù)據(jù)、存儲數(shù)據(jù)等流程就不再適用當前的市場需求,或者說無法高效地、很好地解決新出現(xiàn)的問題。

下游的AI應用融入大模型技術進行全新升級,上游的AI數(shù)據(jù)服務也同樣面臨著變革。那么,什么樣的AI數(shù)據(jù)服務才是垂直行業(yè)大模型場景下需要的、適用的?

一、標準化

垂直行業(yè)大模型技術成果涌現(xiàn)的背后,對應是AI數(shù)據(jù)需求大幅增長。如何滿足大幅增長的場景化數(shù)據(jù)需求,首要不是盲目擴大數(shù)據(jù)生產,而是提高AI數(shù)據(jù)的通用性、易用性,也就是標準化的問題,避免AI數(shù)據(jù)服務做“無用功”,保證數(shù)據(jù)的真實、有效、易用是滿足垂直行業(yè)大模型爆發(fā)式增長需求的關鍵。

譬如,在智能網(wǎng)聯(lián)汽車行業(yè),《智能網(wǎng)聯(lián)汽車激光雷達點云數(shù)據(jù)標注要求及方法》(T/CSAE 213-2021)、《智能網(wǎng)聯(lián)汽車場景數(shù)據(jù)圖像標注要求與方法》(T/CSAE 212-2021)等團體標準的發(fā)布,就為智能網(wǎng)聯(lián)汽車的研發(fā)和測試提供了一套切實可行的場景數(shù)據(jù)點云標注方法,很好地推動了智能網(wǎng)聯(lián)汽車的研發(fā)和測試。

其中最直觀的感受則在于,過去AI數(shù)據(jù)服務行業(yè)各企業(yè)對圖像標注的要求與方法都各不相同,標注結果文件各異,嚴重影響后續(xù)數(shù)據(jù)的統(tǒng)一使用。隨著相關標準的發(fā)布,對標注流程和標注結果的保存形式都進行了規(guī)范,進而提升標注數(shù)據(jù)的通用性。

而在這個過程中,行業(yè)TOP地位的廠商往往都是標準的引領者,促使其在接下來的市場規(guī)范中獲得了更大的話語權和主動權。譬如,以上智能網(wǎng)聯(lián)汽車場景數(shù)據(jù)的兩大標準,背后都有云測數(shù)據(jù)的參與。

這家頭部AI數(shù)據(jù)服務商在參與標準制定,為行業(yè)攻陷自家經(jīng)驗和技術能力的同時,也更快、更好地掌握了數(shù)據(jù)標注相關場景的標準化,并應用到自家的產品和解決方案中。其中,基于對行業(yè)標準化的理解,云測數(shù)據(jù)發(fā)布的面向垂直行業(yè)大模型AI數(shù)據(jù)解決方案不僅能提供大規(guī)模感知數(shù)據(jù)能力,還能智駕企業(yè)減少數(shù)據(jù)采集周期,提升數(shù)據(jù)標注效率,降本增效,助力相關企業(yè)在數(shù)據(jù)層面實現(xiàn)研發(fā)領跑。

二、工程化

隨著大模型技術的融入,人工智能應用進程正持續(xù)加速,而在供給端,AI數(shù)據(jù)服務也面臨著數(shù)據(jù)生產、收集、處理、加工、存儲等全生命周期流程的升級,從而才能滿足AI數(shù)據(jù)的大幅度增長需求。簡單來說,對應AI工程化的大趨勢,AI數(shù)據(jù)服務也迎來了工程化的深度升級。

這里,云測數(shù)據(jù)發(fā)布的“面向垂直行業(yè)大模型AI數(shù)據(jù)解決方案”呈現(xiàn)出來的結果就是一條相對清晰的路徑——通過豐富的數(shù)據(jù)標注工具、成熟的API集成能力、高效的數(shù)據(jù)閉環(huán),加上人員管理及項目管理體系以及安全交付軟硬件支持的方式,云測數(shù)據(jù)在保證數(shù)據(jù)隱私安全的環(huán)境下,對垂直行業(yè)大模型所需的海量數(shù)據(jù)實現(xiàn)了全生命周期管理。

更直觀來說,對應AI數(shù)據(jù)服務的各個流程環(huán)節(jié),云測數(shù)據(jù)都能提供對應的工具、技術能力、管理體系,好似成熟的制造生產線一般,一步步地完成數(shù)據(jù)從無到有的生產,從粗糙到精細的加工等目標,以供下游的垂直行業(yè)大模型用于預訓練。

以基礎的數(shù)據(jù)標注為例,云測數(shù)據(jù)目前提供了相對全面的平臺工具模塊,包括了點云融合跟蹤、OCR文字轉寫、視頻標注、語音轉寫、語音切割、文本判斷、文本生成等等,充分滿足行業(yè)垂直大模型的多模態(tài)數(shù)據(jù)標注需求。

三、場景化

今年以來,市場的焦點從通用大模型轉向了垂直行業(yè)大模型,其背后是對技術應用落地的追求,同時也釋放了一個足以撬動整條人工智能產業(yè)鏈的趨勢——場景化。在AI數(shù)據(jù)服務領域,廠商不再盲目追求廣泛的海量數(shù)據(jù),而是針對某一特定領域或場景的有效數(shù)據(jù)。

場景的聚焦是加速垂直行業(yè)大模型落地的關鍵,同時也意味著更高要求的AI數(shù)據(jù)服務。以智能網(wǎng)聯(lián)汽車為例,云測數(shù)據(jù)為其提供的AI數(shù)據(jù)解決方案目前就包括三部分,分別為基礎數(shù)據(jù)庫、定制化數(shù)據(jù)采集和標注服務以及包括數(shù)據(jù)采集標注、數(shù)據(jù)管理的全方位數(shù)據(jù)工具鏈。

簡單來說,隨著場景化趨勢的發(fā)展,AI數(shù)據(jù)服務的定制化將越來越深入,不僅要針對某一特定行業(yè)或場景提供專業(yè)服務,還有可能聚焦某一公司或某一技術模塊提供高度定制化數(shù)據(jù)服務。

同時,基于場景化的AI數(shù)據(jù)需求也遠超常規(guī),隨著行業(yè)大模型的持續(xù)升級,場景的細分也會越來越精細,對應的數(shù)據(jù)需求更加嚴格。在與「智能相對論」的交流中,云測數(shù)據(jù)總經(jīng)理賈宇航就提到,在智能網(wǎng)聯(lián)汽車領域,為滿足相關場景的豐富性,云測數(shù)據(jù)可以需要提供包含數(shù)據(jù)采集、數(shù)據(jù)生產、平臺工具在內的AI數(shù)據(jù)服務,從而滿足相關大模型的預訓練需求。

總的來說,對應人工智能產業(yè)鏈上下游的關系,AI數(shù)據(jù)服務需要服務于垂直行業(yè)大模型的需求?,F(xiàn)階段,垂直行業(yè)大模型加速落地,需要更多、更有效、更精準的場景數(shù)據(jù),AI數(shù)據(jù)服務的升級有跡可循。

AI數(shù)據(jù)服務走入“深水區(qū)”,頭部廠商如何繼續(xù)保持引領?

市場趨勢的變化往往最先被行業(yè)TOP廠商所感知和反饋。在AI數(shù)據(jù)服務領域,云測數(shù)據(jù)提出“面向垂直行業(yè)大模型AI數(shù)據(jù)解決方案”,站在下半年垂直行業(yè)大模型進一步爆發(fā)的節(jié)點上將繼續(xù)引領AI數(shù)據(jù)服務行業(yè)。

那么,只是純粹的進場快,就能實現(xiàn)行業(yè)引領嗎?顯然不是。

結合垂直行業(yè)大模型發(fā)展的市場需求,云測數(shù)據(jù)的“面向垂直行業(yè)大模型AI數(shù)據(jù)解決方案”所呈現(xiàn)出來的更關鍵的價值在于其背后三大思維。

一、聚焦賽道,重視價值回歸

垂直行業(yè)大模型的爆發(fā)式增長讓“百模大戰(zhàn)”愈演愈烈,各行各業(yè)都在做相應的大模型產品,呈現(xiàn)出來的市場機會很多,但是對應的AI數(shù)據(jù)服務需求也在升級。這就意味著不能用通用思維來做垂直行業(yè)大模型的AI數(shù)據(jù)服務,也很難有能力把所有行業(yè)都覆蓋。

那么,在這個過程,廠商就需要有所取舍。目前,云測數(shù)據(jù)“面向垂直行業(yè)大模型AI數(shù)據(jù)服務解決方案”主要落地在零售電商、金融保險、智能網(wǎng)聯(lián)汽車等領域。而這些都是云測數(shù)據(jù)從創(chuàng)立之初就聚焦深耕的行業(yè),具備相應的數(shù)據(jù)積累、行業(yè)知識、項目經(jīng)驗以及客戶資源等。

在云測數(shù)據(jù)總經(jīng)理賈宇航看來,云測數(shù)據(jù)做垂直行業(yè)大模型的AI數(shù)據(jù)服務,首要的關鍵點是價值考量。

一方面,要做就先做有積累、有基礎的領域——基于這個思路,云測數(shù)據(jù)在提供場景化數(shù)據(jù)采集方案的同時,也會在微調任務后對應行業(yè)需求提供專業(yè)的評測體系和服務,讓AI數(shù)據(jù)服務更有價值。

另一方面,盡管垂直行業(yè)大模型很火,但商業(yè)化落地程度仍具有局限性。對于云測數(shù)據(jù)而言,結合過去的服務經(jīng)驗、項目經(jīng)驗篩選有市場需求的領域深耕,是對企業(yè)自身發(fā)展的負責,避免在過熱的市場環(huán)境中迷失自我,失去發(fā)展價值。

二、縱橫升級,強化基本功

垂直行業(yè)大模型應用落地是一個縱橫能力協(xié)同的過程。云測數(shù)據(jù)總經(jīng)理賈宇航將這一過程理解為“搭積木”,橫向強化底座能力,有一個穩(wěn)定的基礎,縱向深耕場景化,對應不同的行業(yè)進行微調、優(yōu)化,給出專業(yè)的解決方案。

具體來看,云測數(shù)據(jù)基于AI工程化的數(shù)據(jù)服務升級,在橫向上就構建了一套包括數(shù)據(jù)可視化、擴展工具模塊、數(shù)據(jù)權限管理體系等在內的AI數(shù)據(jù)服務解決方案,應對大模型預訓練本身所需要的數(shù)據(jù)需求。

縱向上則針對不同的場景,基于行業(yè)理解提供專精解決方案,比如對應智能網(wǎng)聯(lián)汽車研發(fā)與測試所需要的車外環(huán)境感知、車內智能座艙、人體動作識別等,滿足垂直行業(yè)大模型的進階需求。

三、堅守底線,規(guī)避行業(yè)敏感點

且不說數(shù)據(jù)領域本身就敏感,作為建立在海量數(shù)據(jù)之上的垂直行業(yè)大模型應用對數(shù)據(jù)的需求就非常嚴格,數(shù)據(jù)安全是一方面,數(shù)據(jù)的獨特性、權威性、有效性則是另一方面。

對此,云測數(shù)據(jù)作為行業(yè)TOP企業(yè)始終將數(shù)據(jù)隱私安全放在業(yè)務開展的首位。云測數(shù)據(jù)總經(jīng)理賈宇航表示,為了確保垂直行業(yè)大模型用于訓練的數(shù)據(jù)合法合規(guī),云測數(shù)據(jù)都會與企業(yè)客戶簽訂數(shù)據(jù)授權協(xié)議。同時,云測數(shù)據(jù)在過去多年的發(fā)展中也會建立具備自由版權的數(shù)據(jù)集,以幫助更多行業(yè)客戶去獲取更多的高質量數(shù)據(jù)。此外,云測數(shù)據(jù)更是一家滿足ISO27001和ISO27701標準的AI數(shù)據(jù)服務廠商,并先后獲得ISO9001、ISO20000、CMMI3等相關認證。

結語

AI數(shù)據(jù)作為生產資料,是推動整個AI行業(yè)發(fā)展的必要一環(huán),也是人工智能商業(yè)化的主要驅動力之一。換句話來說,高質量的數(shù)據(jù)決定了AI的落地程度也不為過。云測數(shù)據(jù)總經(jīng)理賈宇航曾提出類似的觀點。

而垂直行業(yè)大模型的爆發(fā)式增長,也就意味著AI數(shù)據(jù)需求的澎湃發(fā)展。圍繞高質量數(shù)據(jù)為需求,垂直行業(yè)大模型的落地才有真正意義的基礎。這是AI數(shù)據(jù)服務廠商的機會,也是人工智能產業(yè)突破發(fā)展的關鍵。

*本文圖片均來源于網(wǎng)絡

#智能相對論 Focusing on智能新產業(yè)新服務,這是智能的服務NO.239深度解讀

此內容為【智能相對論】原創(chuàng),

僅代表個人觀點,未經(jīng)授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。

部分圖片來自網(wǎng)絡,且未核實版權歸屬,不作為商業(yè)用途,如有侵犯,請作者與我們聯(lián)系。

•AI產業(yè)新媒體;

•澎湃新聞科技榜單月度top5;

•文章長期“霸占”鈦媒體熱門文章排行榜TOP10;

•著有《人工智能 十萬個為什么》

•【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫(yī)療、機器人、物聯(lián)網(wǎng)、AI+金融、AI+教育、AR/VR、云計算、開發(fā)者以及背后的芯片、算法等。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
大模型

相關文章

  • ChatGPT降溫背后:大模型發(fā)展迎來真正轉折點?

    作為目前AI領域的“神級產品”,ChatGPT的誕生,即吹響了AI革命的號角,隨后包括谷歌、微軟、Meta在內的國外科技公司,以及百度、華為、阿里、商湯科技、360、科大訊飛等在內的國內大廠,紛紛在短時間內推出了自家大模型產品。但這場空前繁榮能持續(xù)多久,始終是投資市場的一大關注點,尤其是近期網(wǎng)頁版C

    標簽:
    大模型
  • deepin官宣正式接入大模型,多款自研應用迎智能化升級

    今天我們向大家正式官宣deepin已實現(xiàn)大模型能力接入多款自研應用軟件實現(xiàn)智能化升級統(tǒng)信軟件高級副總經(jīng)理、CTO張磊表示:“目前UOSAI實現(xiàn)了國內外主流大模型的能力接入,并封裝成deepin的AI底層公共能力;同時,我們也將把UOSAI逐步開源給第三方應用,讓更多應用可以在deepin上直接調用大

    標簽:
    大模型
  • 云天勵飛李愛軍談大模型時代邊緣計算芯片突圍 新一代芯片閃耀全球AI芯片峰會

    9月14日至15日,智一科技旗下芯東西與智猩猩聯(lián)合主辦的2023全球AI芯片峰會(GACS2023)在深圳市南山區(qū)舉行。云天勵飛副總裁、芯片業(yè)務線總經(jīng)理李愛軍出席峰會并發(fā)表演講。李愛軍在演講中提到,全球邊緣計算市場規(guī)模在不斷擴大,但邊緣計算場景仍面臨著場景眾多、算力需求碎片化、芯片平臺種類多、商業(yè)閉

    標簽:
    大模型
  • “創(chuàng)造市場”與“算法進化”,中美AI競速的岔路口

    “人工智能的商業(yè)模式,是要創(chuàng)造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當前的全球AI市場,占據(jù)主導地位的中美雙方,卻也走出了兩條截然不同的技術路徑,前者執(zhí)著于前沿技術的探索,后者則發(fā)力應用優(yōu)化和商業(yè)化落地。南轅北轍的兩個方向,或許已經(jīng)無法直接進行排位先后、優(yōu)

    標簽:
    ai智能
  • 智能體進化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

    智能體進化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實在智能最新發(fā)布的實在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款AIAgent真的實現(xiàn)了流程全自動化AIAgent構建到執(zhí)行全自動化,持續(xù)進化RPAAgent再次降低智能體應用門檻實在智能重磅發(fā)布實

  • 崔大寶:大模型降溫背后的難點、卡點、節(jié)點

    崔大寶|節(jié)點財經(jīng)創(chuàng)始人進入2024年,大模型似乎有熄火之勢:資本市場,與之關聯(lián)的概念炒不動了,英偉達股價動輒暴跌重挫,引發(fā)“泡沫戳破”的擔憂;消費市場,BATH們的推新活動少了,產品更新迭代的速度慢了,民眾的關注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動宣布“以厘計費”,打響國內大模型

    標簽:
    大模型
  • 這一屆“出道”的數(shù)字人,已經(jīng)拿捧上了“鐵飯碗”

    文|智能相對論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個數(shù)字人。圖片來源網(wǎng)絡隨著數(shù)字人技術的突破,越來越多的傳統(tǒng)企業(yè)和機構開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄

    標簽:
    數(shù)字人
  • 來到IPO關口,地平線離“三分天下”還有多遠?

    黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關注。據(jù)悉,近日地平線已通過中國證監(jiān)會IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預計籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動駕駛(AD)解決方案供

  • 機器人大會引領產業(yè)動向,卓翼飛思繪制無人系統(tǒng)教科研新藍圖

    8月21日,萬眾矚目的2024世界機器人大會暨博覽會在北京亦創(chuàng)國際會展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機器人盛會,反映了當下機器人領域的繁榮生態(tài)。據(jù)官方統(tǒng)計數(shù)據(jù),今年現(xiàn)場逛展觀眾高達25萬人次,比去年增加25%。機器人行業(yè)有多火?看看2024世界機器人大會火爆程度便可知

  • 卓翼智能:超大載重高烈度環(huán)境特種智能系留無人平臺的應用與未來

    瞄準場景需求,打造國內領先的自主可控、高質量超大載重高烈度環(huán)境特種智能系留無人平臺。卓翼智能亮相HICOOL峰會以科技實力榮摘創(chuàng)業(yè)大賽一等獎這個比賽5年培育出16家“獨角獸”HICOOL2024全球創(chuàng)業(yè)者峰會暨創(chuàng)業(yè)大賽已于8月25日在北京圓滿落下帷幕,大賽共吸引了124個國家和地區(qū)的7406個創(chuàng)業(yè)項

  • 60萬獎金召喚AI創(chuàng)新者,2024無錫國際人工智能創(chuàng)新應用大賽火熱進行中!

    人工智能是新一輪科技革命和產業(yè)變革的重要驅動力量。無錫市作為中國的科技創(chuàng)新中心之一,正通過構建人工智能"算力+算法+數(shù)據(jù)"三要素齊備的產業(yè)生態(tài),為產業(yè)技術創(chuàng)新應用提供強大支撐,通過“AI+”行動推動人工智能與多個產業(yè)交叉融合,實現(xiàn)技術落地和產業(yè)化,加速形成新質生產力,打造具有國際競爭力的產業(yè)創(chuàng)新智造

  • “云+AI”驅動操作系統(tǒng)創(chuàng)新升級,龍蜥堅持可持續(xù)發(fā)展路線

    近日,2024龍蜥操作系統(tǒng)大會(OpenAnolisConference)在北京圓滿召開,此次大會由中國計算機學會開源發(fā)展委員會、中關村科學城委員會、海淀區(qū)委網(wǎng)信辦、中國開源軟件推進聯(lián)盟指導,龍蜥社區(qū)主辦,阿里云、浪潮信息、Intel、中興通訊、Arm、中科方德等24家理事單位共同承辦,主題為“進化