當前位置:首頁 >  IDC >  云計算 >  正文

基調聽云:應云而生,可觀測性的用武之地才剛剛開始

 2022-12-02 15:56  來源: 互聯(lián)網(wǎng)   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

2021 年下旬,有關可觀測性的研討如雨后春筍般層出不窮,在解讀 CNCF 云原生計算基金會 2021 年度云原生調查時,CNCF 執(zhí)行董事 Priyanka Sharma 曾表示:“隨著容器基礎設施的上層和底層不斷成熟,2022年將成為邊緣、可觀測性和安全等新興云原生領域的標志性一年。”

當前傳統(tǒng)監(jiān)控體系所面臨的諸多局限真的能夠通過可觀測性解決嗎?企業(yè)又該如何構建適配自身的可觀測性體系?

可觀測性“火熱出圈”

“可觀測性”并不是一個新詞,其概念最早由現(xiàn)代控制理論之父 Rudolf Kalman 提出:“如果對于狀態(tài)和控制向量的任何可能演變,僅使用輸出的信息就可以估計當前狀態(tài),則稱系統(tǒng)是可觀測的。”

那為什么近年來可觀測性的熱度不斷飆升,一度火熱出圈呢?

主要原因在于云原生時代下,系統(tǒng)復雜性的逐步增強。數(shù)字化浪潮推動,企業(yè) IT 業(yè)務開始向云上遷移,為提高遷移效率、運行效率以及服務的靈活性,企業(yè)大多會采用多云/混合云架構,這將大大增加 IT 模型的復雜性。

過去簡單、變更不頻繁的單體式架構可以使用監(jiān)控查看系統(tǒng)運行狀態(tài),但隨著分布式架構、云原生架構的變遷,越來越多的新訴求開始逐步顯現(xiàn)。

用戶體驗和應用比以往任何時候都重要, 企業(yè)依賴于體系化的 IT 系統(tǒng)來實現(xiàn)增長。

數(shù)字化轉型過程中,應用的數(shù)量、數(shù)據(jù)的體量、變化的頻率和增加的速度,都已經(jīng)遠遠超越了僅通過固定儀表盤就可以管理復雜 IT 系統(tǒng)的能力。

多云/混合云的部署模式都是容器化且動態(tài)變化的, 容器創(chuàng)建的速度和規(guī)模及其生命周期,已超出數(shù)據(jù)中心時代管理邊界。

多種多樣的開發(fā)語言、運行時以及當前采用的支持軟件和數(shù)據(jù)庫等,都已經(jīng)超越了IT從業(yè)者的溝通界面,單獨的溝通形式難以滿足開發(fā)者之間的溝通需求。

企業(yè)資源是有限的, 不斷增加的系統(tǒng)復雜性、故障排查難度正在竊取企業(yè)的創(chuàng)新時間,消耗 IT 從業(yè)者的時間。

點亮監(jiān)控變革信號燈

企業(yè)上云或服務改造的過程中,通常會引入大量新興工具,服務業(yè)務爆炸性增長。云、微服務及容器的使用,將會對 IT 運維及數(shù)字化轉型帶來巨大挑戰(zhàn)。顯然,開源集成或傳統(tǒng)監(jiān)控工具的管理方式已不合時宜,難以助力企業(yè)的數(shù)字化轉型。

每位用戶每一秒的體驗都非常重要,APM采樣方法無法做到全面、全量監(jiān)控。

微服務快速更新的需求會使得監(jiān)控的對象和指標量呈指數(shù)級增長, 傳統(tǒng)方式難以實現(xiàn)海量數(shù)據(jù)的采集和分析。

相比傳統(tǒng)監(jiān)控,可觀測性的側重點不同。 傳統(tǒng)監(jiān)控是對被監(jiān)控設施所進行的明確的、可預測的審視和度量,是為了提高系統(tǒng)可觀測性而使用的手段,注重現(xiàn)實狀態(tài)的變化。而可觀測性是一種方法,通過檢查系統(tǒng)的外部輸出衡量系統(tǒng)內部狀態(tài)的能力,也是系統(tǒng)的核心能力。

因此,Gartner認證的應用性能管理(APM)解決方案提供商基調聽云認為,可觀測性是 IT 建設過程中的必要手段。 在開發(fā)與維護的生命周期中,都應具備可觀測性能力,動態(tài)高效地定位并解決突發(fā)性問題,在系統(tǒng)不可用時,快速了解問題現(xiàn)狀及原因,有效預防故障發(fā)生,而不是簡單地降級限流。

可觀測性構建的正確打開方式

既然可觀測性相比傳統(tǒng)監(jiān)控體系具有諸多優(yōu)勢和價值,那么該如何構建呢?首先需要了解一個優(yōu)秀的可觀測性平臺應具備什么樣的能力:

全面、全量的數(shù)據(jù)采集能力,擴大數(shù)據(jù)采集的廣度、深度及數(shù)量;

通過自動化技術實現(xiàn)數(shù)據(jù)采集的可伸縮和完整性;

高基分析的能力;

超大規(guī)模實時計算能力;

多源集成能力;

基于AI和確定性因果關系的根因分析能力;

業(yè)務實時洞察能力。

基調聽云智能業(yè)務可觀測性平臺

不同企業(yè)訴求不同,又該如何快速構建適合自身業(yè)務系統(tǒng)的可觀測性呢? 以基調聽云可觀測性平臺的發(fā)展為例,構建完備的可觀測性平臺可以分三步走。

融匯:以用戶體驗和業(yè)務為中心,夯實數(shù)據(jù)基礎

全面豐富的數(shù)據(jù)是一切分析工具及決策的來源,盡可能收集基礎數(shù)據(jù)將有利于后續(xù)分析,否則當系統(tǒng)故障需要排查分析時,將難以有效評估當時的狀態(tài)。

為完善技術??捎^測性數(shù)據(jù)的采集能力,基調聽云以Tracing為核心,全面采集APP、Web、小程序及系統(tǒng)應用的指標數(shù)據(jù),以業(yè)務承載關系采集主機、云原生組件、數(shù)據(jù)庫、信息隊列指標數(shù)據(jù)。

融合撥測平臺(STM)主動采集可觀測性數(shù)據(jù);

OneSDK / OneJS 采集集DEM終端的性能,會話和行為可觀測數(shù)據(jù);

一體化 Agent 采集后端應用性能、基礎組件及日志數(shù)據(jù),覆蓋從業(yè)務層、應用層到云原生基礎資源層全量可觀測數(shù)據(jù)采集;

支持 OpenTelemetry,第三方 APM 數(shù)據(jù)接入,指標體系基于 OpenMetrics 實現(xiàn)廣泛第三方可觀測性指標及元數(shù)據(jù)的接入。

融通:注重數(shù)據(jù)的治理與應用,數(shù)據(jù)關聯(lián)豐富化

眾所周知,傳統(tǒng)意義上可觀測性有三大支柱:Metrics 、Logging、Tracing,但割裂、無關聯(lián)的數(shù)據(jù)會對數(shù)據(jù)檢索帶來嚴峻的挑戰(zhàn),更難進一步定位根因。

基調聽云將用戶體驗、Metrics 、Logging、Tracing為可觀測性的四大支柱,重點關注用戶體驗數(shù)據(jù),以Tracing為核心,連通Mertrics、Logs 數(shù)據(jù),實現(xiàn)數(shù)據(jù)間的關聯(lián)分析、統(tǒng)一建模與轉化關聯(lián),做到問題的精準定位與數(shù)據(jù)的精準檢索,有效解決傳統(tǒng)監(jiān)控的數(shù)據(jù)孤島問題。

以 Tracing 為核心融合可觀測性三大支柱

此外,基調聽云通過實時的業(yè)務洞察、業(yè)務影響及流程分析,實現(xiàn)性能數(shù)據(jù)與客戶業(yè)務數(shù)據(jù)的有機結合, 讓 IT 和業(yè)務在同一套平臺下協(xié)作,這也是基調聽云可觀測性平臺的核心競爭力之一。

如上圖所示,通過指標與 Tracing 的結合可以對 VIP 用戶進行識別,設置 VIP 用戶的業(yè)務性能閾值,最終實現(xiàn) VIP 用戶的告警和體驗保障。

融智:多元數(shù)據(jù)整合,增強數(shù)據(jù)應用能力及可觀測性

智能化技術在可觀測性數(shù)據(jù)分析中的作用不可或缺,可觀測性的數(shù)據(jù)只有被關聯(lián)起來一起分析時才能發(fā)揮出它們最大的價值,但可觀測性的數(shù)據(jù)是海量的,只靠人力分析、運維很難全面考慮,而人工智能算法是當前處理海量數(shù)據(jù)最有希望的方法。

此外,智能化技術在云原生系統(tǒng)運維中還將作為可觀測性的重要補充,發(fā)揮不可替代的作用,通過引入 AI 算法模型和機器學習,整合原有數(shù)據(jù),可以進一步增強可觀測能力,如使用 AI 進行容量預測,提前發(fā)現(xiàn)系統(tǒng)性能容量瓶頸,實現(xiàn)故障發(fā)現(xiàn)與預防。

智能故障管理

可觀測性體系的實踐案例

案例一:常見場景之客戶投訴

任何行業(yè)都有可能遇到客戶投訴的場景,面對客戶投訴,在使用可觀測性平臺的情況下,只需知道一個用戶標識即可輕松查詢相關信息。

相較傳統(tǒng)監(jiān)控將信息傳給運維部門,再由研發(fā)人員檢索日志的方式,使用可觀測性平臺能夠大大提升檢索效率,減少時間成本。此外,除了快速響應客戶投訴解決問題外,還能夠通過對投訴時間段內所觀測信息的分析復盤,挖掘深層次的原因并掌握故障的影響范圍。

案例二:某大型銀行可觀測性實踐

隨著應用系統(tǒng)架構由傳統(tǒng)向新的架構平臺轉換,硬件架構由獨立服務器向虛擬資源池、容器環(huán)境轉換,某大型銀行面臨監(jiān)控數(shù)據(jù)割裂,缺乏端到端應用性能觀測手段、用戶體驗觀測手段亟待建設等諸多業(yè)務挑戰(zhàn)。

如上圖所示,融合基調聽云SDK、SkyWalking和 OpenTelemetry 的調用連數(shù)據(jù),通過抽取鏈路指標、關聯(lián)日志,實現(xiàn)可觀測數(shù)據(jù)的關聯(lián)融合。通過UserId及 TraceId的關聯(lián),實現(xiàn)端到端的交易全鏈路問題追溯;通過基于真實用戶的用戶旅途,還原用戶會話行為;通過異常檢測、相關性分析和根因分析,實現(xiàn)IT系統(tǒng)問題的根因定位。

案例三:某運營商可觀測性建設

面對運營商缺少統(tǒng)一的DevOps監(jiān)控工具、缺乏全鏈路調用追蹤和故障異??焖俜治鍪侄?、難以保障重大體育賽事直播等種種業(yè)務挑戰(zhàn),基調聽云從容迎戰(zhàn)。

通過基調聽云智能可觀測性平臺,將聽云APM監(jiān)控、Zabbix基礎監(jiān)控、日志易日志監(jiān)控有機集合,實現(xiàn)一體化可觀測平臺。

最終該運營商從容地支撐了高達70萬tps的業(yè)務峰值,在國家級奧運盛事的直播期間,經(jīng)第三方中立機構評測,用戶體驗性能得分第一。

案例四:某頭部城商行可觀測性一體化平臺建設

某銀行隨著信息科技系統(tǒng)架構日趨復雜、 客戶人數(shù)急劇增長,對需求快速交付,系統(tǒng)的穩(wěn)定性、高效性、服務水平等方面都提出了更高的要求。

針對該銀行對實現(xiàn)管理對象統(tǒng)一調度、數(shù)據(jù)統(tǒng)一加工、工具統(tǒng)一治理,以及統(tǒng)一采控、統(tǒng)一數(shù)據(jù)、工具打通,優(yōu)先解決故障告警分析的需求,基調聽云從多個方面助力改造:

通過可觀測性一體化平臺對接已有各專業(yè)運維工具,形成一體化的智能運維平臺,提升系統(tǒng)運行狀態(tài)感知能力,問題分析定位,應急處置能力,并提供統(tǒng)一運維門口,提升運維效率和業(yè)務連續(xù)性服務水平;

通過可觀測性一體化平臺構建智能運維大數(shù)據(jù)平臺,提供運維管理數(shù)據(jù)加工,指標體系計算能力,性能容量分析能力,業(yè)務系統(tǒng)健康度分析能力,智能告警分析能力;

通過可觀測性一體化平臺建設以用戶旅程為抓手的業(yè)務體驗端到端可觀測體系,為提升用戶體驗、系統(tǒng)健壯性提供支撐。

可觀測性的用武之地才剛剛開始

龐大的數(shù)據(jù)量,系統(tǒng)架構的演化,讓容器、數(shù)據(jù)之間的關系變得錯綜復雜,故障排查棘手,此時打造具備可觀測性的系統(tǒng)成為應對之策。

可觀測性是云原生時代下能夠聯(lián)動 IT 與業(yè)務的能力,它本質上符合云原生環(huán)境以業(yè)務應用為核心的趨勢。從監(jiān)控到可觀測性的發(fā)展,拓寬了傳統(tǒng)監(jiān)控的能力邊界,打破了傳統(tǒng)被動監(jiān)控方式,形成了主動、全局式的統(tǒng)一智能觀測能力,更有利地幫助我們掌握系統(tǒng)健康程度。

未來,隨著云原生的快速發(fā)展,可觀測性的發(fā)展?jié)摿薮?,其用武之地才剛剛開始。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
云計算
云服務

相關文章

  • 強強聯(lián)合!百望云入駐微軟實驗室,揭開數(shù)智發(fā)展新篇章!

    OpenAI是什么,隨著ChatGPT的爆火,相信大家都并不陌生了。而微軟也第一時間推出了AzureOpenAI加速計劃,希望憑借OpenAI的卓越能力,為企業(yè)賦能,幫助越來越多的企業(yè)將AI大模型的基礎能力,與企業(yè)場景相結合,開拓新的商業(yè)范式,引領行業(yè)變革。近日,以“智領新變共創(chuàng)未來”為主題的“微軟

    標簽:
    云服務
  • 新成果、新服務、新生態(tài),HPE混合云領導者地位再提升!

    HPE擴大混合云和私有云產(chǎn)品的覆蓋范圍、靈活選項和創(chuàng)新功能,領導者地位再提升!HPEDiscover科技盛會上,HPE宣布了HPEGreenLake邊緣到云平臺、混合云服務、私有云產(chǎn)品組合的創(chuàng)新成果,以及合作伙伴生態(tài)系統(tǒng)的最新進展:·HPE完成對OpsRamp公司的收購;相關解決方案現(xiàn)已作為HPEG

    標簽:
    云服務
  • 權威發(fā)布!白山云連續(xù)入選IDC邊緣云報告

    近日,國際權威研究機構IDC發(fā)布《中國邊緣云市場跟蹤研究,2022H2》報告。作為創(chuàng)新的全球邊緣云服務提供商,白山云得到IDC的持續(xù)關注與認可,憑借在邊緣云領域的技術突破、產(chǎn)品迭代以及場景實踐,再度入選報告,與行業(yè)伙伴一同撐起邊緣云市場的巨大價值空間。IDC指出,在服務商與客戶需求的共同推動下,邊緣

    標簽:
    云服務
  • 帶來高?;旌显平ㄔO方案,青云科技滿足教育、教學、教管等場景需求

    隨著教育信息化2.0進程加快,教育部等六部門提出“推進教育新型基礎設施建設,構建高質量教育支撐體系”,建設智慧校園成為各大高校重點布局方向。但因為傳統(tǒng)豎井式建設模式,導致高校信息系統(tǒng)龐大,現(xiàn)有信息化程度較低,IT資源碎片化,資源統(tǒng)一管控難度大等一系列問題,使得智慧校園建設步履維艱,各大高校亟需找到突

    標簽:
    云服務
  • 多功能升級、超值優(yōu)惠!KubeSphere Cloud加速企業(yè)云原生應用落地

    5月份,青云科技(qingcloud.com,股票代碼:688316)推出的KubeSphereCloud云原生應用服務平臺實現(xiàn)了眾多功能升級,并為用戶提供眾多優(yōu)惠活動,加速企業(yè)落地云原生。詳情如下:功能升級集群巡檢服務支持配置定時巡檢策略隨著企業(yè)核心業(yè)務環(huán)境安全事故的頻發(fā),周期性完成集群健康巡檢任

    標簽:
    云服務

熱門排行

信息推薦