數是指大數據,智是值AI、機器學習。在早期的發展階段,數和智是兩條平行線,而隨著技術的迭代法治,二者逐漸靠近并扭作一團,數與智的融合也將成為企業加速創新的引擎。
近期,亞馬遜云科技就舉辦了“云領數智融合 重塑創新引領” 大數據與機器學習媒體溝通會。會上亞馬遜云科技大中華區產品部總經理陳曉建等人分享了亞馬遜云科技是如何助力企業實現云上創新,并進行“數智融合”的。
如今,越來越多的企業已經認識到,數據早已成為與勞動力、資本等同等重要的要素資源,甚至在未來的競爭環境中,能對數據進行積累、擁有更多的數據量并以此進行分析,將成為一種必備技能。不過,數據的價值目前還沒有得到充分的利用。
根據福布斯發布的調研報告,如果成為一個數據驅動型公司,收入會增加20%,同時成本會減少30%,這是一種雙贏。以亞馬遜為例,數據在亞馬遜自己的倉儲、物流優化中已經發揮了巨大的作用,而且很多創新的產品,比如智能語音助手Alexa和智能機器人Astro都是通過大數據和AI的技術催生的。
如今,數據的產生是指數級增長的,每天產生的數據比20年前一年所產生的數據還要多。不僅如此,當數據量呈指數級增長的時候,面臨的問題也絕非是線性增長。正如亞馬遜云科技大中華區產品部總經理陳曉建所說:“數據逐漸應用到更多的領域,整個應用場景就變得越來越復雜,這些都給大數據的計算提出了非常高的挑戰。而且很多企業已經不滿足于傳統大數據的T+1模式,將數據放在數據倉庫里,以天為單位通過大數據運算得到結果,已經滿足不了企業的需求,越來越多的企業希望按小時、按分鐘級的實時大數據服務。”
而企業若想要重塑數據洞察,就必須將數據和智能進行融合和統一。
IDC報告顯示,到2023年時,AI系統的支出將達到979億美元,比2019年增加2.5倍,短短4年便產生了2.5倍的增幅。另外,根據Gartner的分析,到2024年時,75%的企業將把機器學習技術真正用于生產,為業務所賦能。
可以看出,未來機器學習等技術和大數據對企業業務會產生越來越大的作用,企業都希望能夠通過融合大數據和機器學習能力來提供業務產出。而想要充分發揮數據的價值,就必須解決現在面臨三個方面的問題:
第一,數據和機器學習分而治之,它們本身的技術發展路線是兩條不同的路線,數據及技術孤島制約敏捷迭代;
第二,數據處理能力不足。在生產制造企業,機器學習幫助客戶對產品售后維修需求進行預測,由被動響應變為主動規劃。但由于不具備足夠的大數據處理能力,模型開發成功后 ,不能夠有效收集處理海量的運營數據,致使預測不準確,無法達到預期業務目標;
第三,數據分析人員參與度低。現實情況經常是模型在實驗環節效果良好,但實際使用中卻不盡人意,實驗環境只是對真實環境的簡單模擬,生產環境要復雜得多。
從這三個問題也可以看出,雖然企業對數智融合的關注度在不斷上升,但理想很豐滿,現實卻很骨感。
為了讓現實也變得“豐滿”,讓云端的數智融合達到企業的要求,陳曉建還分享了亞馬遜云科技的觀點和做法。
首先,企業應在云中打造統一的數據基礎底座,實現大數據和機器學習的雙劍合璧,為企業發展提供新動力;還需要建立統一融合的治理底座,建立統一融合的治理底座,如數據質量、數據權限、數據開發、數據工作流、可視化。其次,在大數據和機器學習之間建立高效的雙向互動,互為支撐,互為因果,形成正向循環。陳曉建認為,企業應該建立統一數據共享機制,讓數據資產化,打破數據孤島,進行統一的權限管控,進一步完善權限控制能力,讓數據在不同的業務系統之間流轉,實現統一開發及流程編排,融合端到端的大數據和機器學習任務,提升整體的開發效率。
亞馬遜云科技在去年發布的“智能湖倉”架構,便是一個典型的例子,它將亞馬遜云科技全面而深入的數據服務無縫集成,打通了數據湖和數據倉庫之間數據移動和訪問,并且進一步實現了數據在數據湖、數據倉庫,以及在數據查詢、數據分析、機器學習等各類專門構建的服務之間按需移動,從而形成統一且連續的整體,滿足客戶各種實際業務場景下的不同需求。
不僅如此,亞馬遜云科技大中華區產品部技術專家團隊總監王曉野在接受采訪時表示,基于五大理念,亞馬遜云科技“智能湖倉”還在不斷幫助更多的客戶在機器學習和大數據創新的項目上面去探索更新的相應的實踐。
到目前為止,亞馬遜云科技已經幫助全球數十萬的用戶利用大數據和AI助力業務發展。通過面向快速算法原型的數據實驗室的應用科學家、機器學習解決方案實驗室,以及提供端到端咨詢及交付的專業服務團隊等,與客戶共同探索數據驅動的轉型之路。而且隨著數字化轉型的推進,以數智融合為核心的數據驅動轉型已成為企業的硬需求。
未來,沒有進行數智融合的企業,等待它們的或許是下個時代的無情淘汰。