早在16世紀,近代人體解剖學創始人安德烈·維薩里在其著作《人體結構》中首次描述了人體的骨骼、肌肉、血管和神經的自然形態和分布。這一偉大成果使維薩里成為與哥白尼并列的兩大科學革命代表人物,也讓醫學和人體生物學從此擺脫中世紀神權桎梏,步入科學軌道。
以此為起點,醫學研究一路向著更微觀的世界挺近,在歷經發明顯微鏡,發現細菌,發現抗生素等數個里程碑之后,來到了以基因圖譜和分子式為研究對象,將人工智能(AI)和機器學習(ML)作為研究工具的精準醫學時代。
相比于維薩里要靠盜尸來獲得研究“數據”的窘境,如今已游走于分子維度的精準醫學卻要應對數據爆炸帶來的難題。身處分秒不停的數據洪流之中,醫療與生命科學行業對IT基礎設施的核心需求之一就是以較低成本獲得龐大且可彈性擴縮的存儲空間。這種需求也開啟了醫療與生命科學行業數據的上云之旅。
亞馬遜云科技基于醫療與生命科學行業客戶的需求不斷創新,不但讓他們獲得云上高性價比的彈性存儲空間,并針對存儲服務不斷創新以支持他們大規模的數據計算,達成“存”與“用”的性能協同。
如何滿足醫療與生命科學行業海量數據的存儲需求,并降低存儲成本?
數據量的爆炸性增長在醫療與生命科學領域尤為顯著。例如在藥物發現領域,科學家已發現的自然界里有可能成為藥物分子的個數有1060之多,相比之下,整個太陽系原子個數也只是1050左右。即便是數據指數效應相對較弱的醫院和診所,在國內也面對一年數十億人次診療所沉積的數字化檔案及醫學影像。
如何存儲海量數據并不斷降低存儲成本是醫療和生命科學領域亟需解決的一大挑戰。而無論從可靠性還是經濟性,亞馬遜云科技的存儲服務都為醫療和生命科學機構存放海量數據提供了可靠的選擇。
其中,對象存儲服務Amazon Simple Storage Service (Amazon S3)設計具有99.999999999%(11個9)的持久性,具有安全、可擴展和按需付費等特性,可輕松完成PB至EB級數據的存儲。為了更經濟、高效地存儲客戶的數據,亞馬遜云科技持續對 Amazon S3進行創新。例如,Amazon S3的存儲層級多達8級,讓客戶可根據工作負載對數據訪問、恢復能力和成本等方面的需求來進行選擇;Amazon S3智能分層( Intelligent-Tiering )在不影響性能的前提下,能夠在數據訪問模式發生變化時自動節省存儲成本。自2018年推出 Amazon S3 Intelligent-Tiering 以來,客戶使用該功能已經節省了 10 億美元。
醫療與生命科學行業大規模、高并發的數據計算需要高性能的存儲服務
海量數據為基因診斷、基因治療、靶向藥物研發等奠定了精準醫學發展的基礎,而大規模的數據計算則推進精準醫學的發展。例如單次數據分析所涉及的樣本數量可能超過數萬或數十萬,可能需調用底層成百上千甚至上萬個計算實例,這對存儲數據的存儲服務提出更高的數據吞吐性能要求。
為了確保存儲服務性能足以支持大規模、高并發計算集群的要求,亞馬遜云科技提供了一項完全托管式的文件存儲服務Amazon FSx for Lustre,為高性能計算工作負載提供經濟高效、高性能且可擴展的支持。Amazon FSx for Lustre可將文件系統連接至多個Amazon S3存儲桶,無縫訪問Amazon S3中的數據,優化計算資源的吞吐量。同時Amazon FSx for Lustre與亞馬遜云科技的計算服務高度集成,可提供亞毫秒級延遲、高達每秒數百GB吞吐量和數百萬的IOPS,能夠同時給上千臺運行PB級數據復雜分析工作負載的計算實例提供支持,并且將分析結果的數據同步回寫至Amazon S3中。
對于醫療與生命科學行業所涉及的大規模計算工作負載,Amazon FSx for Lustre相當于在對象存儲與計算集群之間加入了高性能緩存層,為存儲、計算兩端實現高效率的雙向數據同步;并且用戶無需在設置和管理Lustre文件系統上花費精力,就能夠獲得充足的算力支持和更短的計算周期,并節省人力與計算成本。
位于上海的腫瘤精準醫學企業桐樹基因,采用二代高通量測序技術進行腫瘤基因檢測,單個樣本可以產生108至109的短序列片段,每個序列片段又約是150個基因堿基長度,單個樣本的文件大小可達10GB到30GB。隨著業務發展和樣本量增長,桐樹基因選擇遷移至亞馬遜云科技以解決對存儲、I/O和算力的要求。此后,桐樹科技一方面獲得Amazon S3的高性價比存儲服務,另一方面也借助Amazon FSx for Lustre 為基因測序流程提供高性能共享文件存儲,使單個樣本分析時間縮短30-40分鐘,批量樣本分析整體用時較過去節省達三分之二。
亞馬遜云科技豐富的存儲服務,滿足醫療與生命科學行業的多樣化需求
在醫療與生命科學行業,相對于初創企業從業務之初即原生上云,也有不少機構需要將本地數據存儲向云上遷移。對此,亞馬遜云科技不斷豐富“專門構建”的Amazon FSx文件存儲系列服務,幫助用戶在遷移時無需重構應用,就能繼續使用熟悉的文件管理系統。
除了Amazon FSx for Lustre,Amazon FSx文件存儲系列服務還包括Amazon FSx for Windows File Server,基于開源OpenZFS文件系統構建的Amazon FSx for OpenZFS,以及Amazon FSx for NetApp ONTAP。例如,對于使用NetApp ONTAP文件存儲在線下構建了自己的數據管理和應用的醫療與生命科學行業用戶。這些企業在數據存儲遷移上云時,可使用Amazon FSx for NetApp ONTAP,無需修改其應用和數據管理方式,即可將部署在本地數據中心的網絡文件存儲(NAS)設備上的應用遷移至亞馬遜云科技,繼續使用自己熟悉的方式在云端部署、管理應用和數據,同時獲得FSx for NetApp ONTAP與亞馬遜云科技其它云服務之間的無縫集成。
亞馬遜云科技安全的數據保護功能,助力醫療與生命科學行業快速創新
此外,亞馬遜云科技的所有存儲服務都具有多重安全功能,并已通過權威的國際和本地技術測評與認證,遵守嚴格的國際和本地合規原則。同時,亞馬遜云科技還提供豐富的數據保護功能,實現關鍵數據的備份、容災、一站式管理和快速恢復,包括對不同應用和數據源的一站式數據備份,跨區域遠程復制服務,以及多種數據快速恢復功能。亞馬遜云科技安全及豐富的數據保護功能,讓醫療與生命科學客戶可以更輕松滿足行業本身更高的安全與合規要求,將精力聚焦于業務創新上。
借助亞馬遜云科技提供的存儲服務,醫療與生命科學行業客戶無論是海量數據存儲,還是進行基因研究、藥物分子篩選等大規模的數據計算,都能獲得更優成本、卓越性能,以及滿足細分場景需求的多樣化解決方案,快速驅動業務的創新發展。