當你的雲端服務停擺,你要如何知道?

現在其實很難確認一個雲端服務是否停擺。它可能只是短暫中斷,但快取和其他系統會接手,這通常是看不見的。如果你的雲端應用程式可以使用,並提供服務給你90%的使用者,但其他10%沒有,這服務是活著還是掛點了?有介於兩者之間的嗎?

Cloud4

有時,它是行銷或服務水平協議方面技術性的問題。而其他時候,它是媒體的問題。拿微軟Azure停擺為例子。微軟公共雲內運算部分的管理功能有問題。大概有24小時的時間是一團混亂,IT部門受到了影響,而且之後仍然餘波震盪一段時間。

對於我這樣大半職業生涯都在雲端上的人來說,當我看到新聞時所想到的第一件事就是,「我很高興那不是我。」然後我問自己,「客戶可以做些什麼,好在這樣的故障下保護自己?」

架構上,我知道要建議完全備援系統,最好來自不同的硬體或雲端服務供應商。但作為實用主義者,卻也很痛苦的知道只有少數客戶有這樣的預算或耐心來實現這樣的系統,世界正在將他們拉到單一雲端服務供應商,而且它本身可能依賴於特定硬體供應商。

因為當IT部門要向財務長報告時,總是會有在經濟跟風險之間抉擇的問題。今天,完全可以備份到不同的公共雲供應商,甚至有待命的虛擬機器。你甚至可以讓你的資料或應用程式的備援放在不同的基礎架構即服務(IaaS)供應商,或是從一個平台即服務(PaaS)供應商故障轉移到另一個。

這裡只有一個小問題,就是這樣做很花錢。

二十年前,討論圍繞是否要將預算翻兩番來做鏡像伺服器。今天也面臨差不多的問題,要做鏡像雲端。情況並沒有太大改變 – 你只能在該系統非常關鍵且資料很有價值時才會決定這樣做。在一般情況下,因為進入雲端的首要原因就是要降低營運成本,好的生意決策是依靠單一的供應商,然後讓他們自己做好備援。

多重雲端的問題比簡單的鏡像伺服器還困難,原因是不同雲端供應商有不同的政策、程序和管理制度。這意味要維護安全性來橫跨不同的備援雲端供應商,使用許多傳統而來自「舊世界」資料中心的安全產品,這可能會相當痛苦。

解決的方法是將安全系統和其管理分開,這樣就可以用單一政策在不同的雲端管理安全性。好消息是有安全公司將這件事當成優先事項,包括趨勢科技和它的Deep Security平台,客戶可以實現備援的運作要求而無須影響到安全性。

@原文出處:How do you know if your cloud is actually down?
作者:
Dave Asprey(雲端安全副總裁)