公司 螞蟻金服 地點 中國杭州 行業 金融服務

挑戰

螞蟻金服於2014年10月正式成立,源於2004年推出的全球最大的線上支付平臺支付寶。該公司還利用技術創新提供眾多其他服務。支付寶為全球9億多使用者(透過其本地和全球合作伙伴)處理的交易量巨大——2017年雙11光棍節高峰期每秒處理25.6萬筆交易,2018年光棍節總商品交易額達310億美元——更不用說其其他服務的交易量了。負責儲存和計算部門產品管理的杭浩傑表示,螞蟻金服面臨著“全新的資料處理挑戰”。“我們看到在這種規模下運營的三個主要問題:如何提供即時計算、儲存和處理能力,例如為欺詐檢測提供即時推薦;如何在這些資料之上提供智慧,因為資料太多而我們沒有獲得足夠的洞察力;以及如何將安全應用於應用層、中介軟體層、系統層,甚至晶片層。”為了向客戶提供可靠和一致的服務,螞蟻金服於2014年初開始採用容器,並很快需要一個編排解決方案來管理其資料中心中數萬個節點的叢集。

解決方案

在研究了多種技術後,團隊選擇了 Kubernetes 進行編排,以及其他一些 CNCF 專案,包括 PrometheusOpenTracingetcdCoreDNS。杭浩傑表示:“2016年末,我們決定 Kubernetes 將成為事實標準。”“回顧過去,我們押對了技術。但隨後我們需要將生產工作負載從傳統基礎設施遷移到最新的啟用 Kubernetes 的平臺,這需要一些時間,因為我們在可靠性和一致性方面非常謹慎。”所有核心金融系統在2017年11月前都已容器化,並且正在持續遷移到 Kubernetes。

影響

杭浩傑表示:“我們已經看到雲原生技術在運營方面至少提升了十倍,這意味著你的產出可以增加十倍。”螞蟻金服還向全球商業夥伴提供其完全整合的金融雲平臺,並希望憑藉在服務創新和技術專長方面的深厚經驗,為下一代數字銀行提供動力。杭浩傑表示,團隊尚未開始專注於最佳化 Kubernetes 平臺:“因為我們仍處於超高速增長階段,我們尚未進入節約成本的模式。”

作為跨國企業阿里巴巴的衍生公司,螞蟻金服擁有超過1500億美元的估值和與之匹配的規模。這家於2014年成立的金融科技初創公司包括全球最大的線上支付平臺支付寶,以及利用技術創新提供的眾多其他服務。

支付寶為全球9億多使用者(透過其本地和全球合作伙伴)處理的交易量令人震驚:2017年雙11光棍節高峰期每秒處理25.6萬筆交易,2018年光棍節總商品交易額達310億美元。螞蟻金服以“為世界帶來平等機會”為使命,致力於透過技術創新構建開放、共享的信用體系和金融服務平臺。

再加上其其他業務的運營——例如花唄線上信用系統、借唄貸款服務和擁有3.5億使用者的 螞蟻森林 綠色能源移動應用——螞蟻金服面臨著“全新的資料處理挑戰,”負責儲存和計算部門產品管理的杭浩傑表示。“我們看到在這種規模下運營的三個主要問題:如何提供即時計算、儲存和處理能力,例如為欺詐檢測提供即時推薦;如何在這些資料之上提供智慧,因為資料太多而我們沒有獲得足夠的洞察力;以及如何將安全應用於應用層、中介軟體層、系統層,甚至晶片層。”

為了應對這些挑戰並向客戶提供可靠和一致的服務,螞蟻金服於2014年開始採用 Docker 容器化。但他們很快意識到,他們需要一個編排解決方案來管理公司資料中心中數萬個節點的叢集。

團隊研究了幾種技術,包括 Docker Swarm 和 Mesos。杭浩傑說:“我們做了很多概念驗證,但我們對生產系統非常謹慎,因為我們希望確保不會丟失任何資料。”“你不能承受一分鐘的服務中斷;即使是一秒鐘也會產生非常非常大的影響。我們每天都在壓力下運營,為中國和全球的消費者和企業提供可靠和一致的服務。”

最終,杭浩傑表示,螞蟻金服選擇 Kubernetes 是因為它滿足了所有條件:強大的社群、在“未來三到五年內將保持相關性”的技術,以及與公司工程人才的良好匹配。杭浩傑說:“2016年末,我們決定 Kubernetes 將成為事實標準。”“回顧過去,我們押對了技術。但隨後我們需要將生產工作負載從傳統基礎設施遷移到最新的啟用 Kubernetes 的平臺。我們花了很多時間學習和培訓我們的員工,以便更好地在 Kubernetes 上構建應用程式。”

所有核心金融系統在2017年11月前都已容器化,並且正在持續遷移到 Kubernetes。螞蟻金服的平臺還利用了其他一些 CNCF 專案,包括 PrometheusOpenTracingetcdCoreDNS。全球技術合作與發展部門的餘俠表示:“今年的雙11,我們在 Kubernetes 上部署了大量節點,但與我們整個基礎設施的規模相比,這仍在進行中。”

儘管如此,影響已經顯現。杭浩傑說:“雲原生技術在效率方面給我們帶來了巨大的好處。”“總的來說,我們希望確保我們的基礎設施足夠靈活敏捷,以應對未來可能出現的工作。這是目標。而有了雲原生技術,我們看到運營效率至少提高了十倍,這意味著你的產出可以增加十倍。比如說,你用一個人運營10個節點。有了雲原生,明天你可以運營100個節點。”

螞蟻金服還向全球合作伙伴提供其金融雲平臺,並希望憑藉在服務創新和技術專長方面的深厚經驗,為下一代數字銀行提供動力。杭浩傑表示,團隊也尚未開始專注於最佳化 Kubernetes 平臺:“因為我們仍處於超高速增長階段,我們尚未進入節約成本的模式。”

在螞蟻金服向雲原生轉型過程中,CNCF 社群也發揮了寶貴作用。杭浩傑說:“如果你正在應用一項新技術,有一個社群可以與其他使用者討論技術問題,這非常好。”“我們非常感謝 CNCF 和這項令人驚歎的技術,這是我們繼續在全球擴充套件所需要的。我們未來一定會更多地擁抱社群和開源。”

事實上,公司已經開始開源其部分 雲原生中介軟體。餘俠表示:“我們將在這方面非常積極主動。”“CNCF 提供了一個平臺,讓每個人都可以接入或貢獻元件。這是一個非常好的開源治理。”

展望未來,螞蟻金服團隊將繼續評估許多其他 CNCF 專案。該團隊在中國建立了服務網格社群,彙集了眾多中國公司和開發人員,討論該技術的潛力。杭浩傑說:“服務網格對中國開發人員和終端使用者非常有吸引力,因為我們現在執行著許多遺留系統,它是一個理想的中間層,可以將新舊系統連線在一起。”“對於新技術,我們會密切關注它們是否會持續發展。”

在螞蟻金服,Kubernetes 以優異的成績通過了這項測試,團隊希望其他公司也能效仿。杭浩傑說:“在中國,我們在金融及其他相關服務領域的創新是北極星。”“我們當然希望透過我們在技術上的投資,在未來5到10年內繼續保持領先地位。”