国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

高性能排名系統(tǒng)的核心架構(gòu)原理,架構(gòu)師必看!

0
分享至

點(diǎn)擊下方“JavaEdge”,選擇“設(shè)為星標(biāo)”

第一時(shí)間關(guān)注技術(shù)干貨!


免責(zé)聲明~ 任何文章不要過(guò)度深思! 萬(wàn)事萬(wàn)物都經(jīng)不起審視,因?yàn)槭郎蠜](méi)有同樣的成長(zhǎng)環(huán)境,也沒(méi)有同樣的認(rèn)知水平,更「沒(méi)有適用于所有人的解決方案」; 不要急著評(píng)判文章列出的觀點(diǎn),只需代入其中,適度審視一番自己即可,能「跳脫出來(lái)從外人的角度看看現(xiàn)在的自己處在什么樣的階段」才不為俗人。 怎么想、怎么做,全在乎自己「不斷實(shí)踐中尋找適合自己的大道」

簡(jiǎn)介

Booking.com 利用復(fù)雜的排名系統(tǒng)優(yōu)化每位用戶的搜索結(jié)果。該系統(tǒng)采用先進(jìn)的機(jī)器學(xué)習(xí)算法,并充分利用海量數(shù)據(jù),包括用戶行為、偏好和歷史交互記錄,為用戶量身定制酒店列表和旅行推薦。

本文將帶您深入了解支撐多個(gè)垂直領(lǐng)域(如住宿、航班等)個(gè)性化排名的排名平臺(tái)架構(gòu)。

排名平臺(tái)在更廣泛生態(tài)系統(tǒng)中的位置

以下圖表展示了排名平臺(tái)在更廣泛生態(tài)系統(tǒng)中的位置概覽。為簡(jiǎn)化說(shuō)明,圖中將多個(gè)系統(tǒng)合并為單個(gè)模塊或省略,只突出了排名平臺(tái)的作用。

一個(gè)典型的搜索流程如下:用戶通過(guò)設(shè)備或?yàn)g覽器發(fā)起調(diào)用,該調(diào)用會(huì)經(jīng)過(guò)前端系統(tǒng)(包括微前端和網(wǎng)關(guān)),然后到達(dá)搜索協(xié)調(diào)器。核心搜索引擎負(fù)責(zé)協(xié)調(diào)搜索流程,并生成用于搜索結(jié)果頁(yè)面和地圖的物業(yè)列表。這一任務(wù)需要與可用性搜索引擎交互,該引擎負(fù)責(zé)追蹤 Booking.com 上 數(shù)千萬(wàn) 物業(yè)的可用性數(shù)據(jù)。由于數(shù)據(jù)量龐大,可用性搜索引擎采用分片機(jī)制以高效處理復(fù)雜查詢。協(xié)調(diào)器負(fù)責(zé)在可用性系統(tǒng)中分配工作負(fù)載并匯總結(jié)果。

排名平臺(tái)位于可用性搜索引擎之后,利用機(jī)器學(xué)習(xí)模型對(duì)符合搜索條件的物業(yè)進(jìn)行評(píng)分。

排名平臺(tái)概覽

在深入探討排名平臺(tái)的機(jī)器學(xué)習(xí)模型推斷之前,我們先簡(jiǎn)要了解模型創(chuàng)建和部署相關(guān)的一些關(guān)鍵組件和工作流程。

模型創(chuàng)建與部署:總體視圖

數(shù)據(jù)從不同來(lái)源(如 OLTP 表、Kafka 流)收集并存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中。機(jī)器學(xué)習(xí)科學(xué)家基于這些數(shù)據(jù)進(jìn)行探索、預(yù)處理、特征工程,并選擇合適的算法進(jìn)行模型訓(xùn)練。在完成模型訓(xùn)練和超參數(shù)優(yōu)化后,科學(xué)家會(huì)對(duì)模型進(jìn)行離線測(cè)試,測(cè)試通過(guò)后部署以提供實(shí)際服務(wù)。

模型的特征主要分為以下幾類:

  1. 靜態(tài)特征

  2. 動(dòng)態(tài)特征 - 緩慢變化的特征 - 實(shí)時(shí)特征

靜態(tài)特征基于歷史數(shù)據(jù)計(jì)算一次,在模型訓(xùn)練或推斷過(guò)程中保持不變。為了保證數(shù)據(jù)的時(shí)效性,這些特征需定期重新計(jì)算(如每日、每周或每月)。典型示例包括住宿位置、設(shè)施和房型等。

動(dòng)態(tài)特征則隨著新數(shù)據(jù)的出現(xiàn)快速更新。例如當(dāng)前房?jī)r(jià)和房間的實(shí)時(shí)可用性。

圖中展示的特征工程部分清晰區(qū)分了這兩類特征。批量特征是預(yù)先計(jì)算并存儲(chǔ)在特征庫(kù)中,其更新通過(guò)計(jì)劃的工作流完成;實(shí)時(shí)特征則基于數(shù)據(jù)流實(shí)時(shí)計(jì)算并發(fā)送至特征庫(kù)。

任何需要使用機(jī)器學(xué)習(xí)功能的應(yīng)用程序都通過(guò)機(jī)器學(xué)習(xí)平臺(tái)調(diào)用已部署的模型。

排名生態(tài)系統(tǒng)的擴(kuò)展視圖

在住宿領(lǐng)域,為大量用戶對(duì)數(shù)百萬(wàn)物業(yè)進(jìn)行排名是一個(gè)極具挑戰(zhàn)的技術(shù)任務(wù),需要復(fù)雜的算法和強(qiáng)大的計(jì)算能力。系統(tǒng)必須高效處理眾多變量(如用戶偏好、歷史行為、物業(yè)屬性以及實(shí)時(shí)數(shù)據(jù)如價(jià)格與可用性),并在毫秒級(jí)時(shí)間內(nèi)提供個(gè)性化推薦,確保推薦結(jié)果的相關(guān)性和準(zhǔn)確性。這種復(fù)雜性強(qiáng)調(diào)了強(qiáng)大的服務(wù)基礎(chǔ)設(shè)施的重要性,如下圖所示。這是之前生態(tài)系統(tǒng)圖的擴(kuò)展版本。

如圖所示,可用性搜索引擎與排名平臺(tái)的交互分為兩次:

  1. 從工作器分片處調(diào)用,為所有檢索到的物業(yè)評(píng)分。

  2. 在協(xié)調(diào)器合并各分片的結(jié)果后,再次調(diào)用以調(diào)整最終排序。

排名平臺(tái)為每個(gè)垂直領(lǐng)域或用例(如住宿排名、航班排名、住宿推薦等)提供專門服務(wù)。為了簡(jiǎn)化說(shuō)明,圖中僅保留了住宿排名服務(wù),隱藏了其他服務(wù)。此外,排名平臺(tái)廣泛采用持續(xù)實(shí)驗(yàn)(如交叉排序和 A/B 測(cè)試)優(yōu)化搜索結(jié)果。

模型推斷由機(jī)器學(xué)習(xí)平臺(tái)處理,該平臺(tái)負(fù)責(zé)跟蹤模型、特征及其表現(xiàn)。由于排名的規(guī)模龐大,機(jī)器學(xué)習(xí)平臺(tái)中有一個(gè)專用集群服務(wù)所有排名相關(guān)的機(jī)器學(xué)習(xí)模型,從而確保資源隔離和性能穩(wěn)定。

住宿排名服務(wù)設(shè)置

以下部分將探討排名服務(wù)的設(shè)置以及其關(guān)鍵組件。

如上圖所示,住宿排名服務(wù)部署在三個(gè)獨(dú)立的 Kubernetes 集群中。每個(gè)集群包含數(shù)百個(gè) Pod,用于處理搜索流量。右側(cè)的圖表展示了單個(gè) Pod 內(nèi)的關(guān)鍵組件。除了主要的 Java 服務(wù)之外,還有多個(gè)基礎(chǔ)設(shè)施容器共同運(yùn)行。Java 服務(wù)通過(guò) Nginx 接收請(qǐng)求,從分布式緩存中檢索特征后調(diào)用機(jī)器學(xué)習(xí)平臺(tái)。分布式緩存在滿足嚴(yán)格延遲要求方面至關(guān)重要(后文將詳細(xì)討論)。

深入分析 Java 服務(wù)后,可發(fā)現(xiàn)以下組件:

  • Dropwizard Resources:API 接口端點(diǎn)。

  • Feature Collector:從搜索上下文中收集特征,并從分布式緩存中檢索靜態(tài)特征。

  • Experiment Tracker:追蹤正在運(yùn)行的實(shí)驗(yàn)及其變體模型,確保不同變體生成的結(jié)果正確交錯(cuò)。

  • Model Executor:將請(qǐng)求分塊處理,調(diào)用機(jī)器學(xué)習(xí)平臺(tái)并匯總并行調(diào)用的評(píng)分結(jié)果。

排名服務(wù)內(nèi)的組件技術(shù)挑戰(zhàn)

在大規(guī)模運(yùn)營(yíng)排名系統(tǒng)時(shí),會(huì)面臨以下技術(shù)挑戰(zhàn):

位于關(guān)鍵路徑中

排名系統(tǒng)位于關(guān)鍵路徑,因此需在 99.9% 的情況下(p999)在不到一秒內(nèi)返回結(jié)果。這要求對(duì)復(fù)雜模型的操作進(jìn)行深入優(yōu)化,以滿足嚴(yán)格的性能要求。

扇出問(wèn)題

排名系統(tǒng)位于可用性搜索引擎的工作器或分片之后,因此 API 調(diào)用數(shù)量隨著工作器數(shù)量的增加而成倍增長(zhǎng)。

例如,如果搜索協(xié)調(diào)器每秒接收 K 個(gè)請(qǐng)求,而可用性搜索引擎有 N 個(gè)工作器,則排名服務(wù)每秒需處理 N * K 個(gè)請(qǐng)求。

極其多變的負(fù)載大小

根據(jù)某一地區(qū)內(nèi)物業(yè)的密度和搜索范圍的大小,待排名的物業(yè)數(shù)量可能從幾十到數(shù)千不等。為應(yīng)對(duì)這一挑戰(zhàn),排名服務(wù)會(huì)將負(fù)載拆分為可管理的小塊,再向機(jī)器學(xué)習(xí)平臺(tái)請(qǐng)求推斷。這種方法雖能保證推斷延遲的穩(wěn)定性,但也引入了以下復(fù)雜性:

  • 需要有效管理并行調(diào)用以防止內(nèi)存泄漏。

  • 加劇垃圾回收機(jī)制問(wèn)題。

  • 增加機(jī)器學(xué)習(xí)平臺(tái)的負(fù)載。

如何解決這些挑戰(zhàn)靜態(tài)評(píng)分回退

當(dāng)服務(wù)因某些原因無(wú)法在規(guī)定時(shí)間內(nèi)生成評(píng)分結(jié)果時(shí),系統(tǒng)會(huì)回退到物業(yè)的靜態(tài)評(píng)分。這些評(píng)分是預(yù)先計(jì)算的,存儲(chǔ)于可用性搜索引擎中,并定期更新。盡管這些評(píng)分缺乏個(gè)性化,但在系統(tǒng)故障時(shí),仍能為用戶提供相關(guān)性較高的排名結(jié)果。

多階段排名

多階段排名通過(guò)將排名過(guò)程分解為多個(gè)階段,每個(gè)階段基于不同的標(biāo)準(zhǔn)或參數(shù),從而實(shí)現(xiàn)更精確和細(xì)化的最終排名。這種方法使系統(tǒng)能夠在不同階段運(yùn)行復(fù)雜程度、個(gè)性化水平及性能要求各異的模型。

性能優(yōu)化

我們建立了全面的監(jiān)控體系以評(píng)估各組件性能并持續(xù)優(yōu)化。此外,通過(guò)在生產(chǎn)環(huán)境中維護(hù)鏡像設(shè)置,處理影子流量,可以運(yùn)行僅限生產(chǎn)環(huán)境的基準(zhǔn)測(cè)試。

模型推斷優(yōu)化

機(jī)器學(xué)習(xí)平臺(tái)持續(xù)優(yōu)化模型推斷以加速運(yùn)行過(guò)程。具體優(yōu)化技術(shù)包括:

  • 模型量化:減少模型復(fù)雜性,提高推斷速度。

  • 模型剪枝:刪除冗余模型權(quán)重以降低計(jì)算開(kāi)銷。

  • 硬件加速:利用專用硬件(如 GPU 或 TPU)提升性能。

  • 推斷框架:采用專門設(shè)計(jì)的推斷框架以優(yōu)化資源使用。

這些技術(shù)在保持模型準(zhǔn)確性的同時(shí),顯著降低了推斷的延遲、內(nèi)存使用和計(jì)算資源消耗。

結(jié)論

排名平臺(tái)在 Booking.com 搜索架構(gòu)的生態(tài)系統(tǒng)中占據(jù)核心地位。它通過(guò)復(fù)雜的機(jī)器學(xué)習(xí)模型和排名算法,為用戶提供高度個(gè)性化的搜索結(jié)果。隨著技術(shù)的不斷演進(jìn)和用戶需求的增長(zhǎng),排名平臺(tái)將繼續(xù)推動(dòng)創(chuàng)新,確保為全球用戶帶來(lái)相關(guān)性更高、更個(gè)性化的搜索體驗(yàn)。

關(guān)注我,緊跟本系列專欄文章,咱們下篇再續(xù)!

★ 作者簡(jiǎn)介:魔都架構(gòu)師,多家大廠后端一線研發(fā)經(jīng)驗(yàn),在分布式系統(tǒng)設(shè)計(jì)、數(shù)據(jù)平臺(tái)架構(gòu)和AI應(yīng)用開(kāi)發(fā)等領(lǐng)域都有豐富實(shí)踐經(jīng)驗(yàn)。 各大技術(shù)社區(qū)頭部專家博主。具有豐富的引領(lǐng)團(tuán)隊(duì)經(jīng)驗(yàn),深厚業(yè)務(wù)架構(gòu)和解決方案的積累。 負(fù)責(zé): 中央/分銷預(yù)訂系統(tǒng)性能優(yōu)化 活動(dòng)&券等營(yíng)銷中臺(tái)建設(shè) 交易平臺(tái)及數(shù)據(jù)中臺(tái)等架構(gòu)和開(kāi)發(fā)設(shè)計(jì) 車聯(lián)網(wǎng)核心平臺(tái)-物聯(lián)網(wǎng)連接平臺(tái)、大數(shù)據(jù)平臺(tái)架構(gòu)設(shè)計(jì)及優(yōu)化 LLM Agent應(yīng)用開(kāi)發(fā) 區(qū)塊鏈應(yīng)用開(kāi)發(fā) 大數(shù)據(jù)開(kāi)發(fā)挖掘經(jīng)驗(yàn) 推薦系統(tǒng)項(xiàng)目 目前主攻市級(jí)軟件項(xiàng)目設(shè)計(jì)、構(gòu)建服務(wù)全社會(huì)的應(yīng)用系統(tǒng)。 ”

參考:

  • 編程嚴(yán)選網(wǎng)

編程嚴(yán)選網(wǎng):http://www.javaedge.cn/ 專注分享軟件開(kāi)發(fā)全生態(tài)相關(guān)技術(shù)文章、視頻教程資源、熱點(diǎn)資訊等,全站資源免費(fèi)學(xué)習(xí),快來(lái)看看吧~ 【編程嚴(yán)選】星球

歡迎長(zhǎng)按圖片加好友,我會(huì)第一時(shí)間和你分享軟件行業(yè)趨勢(shì)面試資源,學(xué)習(xí)方法等等。

添加好友備注【技術(shù)群交流】拉你進(jìn)技術(shù)交流群

關(guān)注公眾號(hào)后,在后臺(tái)私信:

  • 更多教程資源應(yīng)有盡有,歡迎關(guān)注并加技術(shù)交流群,慢慢獲取

  • 為避免大量資源被收藏白嫖而浪費(fèi)各自精力,以上資源領(lǐng)取分別需要收取1元門檻費(fèi)!


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
情況真不太好,要早作準(zhǔn)備。。。

情況真不太好,要早作準(zhǔn)備。。。

艾格吃飽了
2026-01-11 21:09:06
上汽集團(tuán)總裁賈健旭拜訪華為創(chuàng)始人任正非,共商尚界品牌合作再深化

上汽集團(tuán)總裁賈健旭拜訪華為創(chuàng)始人任正非,共商尚界品牌合作再深化

財(cái)聞
2026-01-12 18:51:10
假如美國(guó)真把加拿大、格陵蘭島并入版圖,將沒(méi)有國(guó)家能與美國(guó)抗衡

假如美國(guó)真把加拿大、格陵蘭島并入版圖,將沒(méi)有國(guó)家能與美國(guó)抗衡

扶蘇聊歷史
2026-01-10 07:30:03
毫無(wú)意義的簽約!3D鋒線新援對(duì)于當(dāng)下的火箭似乎沒(méi)有任何意義?

毫無(wú)意義的簽約!3D鋒線新援對(duì)于當(dāng)下的火箭似乎沒(méi)有任何意義?

稻谷與小麥
2026-01-12 21:54:35
國(guó)產(chǎn)車尷尬了?國(guó)外機(jī)構(gòu)評(píng)測(cè):沒(méi)有實(shí)體按鍵的汽車,安全性差一些

國(guó)產(chǎn)車尷尬了?國(guó)外機(jī)構(gòu)評(píng)測(cè):沒(méi)有實(shí)體按鍵的汽車,安全性差一些

互聯(lián)網(wǎng).亂侃秀
2026-01-11 10:48:10
危險(xiǎn)正在逼近波司登

危險(xiǎn)正在逼近波司登

功夫財(cái)經(jīng)
2026-01-10 09:13:40
股市:兩個(gè)大消息

股市:兩個(gè)大消息

小白讀財(cái)經(jīng)
2026-01-12 17:16:39
武統(tǒng)還沒(méi)開(kāi)始,上百臺(tái)軍飛行員集體跑路?臺(tái)專家:統(tǒng)一有了新模式

武統(tǒng)還沒(méi)開(kāi)始,上百臺(tái)軍飛行員集體跑路?臺(tái)專家:統(tǒng)一有了新模式

青途歷史
2026-01-11 18:58:58
曝李大雙和李琳離婚,現(xiàn)任是外國(guó)美女,已生兒子,丁克23年被拋棄

曝李大雙和李琳離婚,現(xiàn)任是外國(guó)美女,已生兒子,丁克23年被拋棄

天天熱點(diǎn)見(jiàn)聞
2026-01-10 16:30:29
東莞涉企行政檢查新規(guī):執(zhí)法人員應(yīng)亮證亮碼,否則可拒絕檢查

東莞涉企行政檢查新規(guī):執(zhí)法人員應(yīng)亮證亮碼,否則可拒絕檢查

南方都市報(bào)
2026-01-12 16:31:21
從高處跌落的硅膠臉?lè)蛉耍罕痪?個(gè)月瘦到80斤,頭發(fā)花白眼神驚恐

從高處跌落的硅膠臉?lè)蛉耍罕痪?個(gè)月瘦到80斤,頭發(fā)花白眼神驚恐

照見(jiàn)古今
2025-12-12 18:19:05
申花腸子都悔青了吧?2000萬(wàn)猶豫不決錯(cuò)過(guò)李昊,如今5000萬(wàn)都不夠

申花腸子都悔青了吧?2000萬(wàn)猶豫不決錯(cuò)過(guò)李昊,如今5000萬(wàn)都不夠

羅掌柜體育
2026-01-12 09:37:45
林詩(shī)棟被訓(xùn)懵了!王皓瘋狂輸出:你XX反手那么強(qiáng) 你啊 別慌別亂啊

林詩(shī)棟被訓(xùn)懵了!王皓瘋狂輸出:你XX反手那么強(qiáng) 你啊 別慌別亂啊

風(fēng)過(guò)鄉(xiāng)
2026-01-12 12:52:23
停牌!301218,籌劃控制權(quán)變更!今日一度20%漲停

停牌!301218,籌劃控制權(quán)變更!今日一度20%漲停

證券時(shí)報(bào)e公司
2026-01-12 19:51:51
高志凱翻出一張1946年的盟軍最高司令部訓(xùn)令677號(hào),日本炸鍋

高志凱翻出一張1946年的盟軍最高司令部訓(xùn)令677號(hào),日本炸鍋

扶蘇聊歷史
2026-01-08 18:19:48
王玉雯最新活動(dòng)翻車!妝容太丑照片像AI,評(píng)論區(qū)徹底淪陷了

王玉雯最新活動(dòng)翻車!妝容太丑照片像AI,評(píng)論區(qū)徹底淪陷了

丁丁鯉史紀(jì)
2026-01-12 10:14:25
當(dāng)年他訂了批諾基亞手機(jī),海關(guān)積壓16年后居然才收到貨?! 全數(shù)碼古董啊!

英國(guó)那些事兒
2026-01-11 22:55:45

近期二手 iPhone 4 居然爆火了,價(jià)格翻了幾倍!

近期二手 iPhone 4 居然爆火了,價(jià)格翻了幾倍!

XCiOS俱樂(lè)部
2026-01-11 21:03:38
76年華國(guó)鋒秘密詢問(wèn)吳德:你在衛(wèi)戍區(qū)的搭檔是否可靠,吳作何回答

76年華國(guó)鋒秘密詢問(wèn)吳德:你在衛(wèi)戍區(qū)的搭檔是否可靠,吳作何回答

春秋硯
2026-01-10 09:30:19
明搶5000萬(wàn)桶石油后,特朗普轉(zhuǎn)頭才發(fā)現(xiàn):中國(guó)連一桶都不肯買了?

明搶5000萬(wàn)桶石油后,特朗普轉(zhuǎn)頭才發(fā)現(xiàn):中國(guó)連一桶都不肯買了?

書(shū)紀(jì)文譚
2026-01-11 19:36:13
2026-01-12 22:28:49
JavaEdge incentive-icons
JavaEdge
Java 技術(shù)
466文章數(shù) 457關(guān)注度
往期回顧 全部

科技要聞

面對(duì)SpaceX瘋狂“下餃子” 中國(guó)正面接招

頭條要聞

知曉女子丈夫出差 男子跨城趕來(lái)將她約賓館猥褻拍裸照

頭條要聞

知曉女子丈夫出差 男子跨城趕來(lái)將她約賓館猥褻拍裸照

體育要聞

聰明的球員,不是教練教出來(lái)的

娛樂(lè)要聞

蔡少芬結(jié)婚18周年,與張晉過(guò)二人世界

財(cái)經(jīng)要聞

倍輕松信披迷霧 實(shí)控人占用資金金額存疑

汽車要聞

增配不加價(jià) 北京現(xiàn)代 第五代 勝達(dá)2026款上市

態(tài)度原創(chuàng)

家居
本地
數(shù)碼
房產(chǎn)
旅游

家居要聞

包絡(luò)石木為生 野性舒適

本地新聞

云游內(nèi)蒙|“包”你再來(lái)?一座在硬核里釀出詩(shī)意的城

數(shù)碼要聞

2026年全球顯示器預(yù)計(jì)出貨約1.28億臺(tái) 100Hz成主流

房產(chǎn)要聞

重磅調(diào)規(guī)!417畝商改住+教育地塊!海口西海岸又要爆發(fā)!

旅游要聞

冰上漁歌起 年味踏雪來(lái) 哈素海冬捕節(jié)解鎖青城跨年新玩法

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版