亚洲五月天一区二区三区-日本午夜福利视频在线-日本欧美一区二区不卡免费-日韩深夜视频在线观看

清華大學(xué)計算機系團隊獲得第23屆USENIX文件與存儲技術(shù)會議(FAST25)最佳論文獎

來源:清華大學(xué) #清華大學(xué)#
4881

2月25日至27日,第23屆USENIX文件與存儲技術(shù)會議(USENIX Conference on File and Storage Technologies,FAST)在美國圣克拉拉舉行。計算機系教師章明星、武永衛(wèi)、鄭緯民團隊和月之暗面公司合作發(fā)表的論文“以鍵值緩存為中心的以存換算大語言模型推理架構(gòu)”(Mooncake: Trading More Storage for Less Computation-A KVCache-centric Architecture for Serving LLM Chatbot)獲得埃里克·里德爾最佳論文獎(Erik Riedel Best Paper Award)。論文的第一作者為計算機系博士生秦若愚,導(dǎo)師為助理教授章明星。

最佳論文獎

該論文提出的系統(tǒng)Mooncake是月之暗面公司推出的大語言模型服務(wù)Kimi的底層推理服務(wù)平臺。Mooncake采用了一種以鍵值緩存(KVCache)為中心的分離架構(gòu),不僅將預(yù)填充和解碼集群分離,還高效利用了推理集群中未充分利用的CPU、DRAM、SSD和NIC資源,構(gòu)建了一個獨立的KVCache緩存池。其核心創(chuàng)新在于以KVCache為中心的全局緩存和調(diào)度器,旨在嚴格延遲相關(guān)服務(wù)級別目標(SLOs)下最大化吞吐量。

實驗結(jié)果顯示,Mooncake在處理長上下文輸入的場景中表現(xiàn)出色。在使用真實數(shù)據(jù)進行的測試中,與基線方法相比,Mooncake在符合SLOs的情況下,將有效請求處理能力提升了59%至498%。目前,Mooncake已在數(shù)千個節(jié)點上運行,每日處理超過1000億個token。在實際部署中,Mooncake的創(chuàng)新架構(gòu)使Kimi在NVIDIA A800和H800集群上分別比以前的系統(tǒng)多處理115%和107%的請求。

FAST(File and Storage Technologies)是計算機存儲領(lǐng)域的頂級學(xué)術(shù)會議,已創(chuàng)立二十余年,在存儲領(lǐng)域具有重要影響力,被中國計算機學(xué)會(CCF)認定為存儲系統(tǒng)領(lǐng)域的A類國際學(xué)術(shù)會議。

責(zé)編: 趙碧瑩
來源:清華大學(xué) #清華大學(xué)#
THE END
關(guān)閉
加載

PDF 加載中...

96精品久久久久久蜜臀浪| 91秦先生全集在线观看| 大黑屌日本另类肛交| 欧美 日韩 亚洲 熟女| 干女人逼逼的大几把| av人摸人人人澡人人超| 国产一国产一级毛片无码视频百度| 久操视频中文字幕在线观看| 精品久久久久五月婷五月| 亚洲一区二区女同性恋免费看| 91久久高清国语自产拍| A级毛片高清视频| 欠欠草免费在线视频| 欧美黄色三级成人小视频| 成人黄色网破处在线播放 | 美女大鸡操很多水在线看| 好爽轻点太大了太深了视频| 瓯美在线免费视频笫一区第二区 | 99精品一级欧美片免费| 操俄罗斯美女bb| 五月天国产成人av在线| 亚洲精品一区二区精华液| 老司机免费福利午夜入口| 女人被男人操到高潮视频| 白丝袜子宫啊啊啊不要了| 美国大鸡巴操逼视频| 日韩一区二区三区夜色视频 | AV无码超清破解版流出| 国产午夜久久精品一区四虎| 极品 操 抽插视频| 久久噜噜噜久久熟女精品| 欧美猛男一区二区三区快播| 尤物网三级在线观看| 男人摸女人下面视频| 火辣美女的操大逼| 大鸡扒干美女BB直流水| 大胸美女被c的嗷嗷叫视频| 草草久性色av综合av| 国产区高清在线一区二区三区| 国语自产免费精品视频在| 女女同性女同1区二区三|