和今年7月份在存儲重鎮(zhèn)武漢召開的存儲半導(dǎo)體峰會一樣,Open Channel SSD在FMS2018 的眾多話題中的分量很足。在架構(gòu)相關(guān)的議題中占了半壁江山。從目前看到的方案來看,大家的目的都類似,主要解決問題是:
1. I/O 的隔離
2. 實現(xiàn)可以預(yù)期的延時
3. 將底層的NAND的Channel暴露到上層來實現(xiàn)更好的I/O并行處理和調(diào)度
目前主要實現(xiàn)的方案有三種,Alibaba AOC, Facebook I/O Determinism 以及Open Channel的創(chuàng)始公司CNEXLabs (Microsoft 投資的公司)。 在本次的FMS上三家都有講各自的方案,但是各自方案在自己公司的進展確實一個比較敏感的話題。先來看看各家的方面的陣營吧。
Alibaba AOC放出可他們的生態(tài)陣營如下:
Intel的加入對于整個生態(tài)的促進的確很大。CNEXLabs的存在說明Alibaba這個方案和標準的Open Channel還是有一定的聯(lián)系的。
但是從目前的資料來看,Alibaba 的AOC在架構(gòu)上和之前OC 還是有很大不同,可以看到的不同點在于:
l 提供了兩種模式,標準的NVMe 和AOC 模式。
l 對于主機的接口方案,提供了內(nèi)核+Block 塊設(shè)備和用戶態(tài)NVMe兩種接口。
l 基于優(yōu)先級的I/O調(diào)度,實現(xiàn)了 PU-based Read I/O Scheduling (PRS)/PU-based Read Throttling PRT/Priority-based Write Scheduling (PWS) /Adaptive Write Throttling (AWT)四種機制。
比較有意思的是在Shannon-System的母公司的SMI的展臺上有一顆2270的SSD控制器。
這個2270控制從date sheet上看是由兩個2262在后端堆疊起來的。
而且已經(jīng)點名了可以支持OC SSDs,看起來和Alibaba的AOC應(yīng)該是比較match。因此想到Intel會不會也是用這個來做AOC SSD呢?
畢竟Intel在今年五月的SPDK的summit上討論的open channel SSD的也討論了雙模的支持,以及對于SPDK的支持。
對于Facebook的I/O Determinism, 他們可能因為和Intel的關(guān)系比較密切,因此選擇了加入NVMe標準的道路。大家可以在之前的OCP和FMS看到Facebook在定制SSD的I/O Determinism的進展。2017年的FMS和2018的OCP上,可以看到Seagate 的Nytro部門和Facebook走的很近,但是隨著Facebook主導(dǎo)的各種TP在NVMe協(xié)議組織里面出現(xiàn),現(xiàn)在很難看出facebook會使用哪一家的硬件。在FMS2018上的Facebook的Topic中,他們提出了目前實現(xiàn)的局限性:
同時Facebook又挖了一個大坑:
比較有意思的,的確有一家不透露名字的startup在follow up facebook的需求。具有的信息,我就不放上來了。他們認為需要根據(jù)Facebook的需求重新定義SSD的架構(gòu)。需要根據(jù)NVM Set的概念,在SSD的控制器的相關(guān)資源中進行分割,實現(xiàn)多個sub system的device。因為Facebook的提議都在NVMe的協(xié)議組織中,但是大部分應(yīng)該都是option的,如果真的有人愿意根據(jù)Facebook的幾個大坑來定義自己的SSD控制器,我只能說祝你好運了。
最后來講講CNEXLabs的正宗open channel SSD,這個概念已經(jīng)和Microsoft的Denali Porject緊密結(jié)合。目前不僅CNEXLabs,連Marvell,SMI都宣布自己加入Denali project了,目前來看Microsoft的江湖地位還是高。
對于Open Channel SSD的定義的技術(shù)細節(jié),在lightnvm.io上大家都可以看到,就不在這里贅述了。就講講今年CNexlabs的update吧。
l Cnextlabs的那個主導(dǎo)Open Channel SSD的哥們?nèi)チ薟D,但是還在講這個,對OC 應(yīng)該是件好事,多了一個大客支持。
l Device的保修問題。這個問題也是筆者一直和CNexlab的大佬有疑問的地方。因為Host is King,如果來一個不靠譜的程序員來用OC SSD,可能在幾分鐘內(nèi)把一個OC SSD一部分NAND寫穿。連我們Xilinx做OC SSD的開發(fā)平臺的時候,都考慮使用SODIMM的NAND 模塊可以拆卸,而不是直接NAND Down。
l 不管OC 如何開放,因為壞塊管理的需求,以及IO隔離,因此肯定要有一部分的保留區(qū)域,可能沒有傳統(tǒng)的OP那么大。在多用戶的場景下,如何在壽命和IO隔離之間平衡也是一個問題。
l CNexlabs在Denali的基礎(chǔ)上做了over Fabric的嘗試,這個基本上是利用NVMe over Fabric在遠端和本地的NVMe訪問的透明做一些有益的應(yīng)用探索。
總之,可以看出,目前這種基于Open Channel 思想的SSD架構(gòu)的本質(zhì)上需要有壕客支持,底層的設(shè)計和上層的應(yīng)用緊密結(jié)合,注定是幾個客戶才用得上的產(chǎn)品。大部分吃瓜群眾在學(xué)術(shù)上面作圍觀就行了。作為前Host FTL的代表Fusionio的前員工,我對Open Channel有著深深的敬意,因為Open Channel的思想本質(zhì)上是如何使用SSD構(gòu)建一個高效,穩(wěn)定的存儲系統(tǒng)的積極探索,那些做全閃陣列的廠家,可能不會使用Open Channel SSD本身的標準,但是盤控聯(lián)動肯定是不可缺少的。目前如何控制底層SSD的GC對存儲系統(tǒng)的影響還是一個艱難的topic。
-
SSD
+關(guān)注
關(guān)注
21文章
2984瀏覽量
119639 -
Facebook
+關(guān)注
關(guān)注
3文章
1432瀏覽量
56787
原文標題:FMS 2018 (5):Open Channel SSD占據(jù)半壁江山
文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
Ceph分布式存儲系統(tǒng)解析
27MHz HCSL 差分晶體振蕩器在數(shù)據(jù)中心網(wǎng)絡(luò)存儲系統(tǒng)中的應(yīng)用方案
高速SSD存儲+傳輸系統(tǒng)方案設(shè)計

高速ssd存儲系統(tǒng)中數(shù)據(jù)緩存控制器流程控制設(shè)計

科達KCloudStor云存儲系統(tǒng)與鯤鵬攜手推進原生開發(fā)技術(shù)創(chuàng)新
電腦云存儲系統(tǒng),電腦云存儲系統(tǒng)的教程,個人云電腦是什么以及怎么連接

評論