随着AI时代的到来,云数据中心如何实现节能提效正成为热门话题。其中,SR-IOV技术凭借灵活度高以及可节约虚拟化业务算力等优势,是打造绿色低碳云数据中心的重要解决方案之一。
一、什么是SR-IOV 技术
SR-IOV 是由国际组织 PCI-SIG 组织定义的 PCIe 规范的扩展规范,旨在消除VMM 对虚拟化 I/O 操作的干预,提高数据传输性能,为 VM(虚拟机)提供独立的内存空间、终端、DMA 数据流。具备 SR-IOV 功能的 I/O 设备基于 PCIe 规范可管理、创建多个 VF(virtual function)。PCIe PF(physical function)是 PCIe 总线上的主要实体,一个 PCIe 设备具有一个或多个 PF,PF 设置 VF 数量,全局启动或停止 VF,VF 可以不通过 VMM 的干预完成数据的访问和转移。
图1:传统虚拟机与SR-IOV虚拟机对比
SR-IOV 功能下,原本是 VMM 承担的中断交由虚拟机直接处理,提升了设备 I/O 性能,同时虚拟机可以直接与 PCIe 设备进行交互,大大减轻了物理主机 CPU 的负担,使其可承担更多的虚拟机设备。另外,通过 SR-IOV 功能,可以减少 PCIe 设备的需求量,节省 PCIe 插槽,使得硬件资源可以更加充分使用。
基于以上优势,多家 SSD 厂商开始布局 SR-IOV,目前忆联已领先在企业级 UH8 系以及数据中心级 UH7 系产品上成功实现 SR-IOV 功能应用,并在多个云数据中心投入使用。
二、忆联 SR-IOV 方案验证
1 验证环境
1.1 本次验证硬件配置
·CPU:2* Intel(R) Xeon(R) Gold 6336Y CPU @ 2.40GHz 24cores/48threads
·内存:16*32GB 3200MT/S DDR4
·系统盘:1*960G 12Gbps
·SSD:1*UH8 系 3.84T
·HBA 卡:1*MegaRAID 9440-8i
·NIC:2* SC332
1.2 本次验证软件配置
·操作系统:CentOS Linux release 8.3.2011
·内核:Linux 4.18.0-240.el8.x86_64
·测试工具:2.6 及以上版本
·QEMU-KVM:2.12
·NVMe 开源驱动:1.11.1
·umtool 工具:1.0.1.5
2 验证方法
本次验证,在虚拟化分区方式的场景下,通过 SR-IOV 技术将一片 PCIe 4.0 3.84TB SSD(绑定 16 个 CPU 核)配置为 2 个容量为 1.92TB VF(绑定 8 个 CPU),4 个 960G VF(绑定 4 个核),8 个 480G VF(绑定 2 个核),如下示意图。
图2:虚拟化分区方式场景
测试 IO 基本模型如下:
·读写带宽(bs=128k,job=1,iodepth=128,read/write)
·读 IOPS(bs=4k,job=16,iodepth=128,randread)
·写 IOPS(bs=4k,job=8,iodepth=64,randwrite)
通过对盘进行划分为 2/4/8 个 VF 的场景下,在常规 IO 测试模型下进行 SR-IOV 方案验证。
3 验证结果
3.1 SSD 性能充分使用,有效提高利用率
本次在 SR-IOV 功能下的不同 VF 场景下总性能与整盘的性能对比图如下(以下数据为此次验证数据,仅供参考)。
*注:总带宽/总 IOPS=平均性能×VF 数量
图3:使用 SR-IOV 前后盘片性能对比图
从图 3 可以看到,在此次 SR-IOV 方案验证下,PF 性能、VF 性能总和与原盘的性能相比波动较低,基本在 5%以内,实现了对忆联 UH 系列 SSD 性能充分使用。在云场景下,可以减少用户所需PCIe设备数量,有效提升租户利用率,实现云虚拟化业务降本增效。
3.2 各场景下 VF 性能稳定,扩展性、灵活性高
为验证 VF 性能稳定,在划分 2/4/8 个 VF 的场景下,分别进行了测试,结果如下图。
注:偏差值=(VF 均值-VF 性能)/VF 均值*100%
图4:SR-IOV 功能下各 VF 与均值偏差图
数据显示,各 VF 测试值与 VF 均值基本偏差小于 1%,VF间性能分配较为稳定,扩展性较高,可灵活根据用户需求进行 VF 数量设置及管理。
3.3 SR-IOV with QoS 性能隔离明显
将 SSD 拆分成多个虚拟盘后,为了避免出现多个虚拟机同时运行以及同个虚拟机同时对盘上下业务从而出现性能上互相干扰的情况,忆联针对 SR-IOV 特性做了针对性能隔离的设计——SR-IOV with QoS,可通过 SSD 芯片对各 VF 进行流控,做到性能均衡,保障虚拟SSD盘的大带宽、低时延等特性,满足云数据中心对于高性能数据存储的需求。
图5:具体业务场景下 VF 的性能表现
三、忆联 SR-IOV技术的演进方向
1、SR-IOV 的性能隔离功能进一步优化
当前忆联 SR-IOV 使用 NS 对 VF 进行逻辑上的数据隔离,但因为所有 VF 都使用公共的Nand Flash 空间,各 VF 间不可避免会存在性能影响,虽然在 QoS 功能的调度下控制到了一定范围内,但在部分更为复杂业务场景下仍不可避免。为解决这个问题,忆联将继续深耕 SR-IOV 在 SSD 上的应用,进一步优化性能隔离算法,实现更好的隔离效果。
2、SR-IOV 的数据安全
虚拟机数据安全至关重要,当前代次虚拟机数据可以通过 trim 的方式进行清除,但对于金融、政府等对数据安全要求高的客户仍存在不足,如当 SSD 离开数据中心机柜便存在数据被盗取的可能。忆联针对虚拟机数据安全的研究方向已初具成果,后续可以做到在虚拟机释放时,对应到 SSD 上的物理数据同时彻底销毁,为维护数据安全提供保障。
3、SR-IOV 的智能化
忆联当前代次的 SR-IOV 具备各 VF 性能统计能力,新一代 SSD 中支持虚拟机性能智能分析,根据性能状态进行性能配置反馈,支持对虚拟机状态进行智能诊断并远程修复等功能。
综上所述,忆联 UH8 系列及 UH7 系列 SSD 的 SR-IOV 技术是可真正做到降本增效、绿色低碳可持续的存储方案。能有效提高盘片利用率,减少存储空间的浪费,实现节能减排的同时,忆联 SR-IOV 方案表现出效果显著的隔离度,更能满足用户在云化环境下对AI、分布式数据库、高性能企业应用等需求。
多年来,忆联持续加大SSD产品的研发创新投入力度,结合自身在闪存领域的多重优势,通过硬件技术与用户应用场景结合,不断迭代更为先进的SSD产品助力企业业务系统稳定运行 。忆联 SR-IOV 方案是对公司研发创新能力最好的验证,未来忆联将进一步夯实产品创新能力,为数字经济高质量、可持续发展添砖加瓦。
10-23 12:09
10-23 11:49
10-23 10:37
10-23 10:00
10-23 09:59
10-21 12:16
10-21 12:16
10-20 17:31
10-20 17:30
10-20 17:30