重复数据删除中的新增功能

适用于:Windows Server 2022、Windows Server 2019、Windows Server 2016,Azure Stack HCI 版本 21H2 和 20H2

Windows Server 中的重复数据删除已进行了优化,在私有云范围内实现了高性能和灵活性,且易于管理。 若要详细了解 Windows Server 中的软件定义存储堆栈,请参阅 Windows Server 中的存储的新增功能

Windows Server 2022

重复数据删除在 Windows Server 2022 中没有额外的增强功能。

Windows Server 2019

Windows Server 2019 中的重复数据删除具有以下增强功能:

功能 新功能或更新功能 描述
ReFS 支持 新建 通过 ReFS 文件系统的重复数据删除和压缩,可在同一卷上存储多达 10 倍的数据。 (使用 Windows Admin Center 只需点击一下即可打开。)具有可选压缩率的可变大小的区块存储最大程度地提高了节约率,同时多线程后处理体系结构可将性能影响降至最低。 支持高达 64 TB 的卷,并将对每个文件的前 4 TB 进行重复数据消除。

Windows Server 2016

从 Windows Server 2016 开始,重复数据删除具有以下增强功能:

功能 新功能或更新功能 描述
支持大型卷 已更新 在 Windows Server 2016 之前,必须专门调整卷的大小实现预期改动,大小超过 10 TB 的卷不适合进行重复数据删除。 在 Windows Server 2016 中,重复数据删除支持最大 64 TB 的卷。
支持大型文件 已更新 在 Windows Server 2016 之前,大小接近 1 TB 的文件不适合进行重复数据删除。 在 Windows Server 2016 中,完全支持高达 1 TB 的文件。
支持 Nano Server 新建 重复数据删除在 Windows Server 2016 的新 Nano Server 部署选项中可用且完全受支持。
简化的备份支持 新建 Windows Server 2012 R2 通过一系列手动配置步骤支持虚拟化备份应用程序,如 Microsoft 的 Data Protection Manager。 Windows Server 2016 新增了默认的使用类型(即“备份”),用于无缝部署虚拟化备份应用程序的重复数据删除。
支持群集操作系统滚动升级 新建 重复数据删除完全支持 Windows Server 2016 的新功能群集操作系统滚动升级

支持大型卷

这一更改增添了什么价值?
在 Windows Server 2012 R2 中,为了获得最佳的重复数据删除性能,必须适当调整卷的大小,确保优化作业可以跟上数据更改或“改动”的速度。 通常情况下,这意味着重复数据删除仅在不超过 10 TB 的卷上性能较高,具体取决于工作负荷的写入模式。

从 Windows Server 2016 开始,重复数据删除在高达 64 TB 的卷上仍具有较高性能。

工作原理的不同之处是什么?
在 Windows Server 2012 R2 中,重复数据删除作业管道将单线程和 I/O 队列用于每个卷。 为了确保优化作业不落后,这可能会导致卷的总体空间节省率降低,大型数据集必须分解为较小的卷。 适当的卷大小取决于该卷的预期改动。 一般情况下,改动较多的卷最大为 6-7 TB 左右,改动较少的卷最大为 9-10 TB 左右。

从 Windows Server 2016 开始,已重新设计了重复数据删除作业管道,通过对每个卷使用多个 I/O 队列,并行运行多个线程。 这可以提升性能,而不用将数据分解为多个较小的卷。 下图演示了这种变化:

A visualization comparing the Data Deduplication Job Pipeline in Windows Server 2012 R2 to Windows Server 2016

这些优化适用于所有重复数据删除作业,而不仅仅是优化作业。

支持大文件

这一更改增添了什么价值?
在 Windows Server 2012 R2 中,由于删除重复处理管道的性能下降,非常大的文件不适合进行重复数据删除。 在 Windows Server 2016 中,高达 1 TB 的文件的删除重复性能非常高,使管理员能够将删除重复节省的空间应用于更多工作负荷。 例如,可以对非常大的文件(通常与备份工作负荷相关)进行重复数据删除。

工作原理的不同之处是什么?
从 Windows Server 2016 开始,重复数据删除可以利用新的流映射结构和其他“后台”改进来提高优化吞吐量和访问性能。 此外,重复数据删除处理管道现在还可以在故障转移后恢复文件的优化,无需重启。 这些更改使得对高达 1 TB 的文件的删除重复性能变得很高。

支持 Nano Server

这一更改增添了什么价值?
Nano Server 是 Windows Server 2016 中新的无外设部署选项,与 Windows Server 内核部署选项相比,具有极小的系统资源占用、启动速度明显加快,并且需要更少的更新和重启。 Nano Server 上完全支持重复数据删除。 有关 Nano Server 的详细信息,请参阅 Nano Server 入门

简化了虚拟化备份应用程序的配置

这一更改增添了什么价值?
Windows Server 2012 R2 支持虚拟化备份应用程序的重复数据删除,但需要手动调整删除重复设置。 从 Windows Server 2016 开始,虚拟化备份应用程序的删除重复配置大大简化。 为卷启用删除重复时,会使用预定义的使用类型,就像常规用途文件服务器和 VDI 选项。

支持群集操作系统滚动升级

这一更改增添了什么价值?
运行重复数据删除的 Windows Server 故障转移群集可以混合运行 Windows Server 2012 R2 版重复数据删除以及运行 Windows Server 2016 版重复数据删除的节点。 在群集滚动升级期间,通过此增强功能,可对已删除重复的卷进行完全数据访问,实现在现有 Windows Server 2012 R2 群集上逐步实施新版重复数据删除,确保在同时升级所有节点时不会产生停机。

工作原理的不同之处是什么?
使用以前的 Windows Server 版本,Windows Server 故障转移群集要求群集中的所有节点具有相同的 Windows Server 版本。 从 Windows Server 2016 开始,群集滚动升级功能允许群集在混合模式下运行。 重复数据删除支持这种新的混合群集配置,可在群集滚动升级期间实现完全数据访问。