独立引用模型

科技工作者之家 2020-11-17

独立引用模型(Independent Reference Model ,I.R.M)是用于分析存储系统的概念模型:磁盘驱动器,高速缓存等。在这个模型下,对存储对象的引用是独立的随机变量。

动机提出独立引用模型(和其他类似模式)的动机是为了弥补这种存储设备中“痕迹”的缺失。

“跟踪”只是记录有关存储设备性能的一组数据,重点关注I / O请求:读取/写入操作的数量,每个请求的大小,确切地址(LUN-wise) ,和时间戳。

准确,有效和详细的实际存储系统跟踪很难达到学术分析的目的(超出本文范围的原因),这就是为什么这些模型是必需的。

通常情况下,与完整跟踪相比,可用数据更粗糙,质量更低:例如,数据可能会记录每个时间单位T,即每个LUN发生的I / O数量(或跟踪),以及总的命中/失败率1。

例子例如:对于具有4个磁道A,B,C和D的磁盘驱动器,工作15分钟后,I / O请求如下:A,B,C和D分别为7600,20,50,6000 。

很容易明白为什么这些数据不足以确定实际的工作负载:考虑第二个更简单的例子:两条轨道A和B,每个轨道在15分钟内都有1000个I / O。

要回答这个简单的问题,“这15分钟内磁盘有多难?”然后考虑以下两种情况:

(I)磁盘首先收到并响应轨道A的所有1,000个I / O请求,然后响应轨道B的所有1,000个I / O。

(II)磁盘接收并响应来自不同磁道的I / O请求,可交换使用:首先在A处,然后在B处,然后再次A,交替A / B高达1000次。

很容易看出,在每种情况下,磁盘完成的工作量都大不相同(在第一种情况下,情况是磁盘执行的工作量最小,不必在磁道之间移动超过一次,在第二种情况下,最大的工作量)。

I.R.M.最初由E.Coffman和P. Denning提出,并且仍在积极使用。这是最简化的模型。

在这个“无记忆”模型中,每个I / O引用代表一个i.i.d多项随机变量,其结果是下一个参考轨道的位置。因此,到达任何给定轨道必须以特定的平均速率发生,这与请求轨道的概率成正比。更具体地说,对给定轨道的请求的到达率等于其被参考的访问概率乘以总的请求速率。

也就是说,我们将N表示为所有I / O请求(读取和写入)的总和,并将每个I / O的数量(由它来自I)分配给每个轨道的概率除以N.在我们的情况下第一个例子:N = 7600 + 20 + 50 + 6000 = 13,670我们将为每个轨道分配以下概率:

A→7600 / N,B→20 / N,C→50 / N,D→6000 / N。

这种模式的好处,除了简单易用,它的保守特性。这意味着在分析最坏情况时,我们不能在模型的结果中非常关闭,如以下示例所示:

回到第二个例子:

在最好的情况下 - 磁盘只能从A到B移动一次,在最坏的情况下,磁盘会前后移动2000次。

使用I.R.M.模型(不会带到这里的技术计算),那么预期的轨道间距就是1000次。

也就是说:结果是从最坏情况下的两倍,而在最好的情况下,它实际上是1000的倍数!

事实上,可以证明,I.R.M.模型总是满足它总是“关闭”,最多为2的倍数。

本词条内容贡献者为:

王慧维 - 副研究员 - 西南大学

科技工作者之家

科技工作者之家APP是专注科技人才,知识分享与人才交流的服务平台。