高性能计算网格编程网格的分布式

高性能计算网格编程网格的分布式(常常是非专用的)结构需要为工作的执行准备一个不同的模型

因为网格的这种特性,无法期望同时执行各种工作单元

有许多因素影响了工作的执行时间,其中包括工作分配时间以及每个网格节点的资源的有效功率

因为各个节点中存在的不同之处和工作被处理的方式,网格使用了一个将网格节点的监视与工作单元的排队系统相结合的系统

该监视支持网格管理器确定各个节点上的当前负载

然后在分配工作时使用该信息,把要分配的工作单元分配给没有(或有少量)当前资源负载的节点

所以,整个网格系统基于一系列的队列和分布,通过在节点之间共享负载,在节点变得可用时将工作分配给队列中的每个节点,使网格作为一个整体得到更有效的使用

响应和结果都同样地在网格控制器上进行排队,以便在处理完所有工作单元(及其结果)时将它们收集到应用程序的最终结果集中

图4中显示了这样一个示例

网格模型允许使用各种级别的资源、工作单元规模和分配级别,而不只是HPC解决方案使用的执行模型提供的那些

大多数网格支持使用每个将被排队和分配的应用程序的各种工作单元同时执行多个工作请求

例如,可以在一些节点仍然在完成Job1上的工作时开始Job2上的工作,为了完成工作,两项作业以某种动态的方式使用相同数量的可用节点

此过程的灵活特性不但允许以更动态更适应的方式执行工作,还允许网格与各种硬件和平台一起使用

即使网格中的某些节点比其他一些节点更快或更慢一些,也不再有任何关系;它们可以在自己(比较)空闲的时间完成工作,并且结果将被排队

其间,更快的系统可能被分配更多的工作并完成更多的工作单元

出现这种不利现象是因为需要更繁重的管理费用来观察和监视各个节点,以便能够在节点间有效分配工作

在异构环境中,还必须考虑不同的平台,并开发跨支持环境兼容的应用程序

但在网格空间中,Web服务已简化了该过程,使分配工作变得更容易,不必担心这些不同

在查看Web服务的效果之前,查看HPC和网格之间的会合区域,并了解这将如何影响不同的执行模型

以上内容由大学时代综合整理自互联网,实际情况请以官方资料为准。

相关