1、科技与创新Science and Technology&Innovation762023 年 第 04 期文章编号:2095-6835(2023)04-0076-03基于聚合度热点收敛映射机制的云计算人工智能数据筛选算法研究胡 珊(广州工商学院,广东 广州 510850)摘要:为提高数据筛选效率,针对数据筛选算法进行分析,阐述了传统算法的基本应用原理和实际应用缺陷,总结传统算法存在的问题,明确算法优化思路。在此基础上针对性优化设计新型算法,重点阐述以云计算人工智能和聚合度热点收敛映射机制为基础的新型数据筛选算法。优化完成后仿真实验显示,新型算法应用效果良好,显著提高了数据处理带宽和筛选业务量。
2、关键词:数据筛选算法;聚合度热点收敛映射;云计算;人工智能中图分类号:TP311.1文献标志码:ADOI:10.15913/ki.kjycx.2023.04.021传统算法存在显著的局限性,应用性能和处理能力有限,为此应积极探讨新型算法。常规算法应用后,因为存在热度聚集问题,较易造成数据缺少收敛性,导致运算精度降低。目前数据筛选算法中,应用范围较广、应用评价较好的算法是 TSC-SF 算法和 UEG 算法这 2 种,但是实际应用效果均不理想。1传统算法的应用缺陷结合云计算技术的人工智能技术常见应用于数据筛选运算,当前技术水平下,通常采用的调度模式为“网-边缘”调度方法。分析现有资源规模、特点,
3、以网络数据为依据,利用云中间件构建数学模型,通过模型处理数据资源和业务。通过模型分析可确定调度函数,然后以此为依据定义筛选数据的原则。当前技术方案应用时主要为经济调度模式,通常将云中心作为数据库,在数据库中存储大量决定参数,包括筛选进程、中间件以及带宽等。受此影响,在实际调度过程中,各个云中心调度模型时所耗费的成本存在显著差异。TSC-SF 算法即时间片累积调度筛选,UEG 算法即超欧里几何数据筛选。TSC-SF 算法采用分配时间片方法轮询调度数据,然而实际应用中缺少大规模的调度参数参与,导致其筛选性能低于预期。UEG 算法使用时,业务收敛实现方式是拓扑映射,但是在实际应用中供给侧至用户侧未能
4、予以有效资源分配,导致UEG 算法实际应用时筛选质量、筛选效率不理想。因此,优化智能数据筛选算法具有必要性1。2数据筛选算法主要优化思路想要将用户任务成本降低至可能范围内的最低水平,必须大量占用云中心资源,影响系统性能,因此目标用户任务通常难以以最低成本完成资源调度。在经济调度应用时,对用户数据质量要求较高,在支付层处理数据时,通常比较重视支付稳定性评价,积极提高支付效率,但是在任务匹配数据时,通常侧重于促进及时匹配以及提高匹配效率,导致算法应用效果较差。智能数据筛选模式不同时,需要动态监控供需侧情况,促进供需平衡。与此同时,应明确用户需求,从而动态驱动云中心资源,使其与用户需求有效适配。基于
5、此种背景,优化设计新型经济调动方案,新算法以调度时间片、用户需求成本为基础条件,促进智能化动态驱动匹配,在裁决任务时,调度参数取决于用户需求聚合度。在此基础上,采用热点收敛映射处理方法整合聚合成本因素、一般成本因素以及中心资源,映射处理云中心资源时采用 2 组调度序列模式,裁决模式为“时间片-成本”模式,以期通过此种算法优化实现数据筛选提质增效。在应用经济模型时,应保证云调度中心尽可能利用现有资源满足用户需求。达成此目标后,应积极降低系统资源消耗,从而保证系统运行性能良好。通过交互方法筛选数据可满足上述要求。基于云计算技术筛选数据时,需要保证算法性能符合数据吞吐容量要基金项目广州工商学院高等教
6、育教学改革项目(专任教师专项)“学科交叉视域下新工科学生信息技术核心素养提升的研究与实践”(编号:ZL20221028)Science and Technology&Innovation科技与创新2023 年 第 04 期77求,具有较好的数据可用性,并且一定确定数据筛选时间等。通过设置相关参数调度用户。本文算法优化中,选取 3 个重要参数,分别为用户可靠度(WP)、时间片(TP)、聚焦成本(KP)。对(WP)参数、(TP)参数与(KP)参数进行抽象化处理,得出裁决函数(WP)参数、(TP)参数、(KP)参数。调度资源过程中使用裁决函数描述调度经济成本,然后分析经济成本得出最优解,即作出裁决。
7、云中心可并行处理多个调度任务,当多组用户需求等待处理时可采用上述裁决函数实施并行处理,以此为背景设计并发调度模型作为数据筛选工具2。在设计模型时,首先设定系统基础运行原则,并且匹配模式采用“供给侧-需求侧”模式。调度用户需求时,当用户任务大于 1 个,并且任务之间无显著相互影响,可进行并行调度。选取用户任务时,可通过抽象化处理全部任务为(TP)性能、(KP)性能和(WP)性能。云中心在进行资源调度时,采用锁模式处理用户任务,在此种模式中,调度用户任务时用户任务与时间片为一对一关系。轮询调度原则是时间片的基础运行原则,用户需求未处理时,系统自动锁定相关资源。此种调度属于“N-M”调度。在此种调度
8、中,云调度中心作为供给侧主体,中心在执行任务时主要预期是保证现有资源得到充分利用,同时有效控制时间片成本,从而积极提高经济效益。用户作为需求侧主体,其在调度过程中任务目标是积极降低聚焦成本,同时保证调度高效率完成。调度过程的主要目标是降耗、提质、增效。假设系统中当前存在 N 个用户任务等待系统筛选处理,资源分配情况为 Ti,聚焦成本(KP)、时间片(TP)符合用户初始化要求。在调度时,由高到低排序不同任务对应的资源量。当业务为B0时,其对应的时间片为 Ti0,对应的资源量为 T0,对应的聚焦成本为K0;当业务为 Bn-1时,其对应的时间片为Tn-1,对应的资源量为 Tn-1,对应的聚焦成本为
9、Kn-13。3算法优化设计时间片即 Ti描述为(TP);聚焦成本 K聚焦为(KP),即 K聚焦=(KP);业务(work)使用 W 表示,用户可靠度描述为(WP)。云系统运行中,第 j 个时间片描述为 Tij,第 i 个业务描述为 Wi,Tij节点处理Wi时,Wi预申请资源用 x(i,j)表示。假设 Tij范围系统资源总量用 y(j)表示,此时资源分配时符合如下约束条件:ijyjix)(),(1)云系统预分配时间片描述为 T(i),Wi与的 t(i)需求匹配的模型为:iiTit)()(2)资源 j 处 Wi需要付出代价描述为 u(i,j),全部代价描述为 u(j),同时 u(j)符合如下条件:
10、),()(jiuju(3)使用 K 描述成本,使用 P 描述利润,权重描述为w。K聚焦直接受到成本影响。K聚焦与业务热点呈正相关。模型参数以模型(1)模型(4)参数为依据,数据业务聚焦成本描述为 K业务聚焦,K业务聚焦权重描述为:ijyjixw)(),(4)时间片描述为(TK),影响(TK)耗费代价的核心因素为系统筛选时间,即 T系统筛选。业务开支中时间片权重为:iiTitw)()(5)第 n 组业务资源需求完成数量描述为 L(i,n),时间片冗余使用 D 描述,根据模型(1)、模型(2)、模型(3)进行模型参数设置。由此可构建如下模型:-=-DjixniLitiTitwPTi),(),()(
11、)()(6)业务收敛程度采用用户可靠度表示,描述为(WP),系统业务处理水平与(WP)呈正相关。时间片在系统中运行期间完成的业务量描述为 A1,当前业务总量描述为 A2,由此创建模型:=-21AAjiujwuPW),()(7)叠加模型(4)模型(6)可得出系统调动效率,描述为(C云P),符合如下模型关系:C云P=T+KP+WP(8)=3211,)(iiw网络资源分配宏观预期是基于固定资源量,服务于任意业务即 W(i)。在此种情况下,C云P=T+KP+WP 应符合如下条件:0)()()()()()(j,xxj,xuiuTitjyj,ixnii科技与创新Science and Technology
12、&Innovation782023 年 第 04 期在构建该模型时参数设置与模型(1)模型(8)一致。通过拉格朗日法针对该模型求出最优解,得出拉格朗日函数:L=1TP+2K+3WP针对该函数设定如下条件:dLy(j),Ti,u(i)=0利用该模型计算得出最优聚焦成本 K聚焦与时间片Ti。优化供给侧资源,根据模型(1)模型(8)参数设置条件构建如下模型:),(),(jixjiulgmaxijyjxx)(),(结合上述模型可得出如下拉格朗日函数:),()(),(),(jixjyjixjiul-+=21lg一阶微分处理该模型,从而得出供给侧资源成本P资源、最优时间片 Ti最优。4算法应用效果检验4.
13、1仿真实验方法采用仿真实验方法进行优化后算法应用效果检验。分别应用本文优化后算法、TSC-SF 算法以及 UEG 算法 3 种算法,进行对照分析实验,评价本文优化后算法的实际应用性能。软件工具选用 MATLAB,构建仿真实验环境,实施仿真实验4。4.2实验参数设置仿真指标主要选择 2 项内容,分别为数据处理带宽与数据筛选业务量。在设置仿真参数时,业务维持时间参数设置为 10 h,云资源池密度参数设置为 10 以上,设置处理速率为 96 Mbps 以上,资源更新周期参数为超过 512 s。4.3算法应用效果和优势筛选业务量分析显示,本算法具有筛选业务量更大、筛选效率更高、增幅显著的优势。资源池中
14、分为 2 种资源,分别为低密度资源与高密度资源,如图 1 所示。图 1业务量筛选情况解读图 1 信息可知:当云资源池满足不同密度条件时,采用本文建模数据筛选算法时,数据筛选结果与 TSC-SF 算法、UEG 算法筛选结果存在一定差异。应用本文算法后,总体筛选业务量呈现持续增长趋势,其他 2 种算法虽然也可见此种趋势,但是增幅显著低于本文算法。经过分析认为,此种表现的核心诱因是本文算法中结合聚合度热点收敛映射,在使用模型运算处理数据时优先处理高聚焦度用户,即热点用户。本文结合热点收敛映射实现算法优化,降低热度聚集产生的消极影响,促使数据有效收敛。应用此种算法筛选目标数据时,多方位应用拉格朗日法促
15、进配置均衡,促使业务筛选处理高效率完成。数据处理带宽方面,针对不同密度的数据资源,应用 TSC-SF 算法、UEG 算法效果相对较差,本文算法应用效果显著。带宽测试结果显示,本算法带宽水平较高,同时稳定性较好。TSC-SF 算法、UEG 算法存在波动显著、稳定性较差的问题。本文通过特殊收敛映射机制应用,同时进行拉格朗日法进行算法优化,与传统算法相比显著提高了业务处理效率,可更大规模地并行处理业务,具有显著应用优势。5结论综上所述,当前数据筛选运算中主要采用 TSC-SF算法、UEG 算法,但是上述 2 种算法均存在一定弊端,处理数据时带宽、筛选业务量低于预期。本文从当前算法缺陷出发,采用聚合度
16、热点收敛映射机制构建新型算法,优化供给侧与需求侧资源匹配,分析用户可靠度、聚焦成本与时间片,同时进行拉格朗日法促进算法优化,提高了算法应用效率,应用效果显著。参考文献:1张琳,张鸿刚,刘茜萍.一种基于多元数据的假位置筛选算法J.南京邮电大学学报(自然科学版),2021,41(6):47-56.2王海红,魏祥泉,田雪颖,等.空间海量异构遥感数据快速筛选和智能技术J.载人航天,2021,27(4):465-473.3寇燕明,迟晓晴,王艳慧.一种基于假设检验的数据筛选算法J.统计与决策,2020,36(8):21-26.4鞠永慧.基于机器学习的加密网络数据分类识别关键技术研究与实现D.郑州:战略支援部队信息工程大学,2020.作者简介:胡珊(1981),女,湖北黄冈人,本科,讲师,研究方向为计算机网络、智能信息处理。(编辑:王霞)资源池数量/个资源池数量/个