用户登陆 用户注册
您的位置:首页> 技术文章>内容正文
一种用于实时过程的神经网络在线自学习逆控制算法
[正文]:1 引言近年来,人工神经网络 (简称神经网络或nn) 越来越多地应用于工业自动化控制领域。
由于神经网络能够充分逼近任意复杂的非线性关系和能够学习与适应严重不确定性系统的动态特性,因此,采用基于nn人工智能控制方法,引入自学习、自适应功能而构成的实时系统,在处理那些实时性要求高且难于用模型或规则描述、随机性事件多、非线性严重、存在多个不同类型输入和输出的实时过程方面,显示了极大的优越性。
众所周知,由于神经网络的学习需要耗费较长的时间,其实时应用策略仍是控制领域研究的热点。
通常,神经网络在过程控制中用作控制器模仿器或过程模仿器,构成基于神经网络的控制系统。
目前,这种控制系统常采用软件方法实现。
然而,神经网络的学习过程是一个慢过程,而作为一个实时系统,其主要目标是保证系统响应的及时性,必须同时满足逻辑正确性和时间约束两个条件。
因此,对于快速有时甚至是慢速的实时过程,特别是对于有强实时任务(即要求该任务在时限内完成,否则其结果将失去可用性的任务)的过程,神经网络的学习慢速性是nn实时控制算法实现的难点。
一般采用nn离线学习与在线控制相结合的方法。
在线学习与控制的方法大多局限于在一个控制周期内串行完成的算法。
本文在nn软件实现上结合中断处理技术,使网络的学习与控制分离和并行嵌套,提出一种用于实时过程的神经网络在线自学习逆控制算法,用以处理难于建立对象模型 (包括快速和强实时) 的过程。
2 基于nn的实时过程控制原理实时过程控制系统是指该系统实时地从外界获得被控系统的当前状态,进行预定的处理,并根据处理结果对外界被控系统进行及时控制,使其处于要求的状态下。
实时过程控制系统的模型是一个反馈环结构。
如图 1 所示。


点击查看大图片
2.1 系统nn基本结构采用具有非线性特性函数的神经元及多层非循环连接模式的神经网络(nn)和反向传播(b-p)学习算法。
根据一般实时过程的特点,设神经网络输入层共取n个神经元,分别代表输入端x1,x2,···xi···xn。
完成将外部各工艺参数输入神经网络的功能;中间层取1∽2 层共设2n+m个神经元,代表神经网络的感知层;输出层取m 个神经元,代表过程的输出参数y1,y2,···yj,···ym。
从外部特性看,网络相当于一个n输入m输出的多变量传递函数。
而其内部特性却充分反应了对象的动力学特性。
系统nn基本结构如图 2 所示。
其中:(a)网络连接模型, (b)神经元模型。

点击查看大图片
在图2所示的神经网络中,某一个神经元的结构如图2(b)所示。
其中xi为输入信息,wi为权值,θi 为阈值,f是表示神经元活动的特性函数,f刻划了神经元输入信号与输出信息之间对应的关系 。
2.2 网络权值学习算法神经元特性函数取s型函数,即:f(x)= 1/(1+e-x) (2-1) 网络采用的b-p算法是前向计算输出与反向传播误差相结合的进行权值调整的过程。
设网络中第i层某个神经元与后一层第j层的连接权值为w[ij],输入为x[j] ,输出为x[i]
由图3可得:xi =f(xi )=1/(1+e-xi+θi) (2-2)xi =∑wij ·xj (2-3)误差反传采用改进的delta权值调整公式[4] :wij(n+1)=wij(n)+δwij(n+1) (2-4)δwij(n+1)=η·δj·xi+α(δwij(n)) (2-5)式中:η为学习率(取η=0.1~0.9);α为动量系数(取α=0.1~0.8);δj为神经元输出误差。
采用基于系统误差梯度的方法调整权值 [4] ,即:当 j 为输出层时: δj=-( xi -xj)·xj·(1-xj) (2-6)当j为中间层时:δj=(∑δk·wjk)·xj·(1-xj) (2-7)2.3 nn在线学习控制结构系统以过程输出量y为控制对象,以y=ysr(给定常数)为控制目标,以 u过程控制量,以事先离线进行过权值初始化训练、并且在生产过程中不断进行在线学习的神经网络系统辩识模型nn为控制模型,并由此辩识模型计算某一时刻所需控制量u值。
构成基于神经网络的实时控制系统,实现对yr的自动跟踪。
系统控制原理框图如图3所示。
图3中,p为实时过程的实际模型;bp为输出误差向网络内部连接权值反传调整权值的算法。
s为网络权值传送软件开关。
2.4 过程模型在线自学习系统首先采用离线训练的方式形成网络的连接权值矩阵初始值,包括建立各种不同神经网络模型结构参数,以提高在线学习速度。
系统投入实时控制后,程序在一定条件下启动nn自学习功能,将实时采集的工艺参数通过特定处理后,作为训练样本输入网络,进行连接权值的调整。
由于nn模型不需要知道对象的任何先验知识,在限定nn拓扑下,其连接权值不仅规定了模型的参数,同时也规定了模型的结构性质,因此,用这种方式训练出来的的神经网络模型,可以充当对象的模仿器[1]。
系统不断地根据生产过程中的各种相关参数,反复调整网络权值,在线建立过程逆模型。

点击查看大图片
2.5 模型逆控制过程模型模仿网络nn2投入实时控制前经过离线训练,使系统在投入控制后的初始阶段有较好的稳定性并使nn2能较快地完成以后的在线学习。
在nn2不断学习和nn1调节控制量的过程中,nn2输入输出特性能够越来越准确地模拟实际过程模型的输入输出特性。
经若干个模型学习周期,nn2 学习误差达到期望值,nn2 的连接权值暂时固定下来。
当过程输出与系统设定的偏差大于期望值时,nn2的连接权值传送给调节器模仿器nn1,作为调节器计算新的控制量,同时,启动在线学习开关 s,nn2开始进行新的学习。
当系统产生控制中断而进入控制周期,系统先对过程状态参数进行一次实时检测,根据当前的过程状态由nn1对控制量进行调节,完成一次在特定工艺状态参数下的控制量的动态设定。
当nn充分接近实际模型,即:nn2=p-1时,由于nn1=nn2,nn1·p=p-1·p=1,则y=ysr,即系统可实现对给定目标值的跟踪。
3 软件实现对实时控制系统而言,软件设计应着重考虑nn学习算法、样本形成、网络推理之间的时序问题。
系统采用内部中断与外部中断相结合的方式处理时序问题。
软件设计两个中断处理子程序,其中一个为定时与采样中断处理子程序,

点击查看大图片
采用修改机器内部定时中断向量的方法,另一个为实时控制及样本提取中断处理子程序。
采用外部脉冲信号产生中断申请的响应方法。
网络学习则在主程序的大循环中进行。
系统投运前,nn通过离线训练获初始知识。
离线训线的样本可以利用工艺过程中的历史数据产生,或由该领域专家的知识形成。
实时控制中nn以在线学习方式运行。
学习是一个的大循环,不断以样本子集缓冲区的实时样本对网络进行训练。
而样本缓冲区的实时样本的刷新是由外部中断服务子程序根据样本提取逻辑进行的,系统实时地将实际过程中产生的新样本替换样本缓冲区中最先前的样本。
同时,一旦时间达到某一设定的周期,系统将样本缓冲区的样本存入硬盘作为历史样本供以后使用。
内部中断服务子程序采集的现场数据供显示用,并且提供样本提取逻辑所需的计时信息。
采用这种大循环进行nn学习;内部时钟定时中断进行数据采集与处理并提供样本获取和控制时序逻辑;外部中断请求进行样本提取和实时控制的程序结构,充分利用了cpu的大量空闲时间,即照顾了学习的耗时性,又满足了数据采集的及时性和控制的适时性。
实时控制流程及中断服务子程序见图4。
其中:(a) 实时控制主模块; (b) 实时数据采集及定时中断处理子程序;(c)控制输出及样本提取中断处理子程序。
4 计算机仿真实例结果 计算机仿真实验程序用c++编制,在486微机上运行。
系统仿真所用数学模型为螺纹钢筋轧后控冷工艺过程的一个多输入单输出 (根据生产实际数据产生的回归分析模型)[5,6]:ts= -4.1·qy -156.8·t -4.6·tw +29.3·φ+0.21·tf +50·c +850 ( 4-1)其中过程输出为y = ts ,目标值yr = 620 。
设nn输入 x= 123; t , tw , φ , tf , c , ts 125; ;nn输出u = qy 。
网络为6×12×12×1结构,运行前离线训练重复次数为7000次,学习时间为8分钟,网络输出总误差为0.00005。
经过训练的nn用于仿真运行,模拟在线自学习控制,学习 时间小于0.5秒。
仿真运行结果见表1。
表中数据经归一化处理,以保证网络输出值在(0,1) 区间 内;其中qy、ts为初始值,qy、ts为执行的结果值。

点击查看大图片
由表1可知,系统能够在钢筋终轧温度tf变化时,自动改变水量设定值qy,使其自回火温度稳定在目标值tsr=602℃ (误差小于1℃)左右。
仿真结果表明,这种基于nn模型自学习的逆控制方法,有较强的自学习、自适应能力。
在处理一般非线性、随机性、时变及多变量输入输出的实时过程方面,有较好的开发应用前景。



网站首页 培训课程 维修指南
技术文章 家电专栏 供应信息
求购信息 培训资讯 展会信息
电脑专栏 教程下载 资料下载
常用软件 PLC教程 PLC资料
变频伺服 低压电器 维修资料
人机界面 自控仪表 工控机类
文章标题: 搜文章
中国工控资源网手机版 2012
电话:010-67577139 13811659603
培训咨询QQ:657167934 471895637 销售咨询QQ:623769457
联系邮箱:zggkzyw@163.com
 京ICP备11002135号
报时(2026-04-03 14:31:06) 流量统计