【论文摘要】 当前国内学者已先后提出了许多行业损害预警体系,但体系中指标的选取基本建立在统计分析方法上,没考虑指标间的非线性相关性;且指标选取主观性较强,数量较多,使预警体系的实用性和准确性不高。本文旨在通过我国对外发起的化工行业反倾销调查案例的收集和整理,用收集到的31个相关样本建立决策表,利用粗糙集理论对指标进行约简,从而找出关键预警指标。 【论文关键词】 化工行业 损害 警兆指标 粗糙集 一、文章背景 从1979年到2005年底全球起诉我国倾销案件共有663起,我国连续十年成为世界上遭受反倾销案件最多的国家,每年造成300亿~400亿美元的损失。而我国对国外发起的反倾销案件很少,据统计从1997年以来我国累计发起了41起反倾销、涉案金额64亿美元;涉及到全国的23个省市和电子、化工、造纸、轻工业和冶金5个行业。其中化工案件就有29起,2005年各项过度性非关税措施都将取消,化工产品平均关税必须降到6.9%,进口关税的下调将使化工进口产品以更低的成本进入我国市场,从而影响到我国国内相关化工产品的产品竞争力。这就需要我们加强反倾销研究,建立反倾销预警机制,而预警系统中警兆指标的选取至关重要,直接影响预警系统的预警效果。 二、指标的初步选取 笔者以经济因素是进口国企业提起反倾销申请的主要原因, 经济、政治和社会等多种因素共同影响进口国政府的反倾销裁决结果这一理论为基础,初步选出的指标有:产量增长率、销量增长率、产能增长率、销售价格增长率、市场份额变化幅度、开工率变化幅度、就业率变化幅度、人均工资增长率、库存增长率、劳动生产率变化幅度、投资收益变化幅度、利润增长率、销售收入增长率、进口产品国内市场份额变化幅度、进口数量增长率、进口产品价格增长率等16项指标。显然不能用这么多指标都作为预警系统的警兆指标,否则会影响系统的预测能力和可操作性。这就需对指标进行简化,传统统计方法不适合一些指标间存在相关性,一些指标由于采集的困难导致数据不准确的情况,因此,本文引入粗糙集理论对指标进行约简,能克服以往方法的不足。 三、数据离散化 因为粗糙集只能对离散化的数据进行处理,因此要首先对样本集的指标数据进行离散化处理。本文采用的离散方法是利用竞争学习神经网络进行离散。用Matlab的图形用户界面GUI来设计竞争学习网络对各指标数据离散化,本文将数据离散为四类。 将每个属性的各个连续值组成的向量(如a的连续属性向量为: [147.91-16.18-58.51 41.47 49.43 57.5-46.94 5.14 10.42-9.92 27.18 7.31 9.41 18.53-6.88-10.51-8.8-7.68 2.55 6.17-30.03-50.33 296.64 10.59-17.41-4.75-15.61 2.71-3.68 12.73-40.41 ])作为网络的输入,设定神经网络神经元的个数为4;Kohonen学习率取0.O1;阀值学习率取0.001。根据训练以后神经网络的输出可得到各属性离散结果。如a=[3 1 1 4 4 4 1 2 2 2 4 2 2 2 2 2 2 2 2 2 1 1 3 2 1 2 1 2 2 2 1]。其他属性的离散化处理方法与之相同,可得到数据离散化后的决策表。 四、属性约简 利用知识约简可以客观、科学的降低样本的指标个数。本文知识约简的方法采用差别矩阵法。由于差别矩阵是对称矩阵,因此,只需要计算矩阵的一半元素,即只考虑区分矩阵的下三角(或上三角)部分就可以了。基于区分矩阵的决策表属性约简的方法,可以通过以下步骤进行: 第一步:计算决策表的分明矩阵;第二步:建立每一列相应析取逻辑表达式:Lij=Vai (ai∈cij);第三步:将所有列的析取逻辑表达式L,进行合取运算,得到一个合取范式:L=∧Lij (cij≠0);第四步:将合取范式转换为析取范式的形式,得 L’=∨Lij;第五步:输出属性约简的结果。析取式中的每一个合取项就对应一个属性约简的结果,每个合取项中所包含的属性组成约简后的条件属性。现举例如下: 由于区分矩阵是对称矩阵,故我们仅需计算矩阵的一半元素。上表对应的区分矩阵函数为 因此,此知识表达系统有两个约简{a,b}和{b,d},核是{b}. 本文的属性约简应用粗糙集工程软件ROSETTA来完成。最后可得到区分函数为: 由上式可知,本文的决策表有两个约简,分别是{b,d,e,g,k,l,m,o,p}和{a,b,d,e,k,l,m,o,p}所以该决策表的核是{b,d,e,k,l,m,o,p}。 五、结论 本文把粗糙集理论用在化工行业损害的预警指标的提取上,通过案例收集整理建立决策表,数据离散化,属性指标约简,最后提取出八个警兆指标:国内化工行业销量增长率、销售价格增长率、市场份额变化幅度、进口产品国内市场份额变化幅度、进口数量增长率、进口产品价格增长率、利润增长率、销售收入增长率。这样大大简化了指标体系,可增强以后建立的预警系统的预测能力和可操作性。