
针对小伙伴们关于无量纲化处理的疑问,今天我们将对常用的数据无量纲化处理方法进行一个详细的汇总说明。SPSSAU提供了17种数据无量纲化处理方法,如下图所示:
一、定义
无量纲化,也称为数据的标准化、规范化。由于不同指标之间由于量纲不同导致的不具有可比性,因此需要进行无量纲化处理。它是通过数据变换来消除原始变量的量纲影响的方法。消除量纲影响后再进行后续分析。
二、解释说明
例如:某市医院建设投入金额为5千万,最终出院率为92%。在同时使用这两个指标进行比如根据距离计算优劣时,会出现单位问题和方向问题。单位问题指的是从数量级上看,5千万与92%二者之间相差很大。方向问题指的是从数据方向看,希望投入越低越好,出院率越高越好,二者方向不一致。如果不解决数据的单位问题和方向问题,那么数据之间是不具有可比性的。我们需要将指标进行无量纲化处理后,再进行接下来的分析。这17种无量纲化处理方法,分别针对单位问题和方向问题有不同的处理方式。
具体应该使用哪一种处理方式呢?其实并没有固定的要求,而是需要结合实际情况或实际研究来确定。
在进行熵值法计算权重时,通常需要处理数据的方向问题,可以使用正向化、逆向化处理方式;但对于数据的单位问题,可以处理也可以不处理,对分析并没有太大影响。如果要处理的话,可以选择归一化处理方式。
如果单独想对数据量纲进行处理,那么通常默认使用标准化或者归一化最多。标准化直接把数据压缩且让其有一种特质即平均值为0标准差为1的特质;归一化把数据压缩在[0,1]之间。也可以使用中心化让数据有一种特质即平均值为0。
使用SPSSAU进行无量纲化处理非常方便,只需要在SPSSAU数据处理界面选择“生成变量”,批量选中需要进行无量纲化处理的指标,选择相应的无量纲化处理方法,确认处理即可完成。
SPSSAU共提供17种无量纲化处理方法,其中比较常用的包括标准化、中心化、归一化、均值化、正向化、逆向化等等。接下来我们将逐一解释这些处理方法:
三、各种无量纲化处理方法的详细说明
1. 标准化(S):让数据呈现出一种特征,即数据的平均值一定为0,标准差一定是1。针对数据进行了压缩大小处理。
2. 中心化(C):针对数据进行了压缩大小处理,同时还让数据具有特殊特征(平均值为0)。
3. 归一化(MMS):让数据压缩在[0,1]范围内。当某数据刚好为最小值时,则归一化后为0;如果数据刚好为最大值时,则归一化后为1。
4. 均值化(MC):需要特别说明一点是,此种处理方式有个前提,即所有的数据均应该大于0。
5. 正向化(MMS):对正向指标保持正向且量纲化。当某数据刚好为最小值时,则归一化后为0;如果数据刚好为最大值时,则归一化后为1。正向化和归一化的公式刚好完全相等,但正向化强调让数字保持越大越好的特性且对数据单位压缩。
6. 逆向化(NMMS):对逆向指标正向且量纲化。随着X的增大,分子会越来越小,那么就对逆向指标逆向化处理之后就会得到一个这样的特征,即数字越大越好。相当于将逆向指标逆向化后,新的数据为数字越大越好,这样便于进行方向的统一。
7. 适(M):以K为适度值作为参考标准,比如K=1时,数字越接近于1,适后数字越大。
8. 区间化(Interval):让数据压缩在[a,b]范围内,a和b是研究者自己希望的区间值。此公式会让数据永远的保持在[a,b]之间。SPSSAU默认a为1和b为2,将数据压缩在特定区间内研究进行评价使用特定标准便于不同行业的项目比较分析及初步研究展现该项竞争趋势动态运用市场争夺主动权反应自有业绩状态市场结构信息一目了然行业横向对比分析能够一眼洞悉行业竞争趋势结构分化现状表现相对业绩市场地位等核心信息点辅助决策支持行业分析人员快速做出精准决策判断等目的便于行业分析人员精准决策支持行业发展市场把控业务方向选择市场趋势把控行业风险预警行业竞争对手监测分析企业并购估值分析投资决策判断等等的使用诉求和作用以及视角感受企业内部结构化信息与领导驾驶洞察的重要作用进一步增强企业发展潜能与动力使企业蓬展并不断开拓其创新的思维逻辑与市场价值作用效果不断发散创新突破为企业创造更多市场价值与发展机遇实现更多商业价值并赋能驱动企业发展的潜在价值和驱动力最大化提高企业竞争优势与价值等等以得到正向化与逆标准化的处理和研究方向指标的相应数字化辅助其定性研究与定量研究的判断使评价结果更接近直观趋势推动社会创新与和谐智能化跨越式的深度成长逐步
