1.4.3 数据融合[33]

1. 基本概念

数据融合(Data Fusion)的概念最早由美国学者在20世纪70年代末期提出并首先应用于军事领域。复杂多变的战争环境要求现代指挥自动化技术系统使用多种传感器并综合尽可能多的情报,以便获取全面、可靠的战场情报信息,支持指挥控制、决策过程。采用多传感器将导致系统信息量剧增且各传感器所提供信息的时间地点坐标、表达形式、可信度及不确定性、侧重点和用途等的不同,这些问题对信息的处理和管理工作提出了新的要求。数据融合就是在从信息的收集及情报获取到决策做出的过程中,处理这些信息的问题。作为支撑物联网广泛应用的关键技术之一,物联网数据融合概念是针对多传感器系统而提出的。在多传感器系统中,由于信息表现形式的多样性、数据量的巨大性、数据关系的复杂性,以及要求数据处理的实时性、准确性和可靠性都已大大超出了人脑的信息综合处理能力,在这种情况下,多传感器数据融合技术应运而生。

美国三军组织实验室理事联合会(JDL)给出了一种军事角度的定义:数据融合是一种多层次、多方面的处理过程,包括对多源数据进行检测、相关、组合和估计,从而提高状态和身份估计的精度,以及对战场态势和威胁的重要程度进行适时完整的评价。后来,JDL将该定义修正为:数据融合是指对单个和多个传感器的信息和数据进行多层次、多方面的处理,包括:自动检测、关联、相关、估计和组合。

当前,数据融合定义的简洁表述:数据融合是利用计算机技术对时序获得的若干感知数据,在一定准则下加以分析、综合,以完成所需决策和评估任务而进行的数据处理过程。

数据融合有三层含义:

(1)数据的全空间,即数据包括确定的数据和模糊的数据、全空间的数据和子空间的数据、同步的数据和异步的数据、数字的数据和非数字的数据,它是复杂的多维多源的,覆盖全频段。

(2)数据的融合不同于组合,组合指的是外部特性,融合指的是内部特性,它是系统动态过程中的一种数据综合加工处理。

(3)数据的互补过程,数据表达方式上的互补、结构上的互补、功能上的互补、不同层次的互补,是数据融合的核心,只有互补数据的融合才可以使系统发生质的飞跃。

2. 应用领域

通过数据融合,传感器系统能增强抗干扰能力、扩展时空覆盖范围、减少数据冗余、增加可信度和精确性等。随着数据融合技术的推广,数据融合技术已经被应用到包括军事、民用在内的各领域:图像融合,通过融合使多幅图片的信息融合到一幅综合多幅图片信息的新图像中,从而去除冗余或矛盾、提高信息的精准度等;工业智能机器人,通过将来自多个传感器的雷达信号、声音信号、图像信号进行融合,完成抓取、移动、触摸等动作,实现货物搬运、零件制造、检验和装配等工作;遥感,通过高维空间分辨率全色图像和低光谱分辨率图像的融合得到高维空间分辨率和高光谱分辨率的图像,对多波段和多时段的遥感图像进行融合来增加分类的准确性;故障诊断和监控,通过提取传感器信息中的特征值,使用故障诊断方法推断得到是否存在故障的决策。

3. 级别与分类

数据融合的级别共分为三级:数据级、特征级和决策级。每一级别的融合方式都有优缺点,以下将进行具体分析。

1)数据级融合

数据级融合是最低等级的融合,是直接在原始数据上进行的数值融合,在各种传感器的原始测报未经预处理之前就进行数据的特征提取与判断决策。数据级融合一般采用集中式融合体系进行融合处理。这类数据融合方法的优点在于由于只是对传感器原始数据进行数值处理,数据量上的损失较小,而且精度较高。但是也存在着一定的不足:对原始数据进行处理涉及海量数据,因此需要的计算资源较多、实时性较差;由于直接在原始数据上进行处理,原始数据反映出传感器的不确定性、不完全性及不稳定性也随之带到融合过程中,因此必须设计纠错的功能;要求传感器必须是同类的并且目标相同;数据通信要求高,抗干扰能力较差。

2)特征级融合

特征级融合属于中间层次的融合,先对来自传感器的原始信息进行特征提取(特征所反映的可以是目标的边缘、方向、速度等,然后对特征信息进行综合分析和处理。特征级融合的优点在于实现了可观的信息压缩,有利于实时处理,并且由于所提取的特征直接与决策分析有关,因而融合结果能最大限度地给出决策分析所需要的特征信息。同时,一些有用的信息可能被忽略,影响融合的性能。特征级融合一般采用分布式或集中式的融合体系。特征级融合可分为两大类:一类是目标状态融合;另一类是目标特性融合。前者主要用于多传感器目标的追踪,后者用于模式识别。

3)决策级融合

决策级融合是高层次的融合,使用不同类型的传感器观测同一个目标,每个传感器在本地完成基本的处理,其中包括预处理、特征抽取、识别或判决,以建立对所观察目标的初步结论。然后通过关联处理进行决策级融合判决,最终获得联合推断结果。这类融合方法得到的结论是数据融合的最终结果,结论往往只在假设中选出,损失的数据量最大,可能损失有用的信息,但是需要的通信量最小,实时性强。

4. 结构介绍

物联网中数据形态的异质性决定了在对数据进行处理时必须建立物联网数据组织模型,包括中心型数据组织模型、分布式数据组织模型、点对点数据组织模型和混合型数据组织模型。每种方法都有各自的优缺点。中心型数据组织方式在集中分析数据时效率高,但是单节点的存储量会成为系统的瓶颈,因此适用于实时性强、数据量小的系统。分布式数据组织方式可以通过增加节点数扩充系统存储量,理论上存储量是无限的,但是由于数据存储分散,统一处理时会增加时延,因此适用于数据量大且对实时性要求不高的系统。点对点数据组织方式比较简单。混合型数据组织方式虽然缓解了中心型数据组织方式和分布式数据组织方式的缺点,但是会使网络构建层的负担增加。

而分布式系统又有多种结构:并行结构、分散式结构、串行结构、树形结构。并行结构中多个传感器得到未经处理的原始数据后,就在节点上做出结论,然后将各局部小结论向总的融合中心上传,最后由融合中心得到最终的结论。分散式结构中,多个传感器将收集的原始数据进行融合,分别得到最终结论,将选择的过程传给上级节点。串行结构中一个传感器将对收集的原始数据进行分析,将得到的结论传到下一个传感器,下一个传感器将其与收集到的数据一同当作参数进行分析,得到的结论再传到下一个传感器,以此类推。最终结论在最后的传感器上得到。树形结构中的数据由传感器端收集上来,融合节点的组成像树一样,父节点以子节点的结论为参数进行融合,在根节点得到最终的结论。