当前位置:首页 > 物联网 > 《物联网技术》杂志
[导读]摘要:随着物联网技术的不断发展,多媒体数据的存储及管理问题日益突出,传统的数据库技术已无法对其进行有效的管理。在此背景下,为了对多媒体数据库检索技术进行深入的研究,文章简要论述了什么是多媒体数据库,重点讨论了面向物联网的多媒体数据的特征,介绍了基于内容的检索技术,并分别对音频、图像和视频的检索技术做了详细探讨,最后探讨了面向物联网多媒体数据检索的策略问题,以期对现实面向物联网的多媒体数据检索具有指导意义和实用价值。

引言

伴随着信息高速公路的兴起,多媒体正在深入我们的生活,物联网时代也离我们越来越近。在对文字、图形、图像、视频及声音等多种媒体信息进行综合处理时,传统的信息检索已经不能满足人们的需求,信息的查找和检索要求也越来越高。

1面向物联网的多媒体数据库特点

多媒体数据库是多媒体技术与数据库技术相结合而产生的一种新型数据库,是指数据库中的信息不仅涉及各种数字、字符等格式化的表达形式,而且还包括多媒体的非格式化的表达形媒体数据的存储、读取、检索等功能的数据库系统。多媒体数据库继承了传统数据库的一些优点,但数据管理要涉及到更复杂的处理。与此同时,继计算机、互联网之后,物联网带来了信息技术的第三次革命,经过综合分析,物联网环境下的多媒体数据与传统的数据相比,往往具有一些独立的特性。

1.1数据的非结构化

声音、图像、影视等数据基本上都是二进制串。这些数据从其本身看不出任何结构,因此称为非结构化数据。各种媒体的数字化存储形式称为多媒体数据。因为这些数据往往通过传感器输入计算机,又称传感器数据。媒体数据如果不另加一些描述和解释,一般很难利用对数据的描述和解释。这些特征使得传统的关系型DBMS难以有效地管理这些类型的数据,从而促使我们去研究、引入新型的DBMS系统。

1.2实时,性和快速更新

物联网技术是基于各种感知技术的应用。其上部署了多种类型传感器,不同类型的传感器捕获的数据内容和数据格式各不相同。由于每个传感器都是一个信息源,采集信息在一定频率的周期性环境下,传感器获得的多媒体数据也不断更新,具有实时性。

1.3数据量大且维度高

物联网是一种建立在互联网上的泛在网络。物联网技术的重要核心仍在互联网,通过各种有线和无线网络与互联网融合,将物体的信息实时准确地传递出去叫多媒体数据量一般都很庞大。虽然采取了数据压缩技术,但压缩后的数据量还是很大。在物联网上的传感器定时采集的信息需要通过网络传输,所以,这样的海量数据对多媒体数据库的存储及检索提出了更高的要求,同时还要考虑海量数据传输标准的统一。

2面向物联网的多媒体数据库检索

多媒体数据包括文字、图像、视频、音频等不同格式的信息内容。随着互联网的发展,传统的基于结构化的关系数据库检索方式并不适合非结构化的多媒体数据的检索,人们对多媒体数据的检索提出了新的要求。基于内容的检索就是从媒体数据中提取出特定的信息线索,然后根据这些线索从大量存储在数据库中的媒体中进行查找,检索出具有相似特征的媒体数据来。它可以在更深层次更有效地利用存储的多媒体信息。

基于内容的检索是一个逐步求精的过程[3]:第一是从媒体内容中提取信息线索。基于内容的检索直接对图像、视频、音频内容进行分析,抽取特征和语义,利用这些内容特征进行索引,并进行检索。第二是相似性匹配,就是将查询特征与特征库中的资料按照一定的匹配算法进行形似匹配,把满足一定相似性的一组候选结果按相似度大小排列放回给用户。第三是特征调整。对于系统返回的查询结果,用户可选择满意结果,或从中选择一个示例,经特征调整形成新的查询。第四,逐步缩小检索范围,直到用户满意。其具体过程如图1所示。

2.1基于内容的图像检索技术

基于内容的图像检索技术是指利用一定的算法提取图库中图像的颜色、纹理、形状等特征进行检索。用户提供一个样例图像,系统提取样例图像的特征,然后跟数据库中的所有图像的特征进行比较,并将与样例特征相似的图像返回给用户。

2.2基于内容的视频检索技术

视频主要由镜头组成,镜头由一系列连续的帧组成,帧是一幅静态的图像,是组成视频的最小单位。基于内容的视频检索的关键步骤是视频的分割,分割完成后,也就确定了每个镜头的开始和结束位置。每个镜头中的一系列帧的差异很小,可以从中选择出关键帧来描述镜头的关键图像,对该镜头的检索可以转换为对该关键帧的检索。由于视频中的关键帧就是一副静态的图像,因此,可以使用类似图像检索的方法进行检索。

2.3基于内容的音频检索技术

基于内容的音频检索可以提取音频数据中的特征信息,对不同音频进行特征匹配,从而达到检索的目的。一般以韵律、和音、旋律以及音调、响度、音色等感知特征进行特征值检索,根据查询索引和数据库中音频索引之间的相似性,来对音频片段进行检索。除实际发声词汇外,包含在语音中的其他信息,如发音者的身份和情绪都有助于语音索弓I和检索。

3面向物联网的多媒体数据检索策略

针对多媒体数据的特点,分析物联网环境中信息检索遇到的问题,一方面可以考虑提高服务器的处理能力、扩充服务器的存储容量,另一方面,则可以考虑优化查询策略以提高检索速度。优化策略可以从三个方面来考虑。

3.1临时表缓冲策略

对数据表操作时,传统的方法是直接对表进行关系运算,然后从中选择满足要求的结果集。而采用临时表的做法,则虐先对大数据表进行查询,将满足条件的数据预先读取到临时表中,然后将对源数据表的访问转换为对临时表的访问。将操作的数据集预先读取到临时表中会给系统带来额外的开销。但是,在一般情况下,临时表中的数据集要远小于源数据表中的数据集,因此,在对于海量数据进行连续操作或者频繁访问时,采用此策略可提高系统的总体性能。

3.2数据的降维处理策略

人们在物联网世界获得的数据量正以指数形式快速增长,为了减轻系统检索的负荷,可以对数据进行降维处理。结合具体业务需求,在尽可能多的保留初始数据的前提下,将数据的维数降到一个合理的大小,再将降维处理后的数据送入信息处理系统,这对海量数据的检索是行之有效的。降维算法主要分为线性降维算法和非线性降维算法。降维的实质就是寻找投影变换,即从高维空间到低维空间的变换。同时,降维处理也是一些智能算法的必要步骤,该策略对物联网数据检索中的智能处理是很有帮助的。

3.3情景感知的语义检索策略

物联网是通过射频识别、红外感应器、全球定位系统、激光扫描器等信息传感设备,把任何物品与互联网连接起来,进行数据交换。基于感应网络,可以从大规模的海量数据中获取用户的位置数据、邻接数据、通信数据和行为数据等,并对如此海量的移动数据进行实时挖掘,推导出蕴含在数据中的规律,感知用户的情景环境,发现用户的行为模式,将最能满足用户需求的结果提交给用户,以实现用户所得即所需,从而有效提高物联网信息检索的质量。

4结语

随着物联网技术的应用发展,人们对此环境下多媒体数据库的检索需求也越来越迫切。“数据灾难”成为急需解决的问题。利用云计算、模式识别等各种智能技术,可以从传感器获得的海量信息中检索、加工处理出有意义的数据。随着理论研究和时间探索的不断深入,面向物联网的检索技术一定会更加完善,充满智能的物联网多媒体数据库的应用也将逐步推向各个行业和领域。

20211018_616c5a5d90edf__面向物联网的多媒体数据库检索技术应用研究

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

科睿唯安《全球创新Top100》以该公司拥有的专利数据库为基础,根据“成功率”、“地域投资”、“影响力”、“稀缺性”四个评价维度对知识产权进行分析,评选出全球百强创新企业和机构。该评选从2012年开始每年实施一次,202...

关键字: 数据库 5G 人工智能

北京——2024年2月26日 日前,领先的IT市场研究和咨询公司IDC发布《IDC MarketScape:全球云计算和以应用为中心的市场供应商评估》1报告,亚马逊位列“领导者”类别。报告指出,“亚马逊云科技Market...

关键字: 云计算 数据库 存储

北京——2023年12月27日 在2023亚马逊云科技re:Invent全球大会上,亚马逊云科技表彰了在过去一年中,利用亚马逊云科技的技术和服务在推动客户创新及解决方案构建方面做出杰出贡献的卓越合作伙伴。8家亚马逊云科技...

关键字: 数智化转型 机器学习 数据库

北京——2023年12月7日 亚马逊云科技在2023 re:Invent全球大会上,宣布推出三项新的无服务器服务创新,涵盖了数据库和分析领域,使客户能够更快速、更轻松地扩展他们的数据基础设施,以支持最具挑战性的应用场景。...

关键字: 服务器 人工智能 数据库

北京——2023年12月4日 亚马逊云科技在2023 re:Invent全球大会上,宣布推出一系列新的集成解决方案,旨在帮助客户迅速而轻松地连接和分析数据,而无需构建和管理复杂的提取、转换和加载(ETL)数据管道。通过全...

关键字: 数据存储 数据库 人工智能

北京——2023年11月13日 亚马逊云科技携手凯捷(Capgemini)中国共同发布《汽车行业可持续发展白皮书》(以下简称《白皮书》),并助力凯捷中国推出碳排放管理平台,致力于以数智化方式帮助车企解决在实践可持续发展过...

关键字: 数据库 机器学习 电动汽车

11月1日,由开放原子开源基金会主办,电子科技大学承办,深圳市腾讯计算机系统有限公司提供战略合作支持的2023年开放原子校源行(成都站)活动在电子科技大学圆满举行。本次活动以“聚缘于校,开源共行”为主题,将四川省在信息技...

关键字: 开源模式 操作系统 数据库

11月1日,2023杭州云栖大会上,阿里云瑶池数据库宣布已全面实现Serverless化,并接入通义等大模型能力,大幅提升数据库一站式及智能化水平。同时,PolarDB Always On系列推出3大重磅升级,首个数据智...

关键字: Serverless AI 阿里云 数据库

北京2023年9月8日 /美通社/ -- 日前,"云融数智 创领未来"2023浪潮云海云图生态峰会产品技术伙伴专场在北京成功举办。来自开源基金会、云安全、PaaS、数据库服务、容灾备份等领域的头部领先...

关键字: 云安全 私有云 数据库 NI

北京2023年9月7日 /美通社/ -- 在欧盟推出碳边境调节机制(CBAM)的背景下,为了更好的提升中国相关工业企业在碳排放管理方面的能力,推进中国与欧盟相关机制的国际合作,2023年9月3日于北京,DEKRA德凯受国...

关键字: 供应链 可持续发展 ISO 数据库
关闭
关闭