当前位置:首页 > 物联网 > 《物联网技术》杂志
[导读]摘 要:“互联网+”时代,相关服务应用的迅猛发展产生了大量数据,大数据对广电行业影响巨大,价值有待挖掘,使商业机会变得无穷大。关联规则算法是一种常用的数据挖掘算法,文中探讨用关联规则算法对广电大数据进行挖掘研究,实现对广电用户喜好的分析,从而起到预测效果,发挥广电媒体强大的市场影响力。

0 引 言

网络基础设施建设的提速与普及和移动互联网相关服务应用的迅猛发展,使得全球每分每秒产生的数据越来越多, 这些数据价值巨大,庞大的用户群所提供的无限增长的数据, 正在等待时机释放出巨大的商业能量。一旦挖掘出数据价值, 那么商业机会将会变得无穷大。

1 “互联网”+ 时代大数据对广电行业的影响

大数据是指无法在一定时间内用常规机器和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。

近几年,网络媒体迅猛发展,信息更新速度极快,随时向人们推送各种信息,人们可以自由选择信息的来源,大数据的产生给广电行业等传统媒体制造了巨大的压力和挑战。大数据对传统广电影响巨大,广电行业必须面对现实,充分利用大数据,挖掘大数据背后的意义,对传统的经营与思维模式进行创新与变革,在新时代立于不败之地。

“互联网”+ 时代,网络己蔓延至人类生存的方方面面, 以新闻网站为代表的网络媒体迅速崛起,影响着广大受众的信息接触习惯和信息获取方式,对传统媒体造成了极大冲击。目前网络媒体的广告收入已基本和传统媒体的收入持平,传统电视媒体的广告份额在逐年减少。电视仍是目前最具影响力的媒体之一,在社会生活各个方面的信息传递中起着举足轻重的作用。因此,广电行业虽然面临巨大挑战,但也面对着更广阔的发展空间。广电媒体掌握着大量核心数据,可以充分利用这一优势加以变革,使广电行业迎来更加美好的明天。

2 广电大数据的挖掘研究

2.1 数据挖掘概述

数据挖掘就是使用模式识别技术、统计和数学技术在大量数据中发现有意义的新关系模式和趋势的过程,即从海量数据中挖掘出可能有潜在价值的信息技术。它可实现以下功能:

(1) 分类 :按照训练对象的特征属性,通过建立不同的组对事物进行描述,为目标对象或事件分类。

(2) 关联 :分析有联系的对象或记录,由此对有潜在关联的事件做出推断,从而对可能重复发生的模式进行识别。

(3) 聚类:对训练集进行识别,分析数据之间的内在规则,进而把目标对象按照规则分成若干类。

(4) 预测 :对训练对象的发展规律进行分析,从而预测目标对象未来的发展趋势。

各种社交网络平台、巨大的市场和客户群,会产生庞大的数据资源,网络平台的结构、标准、系统等都没有统一的标准,且网络产生的大数据资源是动态的,变化迅速,广电若要在瞬息万变的大数据环境中快速、准确地处理大量数据, 就必须采用互联网化思维进行大数据挖掘。因此,有效、快速的深度挖掘与进行客户订制化是广电发展之根本。

2.2 广电大数据采集

广电大数据采集是指接收来自不同平台的客户端(网络媒体、社交APP 或者传感器等)数据,建立多个大数据库,用户可根据自己的喜好使用大数据库,查询定制个性化产品,从而满足自身需求。

当前,由于网络媒传和传统广电媒体的充分融合发展, 广电组织结构重构,大众可以从许多渠道获得信息并发布信息, 我们也可以通过多渠道进行广电大数据采集。

(1) 利用电视平台收集用户数据,选播电视节目时,实时记录用户选台的详细信息,比如所选节目、频道、时间范围等。

(2) 利用电视平台中电视互动点播收集用户数据,记录用户喜爱的节目类型、时间范围、频次等。

(3) 利用各种网络收集用户数据,记录用户在网络媒体上发布的信息、手机实时浏览的信息等,要从 PC端、手机端、电视端等渠道采集广电大数据。保证广电大数据的全面、及时、准确,为广电大数据挖掘处理做充分准备。

当然,由于同时访问不同网络的用户成千上万,访问操作的并发数高,因此,在大数据的采集过程中难度很大,挑战性极高,比如黄金时段的热点新闻、电视直播的NBA 球赛、年轻人喜欢的一些综艺节目等,它们并发的访问量在峰值时可达上千万,需要在采集端部署大量数据库才能支撑。并且如何分配合理的时间片以及负载给大量数据库,都是在大数据采集中需要面对和攻克的问题,需要深入的思考和设计。

2.3 广电大数据挖掘

数据挖掘能够满足一些高级别数据分析的需求,一般不会预先设定好主题,关键是基于各种算法对现有大数据源进行数据计算与处理,用以对未来数据进行预测。

数据挖掘算法多样,关联规则算法是比较常用的一种。此算法根据在同一事件中出现的不同项之间的相关性可以很好地预测数据项之间存在的关联规则。比如能够追踪用户在选台中所做的不同选择之间的相关性,得出节目之间的关联规则, 从而比较准确地预测用户喜好,有效为用户提供个性化定制服务等。本文利用关联规则算法探讨对广电大数据的精确挖掘, 为广电行业的发展提供一定的理论依据。

关联规则算法符号标识 :

设 L- 数据项集 ={i1,i2,…,iL}。

数据项集 A 的支持度 :支持度用来衡量关联规则的重要性,s(A)=σ(A)/N。

关联规则 :假设 A和 B是不相交的项集,即 :A∩ B= ,那么蕴含的关联规则为 A → B。

可信度 :可信度用以衡量关联规则的准确度,在包含 A 的数据中 B 也同时出现的概率值,形如 :c(A → B)=σ(A ∪ B)/σ(A)。

规则 A → B 的支持度 :数据项集 A 和数据项集 B 同时出现的概率,形如 :s(A → B)=σ(A ∪B)/N。

可信度和支持度的高低共同确定了关联规则质量的好坏,一条规则在所有事务中的代表性主要由支持度决定,支持度越大,可信度越高,关联规则越重要,如果可信度很高,但支持度不高,则说明该关联规则实用的机会不大,因而关联规则用处极为有限。所以在关联规则挖掘过程中,应通过不断修改阈值形成满足一定最小可信度及最大支持度的具有较大作用的关联规则集。

算法应用分析 :采集到的大数据集记录了用户的访问信息,用户记录中包含用户收看的节目清单表,如节目的名称、类型、收看时间段、节目数、访问模式等。打开并使用数据集,可以看到其中的详细记录信息 :M 条记录,N 个节目,及其他内容,建立合适的数学统计模型,统计计算出支持度 S 和可信度 C,进而为数据建立关联规则 A → B。此外,为了避免由于误操作而使一些节目被多次点击,我们需要设置它们各自合适的阈值,去除规则库中创建的无用规则,保存有效的、具有高支持度、可信度的规则,以提高规则库的性能。通过使用规则库,追踪分析预测出单个用户的访问模式、倾向以及偏好,高效为用户提供定制服务。


3 数据挖掘的发展趋势

数据挖掘技术被广泛应用于各个领域,如广电业、银行业、生物学以及工业领域等,可帮助各行业进行市场行为分析预测及客户流失性分析预测等。

由于网络的广泛应用及网络种类的复杂多样,产生了海量复杂的结构、半结构数据,形成了多样组织结构不兼容的各类型数据库,大数据库遍布各行各业,导致数据挖掘技术需面向各行业复杂的大数据环境,因此需要对结构不同、来源不同的不兼容大数据库进行挖掘处理,发现其潜在意义。这是非常艰巨的挑战,甚至还需要对多维数据、多媒体数据以及生物医学方面的数据进行更全面、深化的挖掘处理。数据挖掘技术的应用有远大的前景和无限的发展空间。

4 结 语

“互联网 +”时代,大数据的产生对广电行业有很大影响, 而广电的核心优势是已积累的海量数据,同时也是广电应对当今形势的基石。在现有海量数据的基础上,运用网络新技术搜集大量实时动态相关数据,形成海量大数据库,然后利用数据挖掘手段,对数据库中的受众层级进行分析处理,预测目标人群的喜好和需求,并根据分析预测的结果,按照目标人群的差异化、个性化要求,通过加快技术创新和应用创新, 使产品内容多样化、服务人性化,满足受众的个性化需求,提高和改善用户体验,培育和提升客户忠诚度。广电一定会在大数据时代中形成强大的市场影响力。


本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

北京——2024年4月18日 西门子中国和亚马逊云科技双方高层在西门子中国北京总部会晤,双方宣布签署战略合作协议,共同成立“联合创新团队”。基于亚马逊云科技在生成式AI领域的领先技术和服务,并结合西门子在工业领域的深厚积...

关键字: 生成式AI 机器学习 大数据

随着信息技术的飞速发展和大数据时代的到来,数据挖掘和机器学习作为数据处理的两大核心技术,在各行各业中发挥着越来越重要的作用。然而,尽管数据挖掘和机器学习在很多方面存在交集,但它们各自具有独特的定义、方法和应用场景。本文旨...

关键字: 数据挖掘 机器学习 数据处理

随着大数据时代的到来和计算能力的不断提升,机器学习作为人工智能领域的重要分支,正逐渐改变我们的生活方式和工作模式。机器学习涉及多个学科的理论和技术,其应用广泛且深入,为各个领域的发展带来了前所未有的机遇。那么,机器学习具...

关键字: 大数据 机器学习 人工智能

随着信息技术的飞速发展,数据已经成为现代社会的重要资源。数据挖掘和机器学习作为处理和分析数据的两大关键技术,在多个领域得到了广泛应用。尽管它们在某些方面存在重叠,但数据挖掘和机器学习在定义、目标、方法以及应用场景等方面存...

关键字: 数据挖掘 机器学习 计算机

随着信息化时代的快速发展,数据已经渗透到各行各业,并成为了重要的生产要素。数据挖掘和机器学习作为处理和分析数据的两大核心技术,对于从海量数据中提取有价值的信息、优化决策过程和提高业务效率具有至关重要的作用。本文将详细介绍...

关键字: 信息化 机器学习 数据挖掘

随着大数据时代的来临,数据的价值日益凸显,如何从海量数据中提取有用信息并转化为实际价值,成为各行各业关注的焦点。机器学习和数据挖掘作为两大核心技术,在数据分析和处理中发挥着越来越重要的作用。本文将通过几个典型的应用案例,...

关键字: 大数据 机器学习 数据挖掘

在信息化和数字化高速发展的今天,数据挖掘和机器学习作为两大核心技术,正日益受到人们的关注。它们不仅在各行业应用中发挥着举足轻重的作用,更是推动社会进步和科技发展的重要力量。然而,关于数据挖掘和机器学习哪个更有前途的讨论,...

关键字: 数据挖掘 机器学习 信息化

在信息化时代的浪潮下,数据挖掘和机器学习无疑是两大重要的技术支柱,它们各自在数据处理、模式识别、决策支持等领域发挥着不可替代的作用。然而,关于数据挖掘和机器学习哪个更好的讨论,一直以来都未有定论。事实上,数据挖掘与机器学...

关键字: 数据挖掘 机器学习 信息化

机器学习和数据挖掘将是下述内容的主要介绍对象,通过这篇文章,小编希望大家可以对机器学习和数据挖掘的相关情况以及信息有所认识和了解,详细内容如下。

关键字: 机器学习 数据挖掘

在这篇文章中,小编将对机器学习和数据挖掘的相关内容和情况加以介绍以帮助大家增进对机器学习和数据挖掘的了解程度,和小编一起来阅读以下内容吧。

关键字: 机器学习 数据挖掘
关闭
关闭