最近两年,在几次行业学术研讨会上,有机会聆听到了华中科技大学陈焕新教授有关大数据与空调行业结合的学术报告,这是一个跨界的全新课题,引起了行业,尤其是产业界的关注。
大数据并不是新鲜话题,但是对于传统制造业来讲,其影响已逐渐成为不得不正视的问题,陈焕新教授说:“制冷空调产业作为一个传统制造行业,目前来说行业内的大数据应用才刚刚起步,国内外关于大数据与制冷空调产业的结合的研究案例相当少,我们团队也只是在基于大数据的制冷空调系统故障诊断方面进行了尝试性的探索工作,通过和企业合作共同开发了基于大数据的商用空调典型故障检测和诊断智能分析平台。传统的制冷空调产业与大数据技术应用是未来整个制冷空调产业
的发展趋势,希望我们团队的开拓性工作能够得到更多同行的关注,吸引更多优秀人才,共同促进制冷空调大数据深入发展。” 为了引起行业更多角度对于大数据带来影响的关注,也帮助业界更多的人了解这一课题进展的情况,暖通空调在线高端访谈最近特别约访陈焕新教授,就这一话题,陈教授在百忙中给我们的问题做了一一解答,我们也欢迎更多的人士加入这一话题的研讨之中。
感谢陈焕新教授的支持。
陈焕新教授
湖南省湘潭市人,中共党员,博士,清华大学博士后,美国麻省理工大学访问学者,教授,博士生导师,铁道部中青年科技拔尖人才,曾任华中科技大学能源与动力工程学院院长助理、制冷与低温工程系主任。 主持和参加国家自然科学基金、国家科技支撑项目、中国博士后基金、湖南省自然科学基金、湖北省自然科学基金、铁道部、湖南省、武汉市计划项目及横项科研项目30余项,科研经费1000多万元,发表学术论文100余篇,参编教材2部,指导硕士研究生60余名(已毕业40余名),博士研究生12名,博士后13名。
主要研究方向
1. 制冷空调系统测控技术与计算机仿真;
2. 制冷空调设备研究与开发;
3. 余热利用的新型制冷技术;
4. 建筑物能源有效利用与管理;
5. 高效节能新技术研究;
6. 微尺度低温热输运研究。
获得的主要奖项
获省部级科技进步二等奖等奖2项,湖南省科技进步三等奖2项,获国家专利3项,获湖南省专利实施优秀奖1项,获湖南省自然科学二等优秀论文奖1项
担任国际制冷学会E2委员会委员,压缩机国家重点实验室学术委员会委员,中国制冷学会低温专业委员会委员,中国制冷展专家委员会委员,中国制冷空调专业产学研论坛专家委员会委员,全国制冷标准化委员会(SAC/TC119)委员,中国能标委节能技术与信息分技术委员会委员,《制冷学报》编委,《暖通空调》编委,《制冷技术》编委,《制冷与空调》编委,《中国气体》副主编。
1关于大数据背景的思考
暖通空调在线:您关注大数据与产业发展这个课题有多长时间了?是基于怎样的背景下开始关注大数据时代相关学科的发展?您简略描述一下您理解的大数据时代的特征?
陈焕新教授:关注这个课题已经3年多了。
从2013年开始,也就是“大数据元年”,那时候我们课题组正在做空调系统的故障检测和诊断方面的研究,在这项研究上也陷入了瓶颈,主要是理论上的故障诊断研究在实际应用上遇到了许多问题。一方面,实际运行系统中的数据往往噪声、异常值比较多,如果不预先处理的话,对于故障诊断的结果影响非常大;另一方面,实际的空调机组(如中央空调、多联机等)的数据量越来越大,理论上可行的算法或模型难以完成大量数据的运算。在这种情况下,大数据的理论以及各类分析方法引起了我们的关注。首先,计算机处理速度的提升,存储容量的提升和存储成本的降低,为获取大量数据进行研究提供了许多便利,大数据的许多算法也拓展了研究的深度和广度;其次,网络传输速度以及容量的增长,能够实现数据的实时传输和分析,为理论模型的在线应用奠定了基础。这些都使我们更加意识到大数据研究的重要性,以及它可能带来的各种机遇和新的研究思路。
暖通空调在线:您简略描述一下您理解的大数据时代的特征?
陈焕新教授:就制冷空调行业而言,大数据的特征主要有以下几个方面:
(1)数据量大。计算机存储能力的提升和存储成本的降低,空调系统的实时运行数据量增长非常迅速,其次就是制冷空调企业的管理和运营过程中也产生了海量数据,如市场调研、销售、财务、物流等数据;
(2)数据多样。制冷空调行业的数据不仅仅指空调的运行数据,还有空调企业的销售、财务、人事等数据,以及互联网上相关的媒体、图片、视频等数据;
(3)变化快。实时的数据才最有价值,目前的网络传输技术使得数据的传输变得快速和便利。如果能够实时地监控和分析空调机组的变化情况,实时地调节机组的运行状态保证其最高的效率,对于节能和舒适性控制是非常重要的。而空调企业如果能实时把握市场的动向和需求,就能快速地制定相应的销售方案,提升产品销量和影响力。
(4)有价值。越来越多的专家学者以及企业已经意识到制冷空调数据中存在极大的价值。而如何从数据中发现价值,如何将大数据技术与我们制冷空调行业紧密结合,推动我们行业的升级,还有许多工作需要去做,也需要更多的人才来做。
2关于大数据挖掘的定义
暖通空调在线:大数据时代,面对纷繁复杂的数据海洋,如何挖掘有价值的数据群?
陈焕新教授:大数据具有volume(大量),velocity(高速),variety(多样),value(价值)的4V特性,表明了大数据的庞杂,产生速度快,类型多,价值高。如果没有在其中找到对自己有用的数据,那么对于这样的数据集合我们想要面面俱到的分析是无能无力的,也会做很多无用功。所以,在团队进行数据挖掘的初始时期,我们就如何挖掘进行过一次次的讨论与总结,在这里和大家分享一下大体的思路。
(1)首先,我们应该去其糟粕。拿到一个庞大的数据集,里面包含很多缺失的值(缺失值),由于机器记录故障产生的不变的值(死值)或者是超出常理认知的值(异常值),这些都是我们应该考虑删除的对象,它们的存在会给后续的分析造成很多的误差和不必要的工作量;
(2)其次,需要对数据集进行降维。即去除一些不必要的特征量达到降维的目的。直观地看,部分数据属性在制冷系统中所包含的信息是十分相似的,比如换热器冷媒的进口温度和出口温度,这样的数据往往变化趋势大致相同,属于冗余的数据,可以考虑进行删减。如果想更进一步地进行数据的删减与特征选取,可以考虑使用相关性分析, PCA降维等;
(3)处理完数据后,我们还需要挖掘数据中所蕴含的信息,“行百里者半九十”,挖掘的工作量较数据的处理而言工作量较小,但却是数据挖掘的目的所在,所以重要性还是不言而喻的。目前有关联规则分析的算法,可以应用来挖掘一些隐含在大数据中的信息。我们团队在这个方面也做了很多工作,能够从信息中得知空调机组的运行状态,并给出物理层面的解释。
暖通空调在线:如何定义不同特征或者不同渠道的大数据挖掘?
陈焕新教授:这个问题只能说仁者见仁,智者见智,不同的数据工作者可能有不同的见解,结合团队的工作,我认为,制冷行业的大数据挖掘从针对对象而言,可以分为对空调系统的大数据挖掘、对底层用户的数据挖掘、以及对上层厂家的数据挖掘。
(1)对用户、厂家的数据挖掘,对厂家而言,目的是为了有针对性地进行空调的设计,销售等,对用户而言,则是进行空调的需求评估、选择等。所包含的数据包括有市场容量、供求等数据,空调系统本身的工作状态、性能等数据不必很详尽。比如北方地区可能对于空调的需求不如广州,而广州等南方地区对空调除湿性能更高,这些都属于这一板块(对用户、厂家的数据挖掘);
(2)对空调系统的数据挖掘更加偏向于系统本身,包含有机组的结构参数、工况、运行状态等参数数据,一般目的是为了进行能耗的预测、故障检测与诊断,比如,利用上述的历史数据,预测空调可能出现的故障,然后及时进行维护与检修。
3关于大数据分析方法概览
暖通空调在线:数据挖掘最需要掌控的应该是对于无序数据的分析方法,请您介绍一下目前主流方式有哪几种?
陈焕新教授:一般数据挖掘算法分为两种,有监督算法和无监督算法。
监督算法是指通过已有的一部分输入数据与输出数据之间的对应关系,发现数据和类别之间的关联模式,并通过利用这些模式来预测未知数据实例的类别属性。
无监督算法,输入实例没有类标记,学习过程是无监督的。 其中有监督算法主要有逻辑回归、决策树、神经网络、支持向量机等算法。 无监督学习主要包括聚类、最邻近距离、关联规则分析等算法。
4关于制冷空调产业面临的考验
暖通空调在线:大数据时代下中国制冷空调产业面临哪些考验?
陈焕新教授:大数据在互联网行业得到了非常快速的发展,然而在传统制造行业却发展缓慢。空调行业作为传统行业中的一个重要组成,在面对大数据的潮流中,经受以下两个方面的考验。
(1)对传统空调产业的挑战
传统空调产业主要由设计、生产制造、销售、现场运行、维护这几个过程组成,这些过程变得越来越成熟,短时间内难有更大的突破。而在这些过程中均会产生大量的数据,当大数据时代来临,如何对传统产业中产生的数据进行挖掘利用,如对设计、生产、销售、运行管理以及用户行为习惯所产生的数据进行分析挖掘,将会在产品性能、个性化设计、节能运行等方面有较大的提升空间,对空调产业带来革命化的突破。
(2)数据安全
制冷空调行业的大数据,包括空调产品设计、科学实验、制造、运行数据及人事、财务、物流等数据。一方面要进行数据挖掘工作,希望各企业提供大量真实的数据,这样才会得出有价值的结果,提高产品的竞争力,提升整个行业的竞争力;但另一方面这一系列的数据在空调行业占据着及其重要的位置,各企业对自己的数据拥有严格的保密措施,对数据进行封锁,更不愿意将数据进行共享。如何处理好数据开发利用和保密之间的关系将是一个非常重要的课题。
暖通空调在线:您觉得会有哪些颠覆性的改变必须意识到?
陈焕新教授:可能将会有以下颠覆性的改变须引起我们高度重视:
(1)利用大数据方法可以发现我们过去没有发现的规律
传统研究方法基本上是基于将研究对象提炼出物理模型和数学模型,然后对其物理和数学模型求解,基于我们对客观事物的认识深度以及用数学方法的描述困难,该方法受到了很大限制。利用大数据分析和挖掘的方法,可以找出我们采用传统方法没有发现或发现不了的自然规律,实现创新,从而加快整个空调行业的发展。
(2)利用大数据方法有可能找到过去我们认为完全不相关事物的关联性
前面讲了过去我们对客观事物的认识是基于我们眼前看到的或能够直接感知到的判断,而客观世界是非常复杂和瞬息万变的,只有通过客观世界所产生的大数据才能揭示事物的本来面目,比如“啤酒和尿不湿”就是通过大数据揭示出他们之间的关联性,我相信在我们行业实验室产生的数据可能会与用户的某种数据关联,或人事、财务数据会与销售数据存在某种关联,只是我们目前还没有认识到而已。
(3)大数据可以解决信用问题、大数据可以带来创新
正是因为大数据的挖掘和利用,客观世界真实的一面才会比较完整的展示在我们面前,那些虚假的和错误的信息会通过大数据分析和挖掘得到剔除和澄清,因此,利用空调行业中的大数据构建应用体系,可以解决困扰我们的信用问题,搭建企业和企业之间,企业和用户之间的信任桥梁,降低社会成本,提高生产效率,从而激发空调行业中的源动力;加之前面谈到的利用大数据可以发现和找出一些我们从未认识的相关规律和事物之间的关联性,从而带来创新或产业革命,提升整个制冷空调行业的竞争力。
(4)大数据可以预测未来
大数据最重要的一个特点就是具备预测功能,基于对以往的数据进行建模,对过去产生的大数据进行挖掘,可以预测未来的数据变化。因此我们可以预测空调机产生故障的时间和原因,可以预测明年要开发哪些新产品,可以预测未来什么用途的产品更受消费者青睐,可以预测五年以后的销售收入到底会有多少?…….甚至可以预测未来空调行业发展的走向。
暖通空调在线:国际上的同行对于大数据与我们产业发展的关联有哪些观点?
陈焕新教授:虽然大数据技术已经成为了研究的热点,但是利用大数据技术在空调行业的研究还处于萌芽期。国际同行基于数据挖掘技术在建筑能耗预测、建筑故障诊断等几个方面也仅仅提出了自己的观点。
一些研究团队利用传统的方法对冷水机组进行故障诊断,能够减少运行能耗,并提出将大数据方法用在冷水机组的故障诊断上,效果会更加显著。在建筑健康管理中,传统方法受到了限制,提出利用大数据方法进行建筑能耗预测能起到的一个重要的作用,因为它可以帮助优化建筑日常运行,选择控制策略,降低能耗。
5关于制冷空调产业大数据产生的研究
暖通空调在线:目前制冷空调行业除了关心系统高效运行外,更关心后期的运行管理和节能优化,您带领团队围绕这个课题做了哪些研究?
陈焕新教授:在制冷空调大数据产生、挖掘、提取、解析和应用的整个数据流过程中,我们团队围绕制冷空调大数据开展了多个方面的系统性研究,主要集中在健康管理、节能优化两个关键方面:
(1)基于数据挖掘的空调产品/系统全寿命周期健康管理研究;
针对具体空调产品/系统对象,收集大量空调开发设计、实验测试、实际运行数据,逐个逐时建立空调产品健康数据档案。基于海量数据提取具有表征空调健康静态、动态特性的关键热力特征,进行重点检测和挖掘分析,构建大数据健康管理平台,检测空调产品/系统全寿命周期的工作状态。
典型案例:基于模式识别算法的螺杆式冷水机组传感器故障检测和诊断
螺杆式冷水机组是中央空调系统的重要组成部分。由传感器故障引起的测量值偏差,导致冷水机组运行偏离正常工况,会产生能耗增加、性能下降、寿命降低等多种不良后果。基于以上原因,我们课题组通过收集国内某电子厂房螺杆机实际运行数据,构建螺杆式冷水机组健康管理平台,监测运行周期螺杆机的工作状态,引入模式识别算法(主元分析PCA、支持向量机SVM等),及时进行传感器故障检测和诊断,校验系统测量数据,调整机组运行模式并使系统正常高效运行。
(2)大数据方法空调产品/系统的节能潜力分析和优化控制。
针对具体空调产品/系统对象,收集大量空调实际运行数据进行统计分析,构建有效合理的节能指标,进行重点检测和挖掘分析,筛选最优节能模式,判断空调产品/系统节能模式。
典型案例:基于聚类算法的制冷空调系统能耗模式识别研究
基于用户行为习惯,判断具体空调系统的运行模式是否节能,对于空调新产品和新技术的开发有着重要作用。通过收集大量空调运行数据及耗电量数据,利用聚类算法(kmeans、层次聚类等)进行数据聚集处理,甄别出不同模式下的数据聚集区域,判定各个模式下系统的性能和能耗特征,识别系统是处在节能运行模式,还是高能耗运行模式。
经过3年来的努力探索和坚持奋斗,团队已在国际国内学术期刊及会议上发表有20余篇研究性论文,研究成果颇丰。
暖通空调在线:与产业结合做了哪些方面的分析?
陈焕新教授:制冷空调产业作为一个传统制造行业,目前来说行业内的大数据应用才刚刚起步,国内外关于大数据与制冷空调产业的结合的研究案例相当少,我们团队也只是在基于大数据的制冷空调系统故障诊断方面进行了尝试性的探索工作,通过和企业合作共同开发了基于大数据的商用空调典型故障检测和诊断智能分析平台。传统的制冷空调产业与大数据技术应用是未来整个制冷空调产业的发展趋势,希望我们团队的开拓性工作能够得到更多同行的关注,吸引更多优秀人才,共同促进制冷空调大数据深入发展。
6 关于制冷空调产业大数据应用成果
暖通空调在线:目前这项跨界研究的学术进展如何?
陈焕新教授:我们课题组关注大数据与空调产业结合已经有了几年的时间,对于这项研究我们也取得了一些初步的成果,并持续开展这项研究,主要包括以下几方面:
(1)我们课题组成员对于大数据技术阅读了相关文献和书籍,并进行了大数据相关知识的学习。
(2)我们与本校计算机学院也进行了合作,请计算机学院的教授和博士为我们定期作相关报告和讲座,加深了我们对大数据技术的理解。
(3)我们课题组每周会定期与计算机学院的学术团队开展学术交流活动,探讨计算机专业的相关技术和挖掘算法在空调产业中应用前景,也向计算机学院的学术团队介绍制冷空调的相关知识。
暖通空调在线:国内外有哪些成果可以用来指导企业或研究部门进行成果转化?
陈焕新教授:大数据技术在制冷空调行业目前的研究才刚刚起步,但是在国内外的金融、保险、证券、互联网等行业已经取得了一些较好的应用成果,我们认为制冷空调行业也可以借鉴上述行业的成果转化思路。通过对空调产业的生产数据、运行数据等的收集,进行数据挖掘,进而提高企业产品生产率,提高运行的稳定性。并且通过将大数据与制冷空调产业结合,也会促进制冷空调产业创新和发展。
暖通空调在线:对于大数据时代的影响,我们的行业应该持何种态度才会科学地顺应时代的发展?
陈焕新教授:我们课题组率先进行了空调产业和大数据的交叉研究,但是过程并不是一帆风顺,我们也是秉承着怀疑和探索的思路去学习和研究空调大数据。
(1)制冷空调行业要充分学习其他行业大数据应用的成功经验,并将其与本行业进行结合。
(2)制冷空调行业也要充分分析自己行业的数据特点,制冷空调行业数据是(时)支离破碎的,有实验数据,生产数据,销售数据,同时也有历史数据,瞬时数据,我们要将这些数据进行整合,并挖掘出有价值的东西。
(3)制冷空调企业也要做好数据的存储工作,某些数据现在可能是没有用的,但是将来通过数据挖掘技术或许可以挖掘出有价值的东西。
暖通空调在线:基于您和团队的研究历程,对于业界相关方面促进大数据研究和应用的进展,希望您给出更多的建议。
陈焕新教授:通过我们的研究实践,以下几方面我提供一些建议:
(1)高等院校、科研院所要充分关注并积极参与大数据技术的研究。
(2)制冷空调企业也要关注和积极参与大数据研究,并处理利用大数据促进企业发展和数据保密之间的问题,以便于促进数据挖掘技术在空调领域的应用。
(3)制冷空调学会和协会要整合资源,产学研互相结合并促进大数据技术在空调领域的发展。
(4)大数据技术不仅要与空调产业结合,也同样可以与其他传统产业进行结合,传统产业之间也要进行交流和合作,共同促进大数据技术在传统产业中应用。
随着空调产业智能化提高,空调产业产生的数据也越来越多,传统的数据分析也将不再适用于现在的海量数据,迫切需要大数据分析技术来改变空调产业的现状。因此,制冷空调行业必须抓住这次机遇,在变革中促进制冷空调行业的新发展。