大数据时代如何进行数据挖掘与分析
更新时间:2019-08-08

  数据挖掘是一种决策支持过程,它通过高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策?

  很多质量的检测项目都是测量“产量”、“合格/不合格”、“通过/不通过”或“符合/不符合”这些弱指标的,这类数据属于计数型数据,具体而言,都属于不良数据,这类数据的计量结果通常都计为1或0。

  不良数据的价值是帮助使用者描述感觉:好或者不好,而不关心数据所指的具体对象。如果产量不好,就需要提供更有力的变量型数据来隔离或者解决其中的问题。计量型数据可以用连续、随机的数值来统计,例如长度、高度、直径、压力、百分比、温度等等。

  企业针对工业数据常常犯的一个最大的错误就是:将大量计量型数据简单粗暴地转化为“通过/不通过”这类计数型数据。从另外一个角度来看,统计结果的可靠性更多的依赖人为判断,并没有具体的现场数据作为强有力的证据支撑。

  在数据采集变得越来越容易的当今,仅仅收集数据,只是成功的第一步而已。要想将制造数据的价值真正挖掘出来,做到最大化的有用且高效,可从以下三个方面来计划:

  需要对内部现有的仪器设备做一个全面的排查,明确哪些数据是手工采集、哪些数据能够借助接口自动采集,并做进一步的规划,明确数据采集的时间频率、采集的关键信息点、控制图分析类型、控制指标、异常处理等信息。

  有的数据用来做实时的现场判断,有的用来做长期的战略决策,而有的,其实只是占用空间而已,没有实际价值。与本港台同步报码。实时采集到的数据需要通过专业的分析和报警工具,提醒用户确定是否需要对生产做出调整,同时,确保生产制程的稳定性。用于制订长期战略决策的数据,必须从长期的维度来挖掘、分析数据,找到最关键的数字趋势,突出值得关注的信息。而大量无关紧要的数据,最好及时处理、释放内存空间。

  对于收集的数据,有哪些衡量指标?这些指标对自上而下和自下而上的决策是否产生影响?它们能否对正确的行为给予回报和奖励?