【主管Q:64555253】大只500平台总代我一直对人工智能(AI)的炒作感到厌烦。人工智能已经成为现代的“魔杖”:没有人知道它是如何工作的,但其结果肯定是惊人的。人工智能对制造商来说有局限性,但制造业中的数据科学和机器学习都可以帮助企业做出更好的决策,并改善质量控制结果,这就是我们将在本文中探索的……
现代人工智能真的是一根魔杖吗?
《华尔街日报》刚刚发表了一篇文章(人工智能并不是魔法,也不会帮助你重新开业),这篇文章很好地将人工智能的进步放在了正确的角度上。
许多研究比较了新的和被认为是改进了的人工智能算法和“老式”的算法,发现它们的性能并不比多年前开发的系统更好,有时甚至更差。例如,对信息检索算法的一项分析发现,高水位实际上是十多年前开发的一个系统。”
话虽如此,还是有一些方法可以利用大量制造和/或质量相关的数据来做出更好的决策。反过来,也有助于提高产品质量和降低成本。主要有三种方式来实现这些:
改善生产过程控制,防止问题的发生。
在非常接近源的地方发现问题,快速修复它们,避免广泛的返工和/或报废。
更好地了解风险,更好地确定检验和测试活动的目标,减少验证的预算。
什么是数据科学,它如何有助于质量控制?
维基百科将其定义为“使用科学方法、流程、算法和系统从结构化和非结构化数据中提取知识和洞察力的跨学科领域”。
处理数据,并从数据中提取可操作的信息,在很多领域都非常有用。它通常不是“人工智能”的一部分,尽管可能存在重叠。
您可能已经使用过数据并生成了有用的统计数据。你已经完成了所谓的“数据科学”!
它从一个理论开始。例如,你可能在两个地理区域购买眼镜产品,你可能想知道一个区域的供应商是否比另一个更好。要做到这一点,你可以比较你的供应商在深圳地区和温州地区的平均性能(例如,次品%),为一种眼镜类型是在这两个地区制造。如果你已经有了供应商的性能数据,这并不困难。
顾问Brad Pritts就如何使用统计工具改进生产过程给出了一些很好的建议。他表明,相对简单的统计工具可以非常非常有用。
“大数据”是否让这类工作变得更容易?
是的。在中央数据库中收集的数据越多,可以测试的关系就越多,可以发现的信息也就越多。这里有几个例子:
在生产相同产品时,A工厂出现尺寸问题的可能性比B工厂高30%。
在所有生产X类产品的工厂中,在连续通过3次检查(发现问题的比例较低)后,后续检查不合格率仅为2%。切换到“跳货”策略,而不是继续检查每一批,可能会为公司省钱。
理想情况下,你会周期性地更新这些分析,比如每3个月。这些“被证实的事实”可能会随着时间而改变。特别是当大流行病导致需求崩溃,而这些供应商的组织可能受到影响时。
拥有海量数据的一个缺点是,管理者需要专注于他们所需要的。就像Michel Baudin几年前说的那样,有被淹没的危险(而且不知道从哪里开始):
制造业数据从涓涓细流到滔滔不绝
如何将所有这些数据放入一个中央数据库,以便进行分析?
一些公司从不同的来源提取数据,并将它们全部导入到一个数据库(在Power BI或Tableau中),大只500代理网址以便于分析。显然,数据完整性(没有错误,适当的标签,等等)是非常重要的。
当IT应用程序收集大量数据时,它通常会努力启用这种类型的分析。这一直是我们QC应用程序开发团队的优先事项之一,因此我们已经考虑了一段时间。
例如,如果用户已经有一个中央数据库,其他IT应用程序必须以正确的格式和结构将它们自己的数据导出到该中央数据库中。这已经变得相当标准,而且非常有用。
“数据科学”除了简单的统计之外,难道没有更多的东西吗?
还有更多的东西。让我们以一个压铸车间的过程控制为例。
一)向后看
假设我们记录了过去6个月每批的数据如下:
合金
零件的尺寸/体积
压力
模具温度
环境空气湿度
周期时间
从上一次预防性维修停止后的时间
缺陷部件的比例(这将是因变量)
通过多变量分析,可能会指出过程变量的某些组合,这些组合倾向于产生最低比例的缺陷,以及要避免的组合。
b)向前看(AI没有尝试去做的事情)
如果没有这样详细的过去数据,选择关键变量并进行实验,就可以发现“过程窗口”,从而产生高质量的零件。它可以是:
相对简单,每次只改变一个变量,然后比较结果;
比较复杂,例如做DOE(实验设计)。
什么是制造中的机器学习(ML),它如何帮助质量控制?
制造中的机器学习是一种人工智能方法,通常应用于制造领域(质量、维护等)。我将只介绍机器学习中最简单和最常见的一种形式——监督学习。
(对于我下面提到的应用程序,我曾与一位人工智能专家讨论过,他估计深度学习要复杂得多,因为在准确性方面几乎没有提高。)
它基于研究输入- >输出关系,并利用所学到的经验来匹配其他输入的正确输出。
监督学习通常用于视觉检查(如识别缺陷部件)、自动驾驶汽车(识别红灯)以及其他许多方面。数据越多,结果也不会好到哪里去,所以大多数公司不需要用数百万的投入和产出来匹配数据。
其目的并不是为了除掉这些人。再次引用《华尔街日报》的文章:
“对于大多数企业、学者、公共健康研究人员和真正的火箭科学家来说,人工智能主要是帮助人类做决定,”O ‘Reilly Media的副总裁雷切尔·鲁梅利奥蒂斯(Rachel Roumeliotis)说。
应用1:预测订单级别上的风险级别
如果您已经收集了关于过去订单的大量信息(包括输入:数量、工厂等级、区域……和输出(如QC检验结果)),那么您可能可以构建ML模型。
一旦知道了PO的所有输入,您就可以得到一个风险指标——例如,从0到100。如果风险很高,就花费资源并密切控制这批货。如果风险很低,花费的资源就少得多。
要做到这一点,关键是要有大量准确的数据。下面是一些典型的例子:
输入
工厂、地板、行…
产品类型(例如:形状、材料类型、加工类型……)
这是这条线上的第一批产品吗?
订单数量
输出
发现的缺陷(及其比例)
客户的投诉
应用2:最终检查后风险水平的预测
这实际上是应用程序1的一个变体。您是否怀疑检验结果不准确,是否应该在发货前进行第二次检验?
在这种情况下,输入与上面相同,但也包括检验员的姓名,他/她过去的准确性历史,以及他对这批检查结果的详细信息。
应用3:在线缺陷检测
机器视觉系统自20世纪80年代以来就在汽车工厂中使用。随着时间的推移,它们变得越来越好,越来越便宜,以至于它们能够以95%以上的准确率识别某些缺陷。
例如,公司落地。ai表示,他们可以以99%的精度检测刮痕、凹痕和其他类似的表面缺陷,训练他们的算法需要一个小的数据集(这可能意味着每种缺陷类型的照片少于500张照片)。
他们的算法还可以通过捕捉缺失的零件、错误的序列、错误的位置、错误的尺寸、错误的形状等来检测生产早期的错误。
正如我在前面所写的,“训练集”(例如输入,如1种缺陷的照片,输出,如OK/NG)可能不需要包含超过几十张照片。然而,在某些情况下,还需要更多。
关于机器学习和数据科学的一些常见问题
问:一个模型是基于数据凭空而来的吗?
不是真的。ML专家通常需要从一个理论开始,然后构建一个决策树(这里的例子),以确保算法关注正确的事情。他通常会提出几个理论,构建几个决策树,然后比较结果模型的性能。
问:什么是合乎逻辑的方法——从数据科学开始,然后探索机器学习在制造业可以带来什么?
是的。由于ML专家需要对数据之间的关系有一个基本的了解(并从理论开始),所以首先使用基本的统计数据并以这种方式揭示大量的关系是非常有用的。
你可以在这里读到一篇很好的关于制造业机器学习专家的解释。例如,大只5002注册他们可能需要删除与另一个变量高度相关的一个变量。
机器学习过程中的数据分析和可视化
让ML专家审查数据收集和呈现的方式也是非常重要的。他们可能会提出一些建议,使他们的工作更加容易。
问:如何确保一个模型是真正准确的(并避免盲目地相信它)?
一旦一个模型被训练,它应该在一个“测试集”(一组输入和输出,不同于用于训练的那些)上进行测试。例如,拍摄1000张照片的产品,让算法运行,看看有多少张照片被正确分类。
这在ML中是非常标准的。如果你聘请的顾问不打算按照这些步骤工作,它应该触发一个警钟……
问:那么“深度学习”和“神经网络”呢?
这些术语涵盖了一种更高级的机器学习。大数据更有价值,如果你必须选择这种方法。我强烈建议首先从监督学习开始。