Text-To-3D对工程和产品设计意味着什么?Nvidia 揭示创成式AI发展的指数级速度
Nvidia 的最新算法将文本转换为 3D 网格的速度是两个月前发布的项目的两倍。 这意味着现在的技术能力已经超过了我们与他们合作的能力。Nvidia 的创成式人工智能正在以令人振奋的速度发展。
AM-增材制造具有天然的数字技术基因,可以显着受益于数据科学、ML-机器学习 和 AI-人工智能的新进展。鉴于3D打印-增材制造流程中的所有步骤均以数字方式完成,因此有助于流程本身的数据收集和组织。另一方面,增材制造在设计、工艺准备和3D打印阶段是一个高度自动化的过程。这会产生许多人类难以可视化、可以理解和解释的系统数据。
Nvidia 科学家展示了创成式AI发展的指数级速度。这种发展速度的爆炸式增长在过去 9 个月尤其明显,这将对生活的方方面面产生影响,尤其是在产品设计、工程和生产方面。这些变化将使该行业摆脱思想交流方式的结构性限制,加快创新周期,并最终实现其可持续发展目标。
多年来一直被告知人工智能将从根本上改变我们的工作方式,但很少有人认为创意部门会成为其首批被影响者。2020 年 GPT-3 的类人文本生成器的出现开启了人工智能影响产品设计、工程和生产方面的大门,从那以后,这是一段疯狂的旅程:DALL-E(文本到图像)、Whisper(语音识别)和最近的 Stable Diffusion(文本到图像)不仅提高了语音和视觉 AI 工具的能力,而且 减少了使用它们所需的资源。
与 OpenAI(主要由微软资助并发布 GPT-3、DALL-E 和 Whisper)不同,Stable Diffusion 是开源的,这意味着其他人可以更容易地在其学习的基础上进行构建。这意味着目前只是看到了创新周期的开始,正如 Nvidia 的论文现在所显示的那样,未来还会有更多爆炸式增长。
Stable Diffusion 的支持者 (stability.ai) 通过向其他团队提供技术和财政资助,进一步推动这一趋势,将探索带入新的方向。此外,大量项目正在使这些工具供更广泛的用户使用,其中包括开源设计工具 Blender 的插件,以及 Adobe 专有的 Photoshop 等插件。对这些工具的完整 API 访问由大量风险投资资助,这意味着数亿软件开发人员,而不仅仅是几十万数据工程师,现在将在这些算法上创建他们自己的工具。
语音、图像和文本是最先被这些技术颠覆的垂直领域。但 3D建模也不甘落后。除了艺术设计,卡通显然是一个应用点。接下来是视觉效果和电影。但许多其他行业可能会被打乱,譬如以 Interiorai.com 为首的室内设计行业。
当然,目前存在挑战:首先,Stable Diffusion还不是很精确。这对卡通来说不是问题,但对于任何将文本转换为工业环境中使用的全 3D 几何图形的尝试来说,这都是一个重大挑战。
这是一个刚刚起步的领域,Altair 的 Inspire 通过有限元分析来做同样的事情。Physna 的 CEO 和创始人在一篇文章中指出了这一点,详细介绍了他们自己尝试使用这些新方法创建详细的 3D 设计的尝试,这也强调了使用合成数据驱动这些算法的一些缺陷。这些挑战本身很重要且有利可图。然而,它们的主要影响将是通过最终减少对 3D 设计的依赖来帮助改进从创意到设计的路径。
人工智能能够更改单个约束并允许诸如稳定扩散之类的算法重构设计和生产参数,这将显着加快新创新的采用,并使人类能够更快地构建更轻、性能更好的产品。未来的工程师将充当约束经理,能够用文字和参考数据源来表达产品的目标和限制是什么。
据报道,Nvidia 的新算法比不到 2 个月前发布的 DreamFusion 快两倍多。产品和工程公司现在需要努力以新的、面向未来的方式捕捉他们的想法,以便充分利用这种创成式 AI 的爆炸式增长所带来的可能性。
算法的变化速度再次表明,摩尔定律适用于工具数字化的任何地方。
(责任编辑:admin)