人工智能开启创意未来（上）

编者按

本文来自 GDC 官方 Youtube 频道的《GDC 2023》合集，原内容形式为视频演讲。目前，indienova 已取得 GDC Youtube 频道的视频转文稿译制授权，未来将持续进行 GDC 历年精华演讲的编译整理工作，以图文形式分享。

应版权方要求，我们将在每篇文章的文首嵌入原 Youtube 视频。考虑到可能存在的播放问题，我们将继续与 GDC 官方沟通，力图为国内读者带来更便利的呈现形式和更舒适的阅读/观看体验。

演讲人：Andrew Maximov
译者：carolinelee

视频：《Creative Future with Artificial Intelligence》

导语

大家早上好！感谢各位来到 GDC，已经是第五天了，很感谢你们不顾宿醉、失眠以及种种疲惫来到这里，希望大家交到了好朋友，留下了美好的回忆，积累了奇妙创意方面的人脉，这带给你们的影响将会比这一周还要长。

正如你们所见，今天的演讲是我 2019 年演讲的续集，而 2019 年的演讲是我 2017 年演讲的续集，2017 年那次又算是我 2013 年演讲的续集[1]。这挺有意思的，我这些年来一直站在这里谈论创造力、技术以及它们之间的关系，探讨如何让它们提供最好的服务，以及如何通过最有效的视角看待它们。

有时候，我觉得自己就像下面的表情包，同时我又有点失落，因为我没能用 120 张幻灯片解决整个行业的问题，所以打算再试一次。但我一直在想，2019 年的那场演讲中，我介绍了所有你可以期待的酷炫人工智能技术以及它们未来的样子，那时人们还没有深入讨论 AI。而现在，就连路过一台烤面包机时，你都会听到它在介绍自己新添的 AI 功能，人工智能已经无处不在。

老头怒怼新潮流

所以我得转变思路，思考什么内容才对大家最有帮助？怎样才不会重复那些老掉牙的内容？我觉得要从对如今行业内每个人都最有用的点讲起，不是该如何利用人工智能，而是它正在对我们产生什么影响。

我在游戏行业经营一家人工智能公司差不多有五年时间了，跟一些顶尖工作室、一些很棒的 3A 游戏开发者以及一些出色的独立开发者有过合作。你会不由自主地感觉到，很多人对这项技术的态度是困惑、担忧甚至排斥的，而且信不信由你，我也认同这种态度。这让我很担忧，因为这正是我十年来一直在谈论的事。希望到最后我们能认识到，很多人有这种感受，是因为像我这样在台上讲了 10 年艺术和教育相关内容的人，一直都没能把艺术和游戏开发是什么，以及我们为什么要做这些事讲透彻。

创作者、工具与艺术

这是一张 10 年前的幻灯片，主要讲在这个行业里，我们是如何把自己和技术混为一谈的。我们把身份认同投入到了技艺上，而非艺术本身，这很危险，15 年前我刚开始做艺术家时也是如此，当时我没意识到我工作的价值所在。想象一下 500 年前你想成为一名艺术家，如果那时你说“我要学习如何使用铅笔”，人们会觉得很荒谬。而如今你说“我要成为一名 3D 建模师，要去学习虚幻引擎或 Maya 软件”，听起来就很顺理成章。问题在于，这些东西和你真正要做的事并没有什么关联，你不是你的工具，你的工具也不等同于你的艺术。

工具 vs.职业

我觉得，由于游戏行业如此复杂，以及教育和软件行业的急功近利，会让你认为他们的软件就是这个职业的全部了。但事实并非如此，比如音乐领域中，作曲和演奏乐器并没有太大关联，当然，你需要乐器来演奏音乐，但即便你可以把乐器演奏得很完美，却也可能是一位糟糕的作曲家。

在这个行业，我们需要有创造力的人，而不是只会重复再现的人。我不想让你们只是一遍又一遍地重复做同样的事、做别人做过的事，而是去创作。我觉得这并非常识，在这个行业，很多初级美术师在入职时就觉得，知道按哪些按钮，会用哪些软件就能成为专业人士、艺术家或者工程师，这挺可怕的。

艺术品 vs.产品

但这件事还有另一个方面，有趣也令人沮丧，那是我在 2018 年的一场演讲中抨击的内容，也是我们的工作变得如此碎片化的原因。我们的职位变得如此细分、专业化，这是我们在公司和组织中看待自己的方式，也是我们在与最终产品、受众、我们热爱的游戏的关系中看待自己的方式。

花在作品集上的精力比花在游戏制作上的还要多，这种情况并不少见，人们一心想让自己负责的那部分做到最好，却忽视了对整体产品的影响。如果想要打造富有创造力、兼容并且蓬勃发展的行业，每个人都应该成为整体体验的主导者，每位美术师、工程师、动画师不仅要把分内之事做到最好，而且要以此让整个产品变得更好。

但我们并没有做到这一点，因为这个行业的规模非常庞大，而且当你只想着把产品做出来推向市场时，也很难专注于这一点。试想你是 20 世纪军队里的一名鼓手，有一天上级表示不再需要鼓手了，你可能不会那么难过，因为你不想丢了性命。这是一个很有趣的隐喻，在某些行业，人们心里很明白，交付的成果（战争胜利）才是最重要的。然而不知为何，在游戏行业，我们却陷入了这样的困境：我就是喜欢按那种方式做事，那我为什么不能继续那样做呢？答案很简单，因为你的受众。你是在制作一款游戏，而不只是创作一件艺术品。我觉得我们都需要多关注这个问题。

技术、标准与特殊性

在进行了无数次交流后，我最近发现，人们对人工智能的恐惧与从业经验呈相当线性的关联。显然，我们需要做一些限制来使模型符合道德规范、来源合规，我们稍后会讨论这个问题。关于工具，我一直在重复且会坚持的重要一点是，工具不会提高标准，它们只是抬高了下限。当类似 MetaHuman [2] 这样的插件出现时，它对那些拼命努力想要提高标准的人有什么影响呢？通常没什么影响。那些有志于推动艺术水准进步的人，在任何时候都专注于特殊性，专注于那最后的 2-4% ，正是这些特殊性让他们脱颖而出，比其他人更具优势。

技术 vs.特殊性

因此，每当一项新技术出现时，它只对那些不依赖技术就无法完成任务的人具有颠覆性，他们必须转型或转向新技术，所以一切讨论又回到了高度特殊性上。如果我没办法做出这么贴合具体要求的 MetaHuman，但能得到有 95%相似度的成果，那么对于一款独立游戏来说就很棒了。但对 3A 项目来说不行，因为 3A 项目必须确保角色模型具备某些特质、某些面部特征、特有的拓扑结构等。所以，我们在谈论新技术以及为什么资深开发者并未受很大影响时，是因为他们已经高度专注于最后 5%的质量了。

差异化价值

这涉及到我 2017 年 GDC 演讲的内容，基本上大部分创作过程，归根结底就是要如何讲述一个独特的故事。如果把时间跨度拉得足够长，到了某个时候，每个人都能免费获取高质量成果——也许再过 10 年甚至更短的时间就可以。这会让我们处于何种境地？你能为受众提供的唯一有差异化价值的东西，就是你赋予作品的某种独特目的或意义，可能是乔尔（Joel）[3] 的面部特征。所以，随着时间推移，大部分资深人士的思维重点就放在了，我所提供的差异化价值并不在于拥有某个东西，而在于拥有非常独特的东西。

我经常谈到这个话题，人们会问我，艺术家和艺术总监有什么区别。大多数艺术家会把时间花在从 0 到 75%的阶段，努力让作品达到在紧急情况下足以交付的水平。关键在于其中产生差异化的地方，也就是有望让项目脱颖而出的地方，它出现在最后的那几个百分点里，那是艺术总监投入大部分精力、花费大部分时间的地方。

下方的图表粗略展示了帕累托最优（Pareto Optimum）[4] 原理，这是个很古老的概念，大概从 19 世纪就有了。它的基本理念很简单，就是 20%的工作需要花费 80%的时间，反之亦然，也就是 80%的工作需要花费 20%的时间。这意味着要把某样东西做到人人都能达到的基本水平是很容易的。

在行业中，我们一直都能看到这种情况，比如制作顽皮狗（Naughty Dog）[5] 那种水平的关卡。达到基准水平并不难，那要怎样才能把它提升到前所未有的质量呢？这就是我们花费大部分时间去思考的地方，框架的搭建很快，但最后的创意部分很难。而创造性和再现性基本上是由多少人能够完成它界定的。如果 80%的人都能做这件事，那么它本身就没什么价值了。如果市面上的游戏有 80%都具备这样的质量，对受众来说它就没什么价值了，因为我们没有做出差异化。

标准的提高

随着时间推移，资深美术、主美会把重心转移到最后的 2%上。当发现可以使用指关节混合贴图让角色的骨头在弯曲时显现出来，展现出那种极其细微却能让逼真度再提高 1%的细节时，我们会超级兴奋，那就是我们要达到的境界。你进入这个行业的目标就是给人带来愉悦，提高标准，做出令人激动的东西。

如果我们把所有时间都花在再现上，这有什么令人兴奋的呢？我们为什么执着于此，而不是问自己要如何提高标准呢？我觉得这就是核心问题。

在艺术领域，这一点相当直接，而我为此抱怨了 10 年。以我的经验，一名艺术家要在工作 4、5 年后，才会开始关注灯光、摄影和构图，而这些恰恰是最有用的技能。我数不清自己花了多少个小时去教这些核心基础知识了，关键不在于建模和贴图，而在于能否选定一个好的调色板。所有这些属于艺术而非工具范畴的东西，是我们长久以来所忽视的。

其他职业领域也是如此。我们会遇到创意方面的问题，提出想法，进入执行阶段。有一件事是绝对确定且不可避免的，那就是执行时间会不断缩短，这就是技术发展的结果。困难又令人兴奋的部分在于想出合适的解决方案，适用于你的项目和受众、能增加独特价值的方案。

我的观点是，我们一直都缺失一些非常关键的核心理解。很多时候，在关于我们工作的价值所在，在工具、技艺和艺术的区别，在公司和受众期望我们提供什么价值等对话中，我们常常缺乏这种理解。

当人们理所当然地觉得自己的梦想被人工智能夺走时，我能理解那种感觉，正因为如此，我们应该带着同理心去进行这样的对话，因为任何感觉被背叛的人都没有错。他们投身于一个行业，遵循着一个将技术与艺术混为一谈的教育体系，很多时候，这个体系并没有正确的价值观。当你全身心投入其中，为此背负了沉重的债务，然后有人跟你说“你知道吗？这没有任何价值”，你也会很生气的。

职业发展

价值观

如果我们要体面地发展，有几件事可以做。这取决于我们所有人，包括在台上高谈阔论教育话题的人，也包括你的同事、你管理的人以及管理你的人。我们可以开展这样的对话，比如我们的价值观对共事的人意味着什么，以及这些价值观如何反映在回报机制、他们的目标以及他们在工作中的成就感上等。

其中一点很简单。我们首先都是游戏开发者，如果你进入这个行业时想着“我只是个工程师，我不在乎自己做什么，只是想多写些完整代码”，那你就会遇到这样的情况：你的代码用什么词形容好呢，反正就是不那么完美，因为你得推出一款游戏。而且代码会不断打上补丁，这儿补一下那儿补一下，就像全是用胶带粘起来似的。这样可不太好，因为代码不是产品，你推出的游戏才是。对你的美术作品、动画、从事的任何方面的工作来说都是如此，它们都是为游戏服务的。如果你不想拥有一个令人失望的职业生涯，需要始终牢记这一点。

这同样适用于公司，当我们和其他人共事，自身局限在一个很细分的岗位上，比如你是武器美术师，或者你接下来一整年都要为下一部《侠盗猎车手》（GTA）制作车轮，那就很难感觉到自己是整个制作流程的一部分，很难感觉到自己在为一款游戏做贡献，这都是人员架构安排造成的。我们把工作碎片化、分割开来，剥夺了人们的创意主导权，还设置了层层等级制度。一旦这项工作被拿走，他们就会突然觉得自己被剥夺了什么。

但其实不必如此，因为从根本上来说，每个人都应该思考自己如何让游戏变得更好。当每个人都被邀请参与这种创造性贡献时，你会发现你的产品变得更好了，人们也会更开心，更有成就感。所以，我觉得这是一个值得坚守的良好价值观。

创意主导权

与此相关的另一点是，我们没必要处在重复再现的底层空间里，只是埋头苦干，做着行业里很多人也能做的事。我们要如何才能去做那些有差异化的、对自己、项目、团队来说都独一无二，那些能提高标准、吸引受众的事呢？为什么我们不把 99%的时间花在这上面，而非要去做那些流程中的常规性工作呢？

所以我觉得，没有足够多的人被引导去进行这样的思考，没有被引导去考虑他们要如何提高标准，怎样才能做出前人未做过的事。而且我觉得，如果人们拥有创意主导权，自己的创意受到欢迎，那就更容易把自己当作游戏开发者了。

提醒&信念

最后，工具本身并不重要。倘若我们能将这一点内化于心，事情就会变得容易得多。我们的价值观会从根本上决定我们如何度过这个转变阶段，如何帮助其他人度过这个阶段，以及如何确保方式正当——即便这并非你的过错，即便你只是想经营一家公司、制作一款出色的游戏、运用一些人工智能技术并公开了这一点。

你要如何确保人们愿意与你共事？如何确保人们会兴奋地加入这场冒险，而不是觉得你在与他们作对？当大家汇聚在一起，把所有创意想法整合起来，彼此激发创意、充满活力与激情地制作游戏时，游戏会变得更好。而所有这一切都可以回溯到这些核心要点上。

格局&责任

我们谈到要试着邀请更多人参与到这场创意盛宴中，因为显然刚入行的从业者是对人工智能最为苦恼的群体。但我觉得反过来也适用，无论你认为自己的工作是什么，无论你觉得自己未来的工作会是什么样，把眼光放长远些，你能做到的比你想象的更多，到了明年以及后年，你甚至能做到更多的事。

如果你觉得自己进入这个行业就是为了给模型表面做纹理映射、制作模型的细节层级网格，那我得严肃地告诉你，并非如此，你值得更好的发展。如果你不将这一点内化于心，行业也会迫使你这么做，而且这带来的觉醒可能远比你想象的更深刻。想想自己的想法有多宏大，把格局放大一点，在这个行业里，越来越多的东西变得触手可及，如果不这样想，这个行业是没有未来的。主动承担起责任吧，我保证它会在很多有意思的方面带来回报。

AI 技术

刚才算是个开场白，但其实也算总结。现在，我们要转向更实际一点的内容了。我想讨论我们为什么以及该如何处理这些事情，也要稍微谈谈如何以一种不让人感到有威胁的方式看待人工智能。

生成式 AI

你们现在经常能听到生成式 AI 这个词，我不确定它算不算一个术语，我喜欢这个说法，因为它很好地界定了它所能解决的问题的范围。而且它没有威胁性、容易上手，这意味着当你们手头积压了太多数据时，有技术能够帮助你们处理。它可以帮你理清思路，获得深刻见解。有个非常简单、大家都容易接受的做法是在开会、打电话时使用人工智能。所有相关平台都具备为会议添加注释并生成纯文本内容的功能。在此基础上，你可以再用另一个人工智能来生成会议内容摘要。

如果你们是一个小团队，利用人工智能实现制作流程自动化会很棒，因为没人愿意做这些事。在大团队中，有太多信息在四处传播，你没办法把它们都弄明白、跟进所有信息、参加每一场会议。所以，与其耐着性子听完 15 分钟的录音，不如直接把它交给人工智能，让它生成一张有 20 个要点的列表，这能节省大量时间。

顺便说一下，这么做还有一个很有价值的地方，那就是随着时间推移，它能让内容变得可搜索。如果你之后需要回顾某些内容，只需要在 Slack [6] 里输入关键词即可。强烈推荐大家这么做。

分析式 AI

下一个例子关于学习方面，我打算做现场演示。如果我正在浏览一大段代码，心里想“这个函数是用来做什么的”，我就会把它交给 ChatGPT，问“这是什么？你能解释一下它是怎么运行的吗？”

询问人工智能某个函数的功能以及其中是否存在潜在 Bug

这是能让你有条件做更多事、学习更多知识的好办法，因为很多时候，我们往往会觉得有些事超出了我们的认知范围，不该去费心了解，但信息是存在的。如果你花足够长的时间使用谷歌搜索，你是可以自学编程的，但用 ChatGPT 要快得多。如果你利用 AI 对遇到的任何信息进行分析，就会突然间变得更聪明。每次工作中有人用了一个你不理解的短语，每次涉及到编写脚本、开发工具之类的工作时，你都会因使用 AI 分析变得更出色。

它给出了关于此函数的说明。然后我可以问“这是否可能会导致 Bug？”它再次给出回复。作为一个既做大量工程工作，同时又管理着一支工程师团队以及一支美术团队的人来说，出现 Bug 是个很让人担心的问题。所以这样的问题很有价值，不过它的回答不总是正确的。

关键在于你可以提问，可以针对任何文本寻求建议，因为你可能在编写剧本，写关于某个角色的故事，你可以问“这个角色听起来像是有说服力的，还是更偏向于自我牺牲？”

我打算再做一个和资源资产相关的演示。我们的项目都充斥着大量内容，比如我刚下载了一个新资源包，里面有超多东西，我完全不清楚里面具体有什么。

资源包中的大量素材

人工智能有个很方便的用处，就是梳理、分析你的内容，并准确告诉你里面都有什么。当把资源添加到库后，你就可以用自然语言来查找所有资源了，我数不清自己参与过多少次差点吵翻天的对话，就是为了争论把某个东西放到哪个文件夹里了，我相信你们也经历过那些情况。现在我们没必要在意这些了。命名规范只有在大家都记住的情况下才有用，可从来没人能记住。现在我们可以把所有内容交给人工智能处理。

引入 AI 工具 Promethea，准备处理资源

你可以输入指令，比如“展示食物/植物/盾牌”，顺便说一下，这些东西都不需要提前标注好。

输入指令来显示所需资源

AI 能帮你在可能多达数太字节的资源中节省大量时间，这是一个非常简单且没有威胁性的解决方案。这也适用于学习，我们可以随便导入一大堆图片，比如这样。

无排列结构的图片

我们可以从视觉角度针对图像提问，比如“给我展示定场镜头的精彩示例”。对于展示内容，我可以再输入指令说“这些定场镜头挺有意思，有没有镜头带有很棒的黄金时段光线？”

输入指令处理图像

你还可以针对所有感兴趣的东西提出要求，不管这些内容是你的参考资料，还是 3D 资产、2D 资产。分析式 AI 能够直接为你提供信息。强烈推荐大家使用这种方法。

如何看待生成式 AI？

现在，我们要来谈谈生成式 AI。这是个有意思的话题，因为我仍然觉得，关于我们如何看待它还有值得讨论的地方。

有人能告诉我下图是什么吗？给个提示：艺术家们很“害怕”它。是弓吗？空白屏幕？空白画布？20 还是 25 年前刚开始画水彩画的时候，我做过一项很棒的初始练习，在纸上随意泼洒一些水彩颜料，然后坐在那儿看着它，直到看出点什么来。在游戏行业和概念艺术领域，我们长期以来一直在做这样的练习。不知道还有没有人记得大概 10 年前一款叫 Alchemy [7] 的软件，它能在页面上随机生成一些形状，帮你寻找设计灵感。

水彩颜料泼洒出的色块

Alchemy 随机生成的形状

所以，你是从某个已有的东西入手工作的，我们一直都在这么做。我觉得看待生成式 AI 的正确方式就是，没必要总是一切从零开始。

想想电影吧。每次拍新电影时，导演不会说“咱们从头开始打造所有家具”，而是会走进一家咖啡店，说：“换一下窗帘，把摄像机放在这儿，灯光打在那儿，就可以开拍了。”无论你在做什么，只要有个入手点，就能节省大量时间。

那么来谈谈入手点。不管你要做什么，都可以借助 AI 进行头脑风暴，比如问“你能给我提供 10 个创意，以便我制作酷炫的环境艺术作品集，入职暴雪吗？”，然后追问“这个创意好在哪里？”，也可以说“给我 10 个酷炫的独立游戏特色创意”，再追问“怎么能给跳跃机制来点变化呢？”

要求 AI 提供 10 个优秀的环境艺术作品集项目创意，以帮助用户入职暴雪。

AI 给出的回答包括：一幅细致的魔法森林景观、一处设定在未来世界的庞大都市、一个宏伟的水下王国、一座阴森恐怖的废弃城堡、一片后启示录风格的荒原、一颗充满奇幻色彩的外星星球、一片冰冻的苔原、一个魔法王国、一座充满活力的夜城和一个神秘的领域

你通常会找到像水彩颜料泼洒出的色块那样的起始点，而不是干坐在那儿毫无头绪。你会去玩其他 25 款游戏，看一部电影，借助人工智能本质上也是一样的，只不过你是在获取互联网上众人的智慧，这很有价值。

所以，不管你有什么想法，都可以试试。我还会交给 AI 做一些我不喜欢的事，比如社交媒体相关工作。

要求 AI 写一条推特，AI 生成的内容为：“激动人心的消息！我们的人工智能公司在 @英伟达的主题演讲中亮相。很抱歉最近一直没有消息，但我们正努力开发更多更新内容，为大家带来更多开创性的技术。敬请期待！# 人工智能 #英伟达 #创新”

AI 一个很给力的地方在于，它并非只能聚焦于你的核心专长。它在你不想做、不属于你核心专长的事情上同样表现出色，而这些往往是你最容易拖延的事。那就别犹豫了，把任务委派出去吧。

写代码也一样。就拿 Promethean [8] 来说，我们把它集成到了每一个 3D 编辑器中。有些编辑器我不怎么常用，所以每次需要编写一个 Blender 脚本时，我就会想让 ChatGPT 上。工程方面也是如此，要是你给我展示一段在某个特定软件里能运行的代码，我就能弄明白如何去调整它，为我所用。但要是从空白画布开始，那可就要命了，因为我得在网上搜索 20 个例子，然后找出哪个能用。

让 AI 编写一个 Python Maya 脚本，用于沿样条线分布盒子

顺便说一件超酷的事，我强烈推荐所有游戏工作室这么做。这个行业有很多工程师，但很少有人能去帮助美术师，因为美术师的相关工作挺专业的。要是有人知道怎么在 Maya 里写脚本，再加上一位工程师，那就能成为技术美术了。

所以，把人工智能当作一种翻译机制，可以更好地帮助其他岗位，而且这是双向的。你想节省时间来创作艺术作品，那就把任务委派出去，然后专注于你熟悉的领域。

现在我们会在 Promethean 尝试用人工智能编写至少 10%的代码，这很有效，而且速度更快。对我们来说，关键在于提出恰当的问题、获取准确的背景环境信息、构建合适的功能，因为你不想被困在思考代码里的字母和函数名的层面。我们为何不尝试一个功能，如果不起作用就舍弃它呢？拥有这样的灵活性是很棒的。从根本上来说，每个产品的质量是由迭代能力决定的。所以，我们所有的技术从一开始就在往这个方向努力，最终我们甚至能迭代所有功能。只需提出需求就行，这太令人兴奋了。

法律责任问题

接下来是使用相关技术涉及的法律责任问题。我相信很多人都听说过，现在有大量针对 AI 的诉讼，还有一群艺术家发起了集体诉讼，我记得还有一起 Shutterstock [9] 针对 Stable Diffusion 的诉讼。所以，还有很多事情有待裁定。

我得坦诚相告，在那起案件中，我是艺术家一方的专家证人。作为一家生成式 AI 公司的 CEO，却要帮助艺术家起诉生成式 AI，但我认为行业需要具备伦理规范，关心艺术家的福祉，以正确的方式赋予他们力量，不滥用他们的数据、知识产权以及其他权益，让他们有底气维护自己的权益。我们需要做的是设置合适的优先级，树立正确的榜样，制定合理的规章制度，然后确保所有相关人士能从中受益，而不是被完全取代。

这就是我之前想要表达的观点。对于生成式 AI，如果你仅仅因为输入了一串文本就觉得自己的工作完成了，说明你对正在做的事缺乏足够深入的专业知识，没有达到那条曲线最后 4-5%的层面。你产品的质量取决于你能否将其与自身的叙事、特定的意图、设计理念妥善结合，关键在于让一切都具备极强的特殊性。

以《神秘海域 4》（Uncharted 4）[10] 为例，里面有这样一个关卡，德雷克（Drake）在船失事后漂流到一座岛上，岛上没有任何元素是随便生成的，它们颜色和形状的选择都有讲究。游戏中有各种各样的植物，在角色处于最低谷的那个场景，每一株植物都尽可能尖锐，每一块石头都尽可能参差不齐，每一种颜色都尽可能显得冰冷，每一个表面都尽可能营造出湿漉漉、脏兮兮且令人难受的氛围。关键在于我们要赋予其意义，这就是工作的价值所在，先有创作意图，然后通过每一个小细节将其表达出来。

生成式 AI 对于构思创意、提供参考以及创作概念艺术很有帮助，但它在理解事物方面存在很多漏洞，这里有两点需要注意。

如果人们将基于火车或狮子数据集 [11] 训练的扩散模型运用于电子游戏中，那么会存在输出被视为抄袭的作品的概率。从技术层面来讲，如果你想快速致富，那就找一款包含用户生成内容的游戏，利用这类模型生成一千张小图片，然后在数据集中使用反向图像搜索，看看它是否与别人创作的内容相似。联系那位艺术家，让他起诉游戏公司，这样你就能大赚一笔了。这种情况是不可避免的，这就是棘手的地方。

索尼这样的公司会对放入游戏的每一个素材进行再三检查，因为如果涉及侵犯他人的知识产权，就意味着印制的一千万张蓝光光盘都得下架。在这个问题完全解决之前，大多数大公司都有类似规定，建议大家目前不要把生成式 AI 输出的内容作为最终内容使用。

另一方面就是伦理层面的问题了。说实话，这令我颇受鼓舞并感到暖心。有时候我和一些工作室交流，他们已经获得了使用这些工具的法律许可，但却说“要等等看诉讼结果如何，因为我们要确保自己对创意群体是包容且友好的。如果承担不起可能出现的侵权后果，我们会使用那些受法律许可的工具。”

大家都很关心 3D，所以我想快速谈谈这方面。Point-E [12] 刚一推出，我们就用它对大约 3000 种物体排列组合进行了测试，有人能猜出下图是什么吗？是一束花。这里有一个有意思的点，潜在空间的深度，意思是输入相同的提示词进行 3D 生成和 2D 生成，看看两者有什么不同。

但有一件事我觉得考虑得不够充分，从 2D 到 3D 不只是增加一个纵深维度。从根本上来说，它需要高得多的分辨率，而且对于每个 3D 像素而言，其上还需叠加多层材质信息。你需要了解粗糙度、高光反射、法线信息、反照率信息，可能还有次表面散射以及透明度信息。所以实际不是从二维变到三维，而是十维。

这个问题还需很久才能得到妥善解决，大概还需要 2-4 年，不过有资金正在投入。过去 10 年，尤其是在 3A 领域，很少有公司自己制作游戏资产。从某种意义上来说这是合理的，如果你是资深游戏制作人，试图专注于提供独特价值的东西，那么你要做的就是尝试定义一个愿景、一种风格，相关资产可以在其他地方更快、更便宜地制作出来。

如今围绕人工智能的讨论如同我们在 10 到 15 年前谈论外包问题，当下，外包已经变得十分常见。所以，当谈到对 3D 资产制作产生的颠覆性影响时，另一个有意思的点在于，至少在 3A 领域，我不确定这种颠覆性影响会体现在哪里，因为长期以来，大多数 3D 资产都不是由公司内部制作的。这其实也和教育有关，我已经为此呼吁了整整 8 年。游戏工作室其实并没有所谓道具美术师这种岗位，我们所创造的价值在于构建世界、讲述故事、引导玩家体验游戏，道具则是在其他地方制作的。

从足够长的时间跨度来看，开发游戏就像拍摄电影那样，整个世界都将被完整扫描下来。雷德利・斯科特（Ridley Scott）[13] 不会说“好吧，在开拍这部电影前，我们得手工制作所有椅子”，你也不会那样做，你要做的是“组装”，镜头设计、布置灯光，以及所有这些很酷的事儿。这就是 3D 相关的情况。

译者注：
[1] 演讲者以往在 GDC 发表过的三次演讲：《借助人工智能的创意未来》（Art Direction Bootcamp: Building a Creative Future with Artificial Intelligence, 2019）；《艺术创作的未来》（The Future of Art Production in Games, 2017）；《美要做到何种程度才算够》（Analyzing Beauty In Video Games, 2013）。
[2] MetaHuman 是一种完整框架，可以让创作者在虚幻引擎 5 项目中创建并使用完全绑定且高度逼真的数字人类。美术师将其自定义的面部网格体转化成带完整绑定的、可用于动画制作的 MetaHuman，还可以在 MetaHuman Creator 中进一步完善角色。
[3]《最后生还者》（The Last of Us）及其衍生作品中的角色。
[4] 由 19 世纪意大利经济学家维弗雷多·帕累托提出，指资源分配的一种理想状态，假定固有的一群人和可分配的资源，从一种分配状态到另一种状态的变化中，在没有使任何人境况变坏的前提下，使得至少一个人的境况变得更好，这就是帕累托改进或帕累托最优化。
[5] 创建于 1984 年，前身为果酱软件，现为索尼公司旗下全资子公司。
[6] 世界上最受欢迎的工作平台和团队消息传递应用程序之一。
[7] 其核心理念是通过随机生成形状和图形，帮助用户打破常规思维，激发创作灵感。与传统绘图软件不同，Alchemy 强调“不确定性”和“即兴创作”。
[8] 此处指 Promethean AI。一款由前顽皮狗技术美术总监 Andrew Maximov 创立的 AI 辅助工具，旨在通过人工智能技术简化游戏开发中的场景设计和资源管理流程。它能够根据用户的自然语言指令自动生成复杂的 3D 场景，并支持与主流游戏引擎的无缝集成。
[9] 商业图片交易商，成立于 2003 年，总部位于美国纽约。Shutterstock 拥有一个在线图书馆，里面存储着海量的照片和各种专业图片，用户可以订阅其服务下载想要的图片。Shutterstock 旗下全球最大的微利图片库已经上市，主要销售正版图片、插画、矢量图、音乐、视频素材，国内目前由站酷旗下的海洛创意独家代理。
[10] 顽皮狗开发的动作冒险类游戏，于 2016 年发行。讲述主角德雷克被强行拉回盗贼世界的故事，玩家将以寻找传说中海盗的宝藏并揭露历史中隐藏的阴谋为主线进行全新的世界旅行。
[11] 这两类数据集分别针对火车和狮子的目标检测任务，具有明确的标注格式和应用场景。火车数据集适用于铁路安全检测，而狮子数据集则服务于野生动物保护和研究。两者均支持 YOLO 格式，适合用于训练目标检测模型。
[12] OpenAI 的开源 3D 模型生成器，是一种高效的 3D 点云生成方法，通过两个扩散模型，可从复杂文本提示快速生成 3D 点云。Point-E 中的 E 代表“效率”，表示其比以前的 3D 对象生成方法更快。
[13] 著名导演、制片人，1937 年出生于英国，以独特的视觉风格和对细节的精细把控著称，代表作有《异形》《银翼杀手》《角斗士》等。