文化大数据是“中国的文化档案馆”,是建设文化领域新质生产力的重要组成部分。大数据、人工智能、云计算都是推动产业发展的核心动力。深入开发文化大数据,采用数字化、智能化的方式将中国文化资源生成新内容和新业态,将会为迎接全球新科技、文化创新和产业革命的到来做好充分准备。
从文化大数据到文化大模型到人工智能
AIGC是生成式人工智能,它是集训练模型、多模型技术、生成算法等技术的累积融合。AIGC的核心思想是利用人工智能算法生成具有一定创意和质量的内容。通过训练模型和大量数据的学习,AIGC可以根据输入的条件生成与之相关的内容,例如:通过输入关键词或样本,AIGC可以生成与之相匹配的文章、图像、音频、视频等。具体到影视制作,AIGC流程是:首先对海量电影和文学作品快速进行数据分析,学习其中情节和人物设定,接着再使用自然语言处理技术创作出新的剧本。接下来AIGC还可以根据剧本中的角色描绘和场景需求来设计虚拟演员和背景,计算机图形学、计算机动画和语音合成等技术的应用能让虚拟演员看起来栩栩如生、具有情感和表演能力。通过分析电影的情节氛围和场景内容,AIGC还能够自动生成配乐、音效以及角色配音,使电影更加逼真和感人。在后期制作阶段,通过深度学习计算机视觉技术,AIGC又可以为电影画面添加特效、修复镜头,调整色彩和光影等,以呈现出更加引人入胜的视觉效果。不仅如此,随着技术不断发展,未来AIGC还可以根据观众的选择和反应来调整电影的情节和结局,使观众参与到电影制作中来,从而创造崭新的观影体验。按照上述电影流程,已经可以逐步尝试不使用真人演员和其他的传统电影工种,如编剧、配音、道具、化妆、特效等,这些工种也在一定程度上被AIGC取代。由此可见,文化大数据体系建设是中国文化智能的基础与来源,是不可或缺的宝贵资源。
2021年底美国OPEN AI公司就开始面临数据供应荒,他们在开发最新AI系统时已经耗尽了互联网上所有质量稳定的英文文本源。为此OPEN AI公司在冒着版权风险开始转录YOUTUBE上超过100万小时的视频,以生成新的对话文本,整理出文本随后录入GPT-4系统,形成目前最强的AI模型之一。不久前OPEN AI公司总裁奥特曼在斯坦福讲座,宣布GPT-5将要面市,1000余名学生聆听。其中有学生提问,SORA训练数据用了多少YOUTUBE数据,奥特曼尴尬无法对答。GOOGLE公司也在做着同样的数据收集工作。目前美国各AI公司都在抢夺大数据资源,用做学习训练大模型,目前领先的聊天机器人系统正在从覆盖了3万亿字的数字文本池中深度学习,其体量相当于牛津大学图书馆藏书的2倍,数据量的大小甚至可以决定人工智能的一切。据此可以看出,大数据是人工智能的源头,是被各国争夺的资源,我会实施文化大数据体系建设及知识产权保护,是保护我国文化资源资产的一项重要战略任务。
文化大数据与人工智能引领影视产业的未来
一、人工智能对于剧本创作的影响。当下,拍摄一部电影从策划、剧本、筹拍、拍摄、剪辑、后期到发行等流程,大约需要至少一年的时间,大导演需要更长时间,之所以需要这么多时间,主要在剧本。剧本是一剧之本,电影的一度创作是剧本,二度创作是导演。剧本质量决定一剧质量,是一剧之精华,可见之重要。有了人工智能以后,人工智能会根据作者的提词提供剧本,作者不断提出要求,剧本不断改进,生成新的剧本,直到创作者满意为止。这就大大缩短电影剧本的创作周期。需要一年才能完成的剧本很可能在短短几星期时间内就可以完成。这不是耸人听闻,而是目前正在发生的事情。去年法兰克福国际书展,有四部全部用人工智能创作的长篇小说销售大卖,一书难求。
二、人工智能对电影制作的影响。拍摄方面:目前拍摄电影为体现真实画面,摄制组都要身临其境,比如我们拍摄的《我为你牺牲》这部影片,为体现武警战士在青海高原坚守哨卡的场面,安战军导演带队爬上4772米的雪域高原拍摄,拍摄两天后导演因缺氧导致血压升高到180,制片也冻伤了一只脚,而有了人工智能之后,这些场景都可用AIGC实现。以好莱坞为例,不久前美国OPEN AI公司把SORA的使用权授权给了好莱坞,好莱坞的影视工作者使用SORA技术拍摄了七部短片,片中展现了陆地上的摩天大楼、埃及金字塔等场景,也展现了神秘海底世界的迷人景色。又如刚刚拍摄的成龙电影《传说》,就是用AIGC生成了冰川、沙漠、神庙等宏大场景,这不但节约了时间和投资,也减少了拍摄风险。这一成就得益于海量数据的应用。
特效方面:科幻和魔幻大片因其复杂的特效、特技、渲染需求,往往拥有更长的制作周期。例如,《封神》筹备六年,拍摄三年,总共耗时九年。《流浪地球》的制作周期为四年,用了两千多名工作人员。美国的《终结者》系列更是动用了三千多人的制作团队。这些大投入、高科技的项目大部分时间耗费在特效制作和渲染上。有了AIGC技术之后,AIGC会根据剧本中对角色的描述而匹配演员、背景、场景,结合计算机图形学、计算机动画和语言合成技术让虚拟演员栩栩如生,这就是人工智能“文生图”“文生视频”。此项技术发展十分迅速,原本预计需要到GPT-5版本才能实现的功能,现在已经提前由SORA实现了。对于影视行业来说,这标志着一次颠覆性的变革。以《终结者2-重制版》为例,利用SORA所提供的技术,仅用50名人工智能艺术家经过三个月的时间,就完成了原本需要四年和三千人力的工作量才能拍摄完成的电影内容。目前这部人工智能重新生成的影片已经在北美上映。在我国的实际应用中,陆川导演的《749局》里的一幅人物造型图,原本需要一个团队两周才能完成,而现在通过“文生图”4秒就能生成一幅图像,用一袋烟的功夫就生成了二百张导演最终想获得的造型图。在《流浪地球3》的预告片中,原本需要十人团队两周完成的机器人形象设计,现在一天之内就能完成。
全新的3D技术:目前,文本、图像、画面生成3D模型已经开始应用,这大大地节约了摄制3D影片的时间和成本。著名导演詹姆斯·卡梅隆在《阿凡达》中使用了近百台摄影机来制作拍摄,这体现了当时真3D影片制作的技术需求。现在,AIGC技术已经实现从传统的2D影像中创建立体的3D视觉效果,这极大地提高了视觉呈现的深度和真实感,同时也为制作人提供了低成本高效率和制作的创新。
音乐方面:最新发布人工智能音乐生成平台SUNO已经展示了其在生成具有各种风格和情感的音乐方面的能力,它可以很好地应用于电影的背景音乐和主题曲创作,用户只需输入简单的文本提示,SUNO就能生成具有原创歌词和音乐的完整歌曲,并根据电影的情节、气氛和风格自动产生配乐,为紧张的追逐场面生成快节奏刺激的音乐,或为浪漫场景创造温馨的旋律。
配音:电影配音是一项艺术创作,张艺谋《满江红》最精彩、最震撼人心的是雷佳音朗诵岳飞的《满江红》,因为他是学话剧出身,有着深厚的话剧朗诵功底。他的朗诵使观众心潮澎湃、热血沸腾,把观众情感代入本剧高潮,使影片大为出彩,这就是艺术家用声音表达的艺术魅力与张力。现在用人工智能可以换成任何人来模仿他的声音。AIGC还可以从过去的音频中分析和学习演员的声音特征,以著名电影艺术家李雪健为例,他具有相当独特的声线,但是因为身体原因现在说台词会十分吃力,而AIGC可以模拟他年轻时的声音特征,为新的制作提供配音。另外,多年以来我国影视剧在对外输出时语言与口型不匹配的问题使外国观众不甚满意,这种不一致性降低了作品的观赏性,也是电影国际化面临的重要障碍之一。有了人工智能的同步翻译会大大改善我国电影输出的效果和能力,AIGC技术能将对白或演讲转换成不同语言,并保持原有的语调、风格、情感表达,和口型一致。
动画方面:建立文化大模型时代的到来,对于动画产业尤其重要。特别是在动画造型领域,这种技术使我们有机会创造具有中国特色的形象,解决长期以来动画领域由欧美和日本主导的局面,为本土文化的动画创作提供更多可能性。
电影工业化与知识产权
电影工业化是一个复杂系列工程,导演和制片方在将创意变为现实的道路上,常常受到资金等外部因素的限制。在好莱坞的制作体系中,这一点表现得尤为明显。项目从剧本开始就会进入一个严格的评估阶段,银行或投资者在决定投资一个电影项目时会委托担保公司对制片方的操作进行监督。这一评估和监督流程旨在确保投资的安全及影片质量的保证。导演的拍摄计划必须符合预先设定的要求,一旦偏离,不仅项目可能面临资金担保单位的直接干预,还会使导演个人及其团队也可能因此遭受经济上的损失。这样的制作体系即为电影工业化,其核心要素是项目化、标准化、流程化,分工明确、价格统一,以保证投入产出的准确性和质量保障。AIGC的应用会将中国电影向工业化发展起到至关重要的作用,是我们电影大国向电影强国转变的手段。
知识产权保护随着大数据和人工智能技术的日益成熟变得尤为重要。2023年,美国影视界经历了一场重大的罢工事件,其中编剧工会的罢工持续了148天,主要核心是知识产权和剧本著作权。这场罢工源于人工智能大数据不经编剧许可采用大量剧本数据,用于创作出新的剧本,这对编剧不但构成知识产权侵犯,还对编剧职业带来危机。经过长达148天的斗争,最终达成的协议是以人工创作为主,人工智能技术为辅的工作流程。
在这个大数据时代,几乎所有的影视作品都被输入到数据库中,通过人工智能技术,可以轻松地将演员的形象组合拼凑,这种做法引发了演员们的强烈反对。演员工会也因为大数据无偿采用演员肖像权而发起了罢工,这场罢工持续了118天。这次罢工最终好莱坞方面同意为演员提供总额达10亿美元的三年工作基金,以缓解演员们的不满,并确保使用人工智能技术时会采取监管措施来保护演员们的肖像权。
这一情形反映了当下影视行业面临人工智能的挑战和危机,同时也突显了在技术快速发展的今天,人的创造力依旧是不可或缺的,同时也反映出知识产权保护在这一背景下显得尤为重要。只有创作者和演员的权益得到充分保护,才能促进行业的健康发展。
总之,经过这两年文化大数据体系建设工作,我体会到文化大数据是新质生产力的重要组成,是由新科技推动文化产业发展的核心动力。体系建设对打破壁垒,推动多媒体的融合,形成资源共享有着主要的纽带作用。文化大数据为构建中华文化大模型提供了坚实的基础,并在打造中国智能文化体系,塑造审美标准和弘扬主流价值观方面发挥着不可替代的重要作用。文化大数据体系的建设不仅为迎接全球新型文化智能体系提供了支持,而且有助于突破文化智能领域的霸权封锁。在世界格局中,在文化战略上做了高度的谋划和实践。
(作者为中国公共关系协会文化大数据产业委员会专家组成员,根据在国家文化大数据体系建设推进会上的发言整理)