webwxgetmsgimg_副本.jpg
《传媒观察》|重建物理世界:Sora的发展趋势与边界重构
2024-04-25 18:34:00  来源:传媒观察  作者:喻国明 滕文强  
1
听新闻

编者按:继ChatGPT后,2024年2月16日,美国Open AI发布了第一款文生视频模型Sora,与先前的视频生成模型相比,Sora的特点在于其能够在保持对用户文本指令遵循的同时生成长达1分钟的高质量视频,实现了内容合成从文本到图像、再到视频的领域跨越。喻国明教授和博士生滕文强在《传媒观察》2024年第4期刊文,认为Sora的出现是媒介演进脉络下通用人工智能发展的里程碑,宣告了AGI技术路线从理论走向实践的进程正在加快。面对技术的快速迭代发展,社会需要快速适应人工智能的发展速度并做出相应的适配与调整。文章从Sora作为“世界模拟器”的媒介新属性出发,将传播革命视为时代变革的最根本驱动力,通过厘清媒介价值向度的迭代来理解和研判Sora的发展趋势以及相对应的社会变革,以期深刻把握媒介连接力的运作路径,通过“连接-场域”的二维分析框架深刻把握智能世界社会边界的全方位重塑。

一、Sora:媒介演进脉络下通用人工智能发展的里程碑

自1950年以来,科技的进步使得人工智能的发展遵循着两大范式:逻辑启发式和生物启发式。逻辑启发式将智能技术视为基于规则的推理过程,而生物启发式则认为智能技术根源于学习来调整神经网络中的连接强度。机器像人类大脑一样具备思考的能力逐步走向现实。继ChatGPT后,2024年2月16日,美国Open AI发布了第一款文生视频模型Sora, Sora能够在保持对用户文本指令遵循的同时生成长达1分钟的高质量视频,实现了内容合成从文本到图像、再到视频的领域跨越,其诞生无疑宣告了AGI技术路线从理论走向实践的步伐逐步加快,在世界模拟这一能力上已然走通,具有战略意义。以ChatGPT为节点,可以将人工智能的发展划分为三个阶段:一维线性发展阶段、二维通用涌现阶段、三维体验泛化阶段。

在以ChatGPT为代表的生成式人工智能出现之前为“一维线性发展阶段”。在这个阶段人工智能表现为面向特定领域问题并寻求专用的解决方案。例如生产财报类新闻的智能写作平台Wordsmith、人工智能阿尔法狗(AlphaGo)等,但这种能力仅是“线性且单一”的,未取得通用性进展。2022年末,ChatGPT问世,基于大规模数据训练的生成式AI展现出涌现能力,此阶段为“二维通用涌现阶段”。ChatGPT构建了人工智能与自然语言相结合的超级系统,是人类从弱人工智能时代迈向强人工智能时代的具有里程碑意义的一步,开启了社会与传播的全面智能化进程。在Sora这个“世界模拟器”中,人工智能开始构筑世界样态,试图开始“理解世界”,此阶段为“三维体验泛化阶段”。作为一个视觉数据模型,Sora以场景媒介的方式构筑了一个与人类认知感觉上完全一致的真实场景,其通用性能力显著提升。在该阶段,人工智能开始具备感知、理解等思维能力并能够完成自我进化和创造性思考,理解世界和社会内部的复杂系统,并作出深度决策。

Sora的诞生大大加速了AGI的发展进程,它已然站在AI通向AGI的发展节点上,通过自主学习理解和模仿物理世界的智能涌现能力,Sora拉开了重建物理世界的序幕。因此,将传播革命视为时代变革的最根本驱动力,通过厘清媒介连接力价值向度的迭代来理解和研判Sora的发展趋势以及社会变革,深刻把握媒介连接力的运作路径,通过媒介“连接-场域”的二维分析框架深刻把握智能世界人类实践场域的全方位重塑,可能才是最经得起中长时段检验的视角。

二、从“连接度”到“包容度”:媒介连接力价值向度的内化重返

从人工智能到通用性人工智能,每一次技术的创新都会伴随着媒介连接场域的生态级变革。作为未来媒介的全新样态,Sora在通用性上对媒介要素和颗粒度进行迭代式补偿,给未来媒介提供了一个基本的架构和底层逻辑。但是,技术创新有着典型的“奈特氏不确定性”,即无法被衡量、不能被计算或然率的风险。而另一方面,技术创新遵循自然科学规律,有着其内在的客观性和规律性,不以人的意志为转移。因此,技术创新与媒介变迁尽管复杂,却依然有迹可循。重新思考技术创新背景下媒介变迁的底层逻辑显得尤为重要。

(一)数字连接度:横向连接下媒介价值的数量级扩张

一直以来,连接与再连接是互联网改造世界的基本逻辑,创新的传播技术和传播形态以及传播制度,是否扩张个体社会连接的丰富性,是否提升个体之间信息的流动性,横向连接的数量级关系是考察媒介与社会的融合协同的价值标准。媒介的连接力与组织力直接取决于行动者能够在多大程度上激活、掌握、调动和整合关系资源。

在传统社会架构中,网络的形成多依赖于文化、政治和经济等外部显性权力的支撑,而非基于其内在的微观运作机理。然而,人工智能的出现引发了网络社会运行机制的深刻变革,使得超越这些显性权力的“网络化”逻辑逐渐成为主导社会运行的核心力量。“网络化”意味着媒介连接力将随着社会节点的增多和信息流动的增效而改变。简单的横向“数字连接度”依靠互联网发展“上半场”的资源积累,取得了数量上的进步,如何实现价值升维,拓宽场景空间,从横向连接度转向纵向自由度,是媒介价值变迁的第二层逻辑。

(二)数字场域自由度:时空延展下媒介连接价值的边界突破与自由跨越

在数字技术迅猛发展的当下,时空距离与壁垒被显著缩短,传统的边界秩序被深刻改变,人类生存时空的新场域得以重塑。社会迎来一场空间革命,而新的边界文化也将在数字化的虚拟空间中悄然孕育。媒介技术在满足了人与世界连接和通讯的需要之后,能否扩大人们借助于它所实现的社会实践的数字自由度以及对这个世界的掌控力,是媒介可持续发展的关键逻辑。

从空间上来说,通用人工智能的发展使得原有区隔的媒介空间的“边界消弭”,个体的身体束缚逐步消解,为无界化媒介连接力提供了全新场域。用户可以听得更远、看得更远,促进实践半径更为宽阔和深远。从时间上来说,媒介技术的进步定义了社会世界中一种新的时间性,即不再受到社会主体的控制,而开始由媒介技术所主导。这种新的关系结构将破坏既有的媒介空间的“逻辑时间序列”,也会破坏个体的学习“生物时间感”。从知识生产上来说,传统知识的整体性和确定性在被数字技术进行编码和解码的过程中被赋予更为流动的特点,使得知识的传播速度加快,摆脱了时空的固定,增加了传播能力和产量的自由度。

(三)数字包容度:“能力沟”跨越下媒介价值效应的平等赋权

数字包容是指确保所有人拥有平等机会和适当技能,能够从广泛数字技术和系统中受益的策略。数字包容度是一个不断更新的、动态的概念,兼容性、多元性和共享性是其主要特征。在兼容性上,Sora提高了媒介技术的可访问性,降低视频创造、内容创作的专业门槛,提供了一个更为包容的环境,内容生成的速度、质量、效率都会前所未有地提高;在多元性上,Sora带来了多元主体新的创造力和参与度时代,给予了在数字时代经济、政治、文化等各个方面都处于相对弱势地位的个体或群体平等参与和克服数字排斥的机会;在共享性上,Sora技术或许会带来“世界建模UGC”时代,只要有充足创意并能用自然语言表达自己的创作脚本,全体用户都能在媒介技术和数字系统中受益,完成更高维度的内容生产,提高数字社会发展的共享性。

我们追求媒介技术要有更强的包容度,让人工大脑拥有学习和理解的能力。Sora所带来的冲击感,不仅局限于生成视频,更是赋予AI系统理解和与动态物理世界交互的能力,这或许将重新定义人类与世界的关系。Sora的出现,而更为深层地体现出媒介的价值系统的自我革命,从“数字连接度”“数字自由度”向着“数字包容度”不断迭代。

三、媒介连接力的运作路径:技术“聚力”和“卸力”的不定向作用

媒介技术作为一种异质性主体,在不断发展的过程中逐渐从社会独立出来,成为一种自主、独立且不为外部力量所支配的自主性力量。相较于权力主客体之间单向度连接和互动的传统结构,技术赋权、赋能后的媒介社会权力结构呈现出多维度、不定向的特征。Sora的出现本身就蕴含着复杂的权力关系,其本质可以认为是权力更迭的产物,Sora将“理解”这一要素嵌入媒介整体,并在权力的中介作用下成为新的社会基础。因此,技术的创新扩散引起了社会权力结构的复杂变化,媒介价值变迁也反映了媒介连接力的动态更迭,媒介技术对权力的影响具体表现为“聚力”和“卸力”的不定向作用。

(一)聚力:“他者式”教化作用

权力作为一种特殊的连接力,它区别于政治学中自上而下的操纵和支配,强调的是权力在实际运作中的网络结构化和弥散性。传统媒体时代,媒介技术的“聚力”作用表现为“他者式”教化,是以定时、定量、定向、分类、选择为关键词的工业化传播模式。在这个时期,掌握权力的少数群体通过精心设计的信息操控大众行为,传统媒介承担着“灌输”的作用。此外,通过数字化和互联网技术的运用,传统媒体实现了信息的快速传播和广泛覆盖,能够迅速将新闻、观点、评论等内容推送给大量用户,实现信息的即时共享和传播,此时,权力基于技术的加速发展开始单项聚集,某种程度上形成“命令-支配”的关系。

(二)卸力:“亲身化”体验作用

媒介连接力的流动与运作具有一定的相对性,遵循着从权力资源密集流向权力资源稀少的规律。当权力主体作用于权力客体时,不断更新的媒介技术发挥了“中和”作用,帮助客体卸载了一部分权力势能,导致原有的单向流动路径发生偏移,减少了直接对冲,给予个体更多“亲身化”体验的机会,进而让渡出更多的权力空间满足自身需要,这便是媒介技术的“卸力”作用。随着算法、元宇宙、生成式AI等新技术的不断发展,协作、平等的传播权力被推至高处。人们开始摒弃传统媒介的教化作用,注重表达自我、重构价值、重塑自我意义,追求从单向度的“认知时代”过渡到多向度的“体验时代”。可以说,Sora的出现,赋予了人们从现实社会中生产物质资料,同时又可以将其放入媒介中进行“解构-生成-再理解”的权力,打破了媒介的单一教化。

(三)媒介技术与权力的双螺旋效应:“聚力”与“卸力”的适应性调试

媒介与社会协同并进的过程中仅有“聚力”或“卸力”是远远不够的。如果在传播的过程中,当技术的“聚力”大于“卸力”,会造成技术创新动力缺失,媒介连接力牢牢掌握在少数人手中,媒介向前进化的路径就会中断,甚至倒退;当技术的“卸力”大于“聚力”,即媒介连接力充分让渡到用户受众,这便会使得用户进入“无序”状态,造成媒介的滥用或误用,出现道德伦理的失范、原则标准的失能与精神世界的凌乱。传播技术与媒介连接力、集权与分权之间从不是二元对立的状态,权力并不是创造出来的,而是从社会关系中产生的,是一体化的过程。媒介连接力如何与技术在适应性调试的过程中实现自我修复和自我迭代,是一个重要的课题。

四、“媒介连接力-边界”二维分析框架下传播生态的边界重构

如果说互联网是信息传播的成本和效率革命,即信息的零成本复制传播,那么生成式人工智能的出现则是信息生产的成本和效率革命,即有望形成信息和知识的零成本生产创造。而Sora模型的出现又将传播革命推进了一步,媒介连接力也被纳入一种不断变化的关系结构中。从“边界-权力”分析框架出发,边界与权力是相互依存的。数智传播时代的边界也需要依据传播权力的变化进行新的限定,具体包括个体认知边界、组织治理边界和社会文明边界。

(一)个体认知边界:嵌入-生成-延展的全新适配

媒介技术快速发展与创新的过程中,由于个体认知具有能动性,一方面个体依赖于媒介思维形成认知;另一方面,个体也以认知可供性的方式驯化着技术。嵌入认知是个体面对新技术,将旧的认知图式进行认知卸载,利用外部环境降低认知负荷的过程;生成认知强调个体与环境的交互作用,通过新的认知体系完成感知-刺激通路;延展认识强调外在环境驱动认知进程的重要作用。认知边界升级是一个动态化的发展过程,也是媒介技术与认知革命通过“平衡-去平衡-再平衡”实现关联、协同、升级的过程。Sora对世界的理解能力让我们发现,认识的“人称”发生变化,从第三人称的认知变成了第一人称的体验,个性化的认知地图和新型认知操作系统已经取代了传统的规模化、标准化的信息作用方式。

(二)组织治理边界:过程性治理的思维革新

媒介技术的发展是“科学-技术-媒介系统”不断成为社会生产力的过程,同时也是技术伦理风险不断展现的过程。Sora的出现引发了如何识别其生成内容和实现可追溯性的问题,但归根结底,这些都是科技创新的问题。新兴技术的社会融合更需要容错机制。技术所产生的问题,其实也是可以通过技术本身找到解决方案的。我们要把重点拉回到“发展”两字上,“问题”会在“发展”中得以解决。让技术在小规模试错中优化迭代,让其发展更透明、更公开、更可控,以“预防原则”维持技术本身的发展。例如,通过信息助推技术帮助建立规则,将产品打上隐性“水印”,以便平台或监管进行辨别和管理。还可以构建AI“监管沙盒”,通过隔离现实的安全机制营造一个较为宽松的监管环境,使空间内的AI技术能够对其创新的产品、服务、商业模式进行测试,增强监管机制容错性,实现治理边界的有效革新。

(三)社会文明边界:智能世界文明的“盘整期”

Sora的出现或许使得人类的社会文明进入一个盘整期,其基本特征是“剪不断,理还乱”。“剪不断”的是Sora前所未有地激活、整合了原本散落在各处的传统社会无法有效利用的微资源,使其被发现、挖掘、聚合、匹配,人类难以割舍技术所带来的先进生产力;“理还乱”的是Sora作为一种智能体,在没有进行负责任创新之前会产生深度伪造等伦理和道德问题。生成式人工智能的发展具有时代的必然性,如果仅以简单利用的方式去理解技术,当技术全面进入社会各产业链,传播链的架构却还没有发生改变,传播就会变得很被动。在这个盘整期,我们需要思考的是技术与社会是如何彼此动态互塑的,在这个过程中,人工智能扮演了什么角色,人类又完成了哪些部分,从而对整体架构有一个新的认知。

五、结语

互联网开辟了“空间革命”,智能手机的出现带来“时间革命”,生成式AI则可能形成“思维革命”。然而,我们必须认识到,人工智能的发展是一个循环往复、不断迭代、不断试错的过程。面对这样一个全新而又复杂的智能系统,快速变迁的技术需要相应的社会制度支持、文化观念匹配,才能充分理解、利用技术促使社会创新,做到循序渐进、先立后破。生成式AI的出现到底是忧是喜,这并不取决于技术本身,而在于人们如何使用它、社会如何适应它。

(载《传媒观察》2024年第4期“深观察”专栏,原文9000字,标题为:《Sora作为“世界模拟器”:媒介连接力的价值升维与场域重塑》。此为节选,注释从略,学术引用请参考原文。“传媒观察杂志”公号全文链接:

https://mp.weixin.qq.com/s/o6VNzDojn74gtkscx5DyaA)

【作者简介】

喻国明,教授,博士生导师,北京师范大学新闻传播学院学术委员会主任,北京师范大学传播创新与未来媒体实验平台主任,中国新闻史学会传媒经济与管理专业委员会理事长

滕文强,北京师范大学新闻传播学院博士研究生

标签:
责编:唐可垚 易保山