零基础AI入门指南 -绝世好 Sora .pdf
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 零基础AI入门指南 -绝世好 Sora 基础 AI 入门 指南 绝世
- 资源描述:
-
零基础AI入门指南01 绝世好 Sora 目录一、Sora03(一)Sora的定义03(二)AGI的定义03(三)Sora的优势03(四)Sora可能带来的行业冲击04二、Sora的原理04(一)视频压缩网络技术04(二)空间时间补丁04三、Sora视频生成过程04(一)视频压缩网络05(二)空间时间潜在补丁提取05(三)视频生成的Transformer模型05四、Sora的应用05(一)电影制作:预览与概念验证05(二)设计领域:产品概念和广告创意06(三)创意产业:音乐视频和动画06(四)虚拟现实和游戏:环境设计和资产创建06五、Sora视频生成的局限06(一)物理世界模拟的局限性06(二)长视频生成的困难07(三)准确理解复杂文本指令07(四)训练与生成效率07六、Sora对传媒业的影响07(一)Sora对传媒业的意义071.重构信息生产方式,赋能内容生产创新微观072.提升信息生产效率,促进视频创作民主化微观083.重塑传媒业产业链,促进传媒行业智能转型中观084.深度赋能跨文化传播,促进文化交流与理解中观08(二)Sora对于传媒业的挑战09零基础AI入门指南021.Sora技术限制内容表达,品质和准确度仍存缺陷092.Sora模糊真实与虚拟边界,加剧深度伪造问题093.Sora加剧用户隐私侵犯风险,放大信息储存危机094.Sora应用冲击影视行业发展,拉响从业者失业警报10七、Sora与深度伪造风险10(一)视频传播中媒介伦理呈现的新特征101.伦理主体的变化:三元主体的形成102.伦理边界的变化:从职业伦理到社会伦理10(二)网络视频传播中伦理失范的几种主要表现101.内容上:制作或传播虚假视频影像102.隐私权上:个人隐私画面和影像缺乏保护113.价值观上:传播低俗、暴力、悲剧画面等不适当视频影像114.用户保护上:未成年人视频影像的呈现与保护十分重要11(三)重构网络视频传播伦理规范的可能路径121.从个体美德到数字伦理122.从职业伦理到平台伦理123.从道德自律到交往伦理12七、应对Sora风险:审美优化力的提升12(一)审美优化力的关键131.审美鉴赏力132.文化解码力133.伦理辨识力134.趋势洞察力135.创意整合力13(二)审美优化力中的优化141.认知升级142.情感共鸣的深化143.技术与艺术的融合144.文化敏锐度的增强145.伦理责任的提升15零基础AI入门指南03一、Sora(一)Sora 的定义Sora是一个能以文本描述生成视频的人工智能模型,由美国人工智能研究机构OpenAI开发。Sora这一名称源于日文“空”,即天空之意,以示其无限的创造潜力。其背后的技术是在OpenAI的文本到图像生成模型 DALL-E 基础上开发而成的。模型的训练数据既包含公开可用的视频,也包括了专为训练目的而获授权的著作权视频,但OpenAI没有公开训练数据的具体数量与确切来源。OpenAI 于2024 年 2 月 15 日向公众展示了由 Sora 生成的多个高清视频,称该模型能够生成长达一分钟的视频。同时,OpenAI也承认了该技术的一些缺点,包括在模拟复杂物理现象方面的困难。麻省理工科技评论的报道称演示视频令人印象深刻,但指出它们可能是经精心挑选的,并不一定能代表 Sora 生成视频的普遍水准。由于担心Sora可能被滥用,OpenAI表示目前没有计划向公众发布该模型,而是给予小部分研究人员有限的访问权限,以理解模型的潜在危害。OpenAI还与一小群创意专业人士分享了 Sora,以获取对其实用性的反馈。(二)AGI的定义在OpenAI的理念中,人工通用智能(AGI)被定义为一种能力水平与人类相当、可以解决广泛人类级别问题的智能系统。不同于当前的人工智能技术通常专注于解决特定的、狭窄的任务,AGI将能够理解、学习和应用知识于一个范围广泛的问题和环境,包括那些它未被特别编程处理的任务。这一定义突显了AGI与现有AI系统的根本区别,同时也指出了实现AGI所需克服的技术和理论难题。(三)Sora 的优势中央民族大学新闻与传播学院教授郭全中认为,相比 Chatgpt,Sora有了质的飞跃:一是 Sora 具备推理能力,人类长期以来孜孜以求的AGI(通用人工智能)成为可能,估计不久之后就会到来,而ChatGPT 是让我们看到了曙光。二是在当今视频时代,Sora作为图生视频的利器将助力传媒业降本增效,极大地扩大能力范围和能力边界,给传媒业带来的影响远远超过 ChatGPT。零基础AI入门指南04(四)Sora 可能带来的行业冲击清华大学新闻学院教授、新媒体研究中心主任沈在个人社交平台提出,sora 的出现将深刻影响 10 个行业,包括短视频行业、影视行业、游戏行业、广告行业、教育行业、电商行业、制造业、科学研究、建筑行业、艺术创作行业。Sora对影视相关的产业影响比较大,它能大幅拉低制作成本,如果普遍使用的话,成本至少可以是原来的十分之一,所以 Sora 对视频、游戏、教育等行业都会带来比较明显的影响。二、Sora 的原理(一)视频压缩网络技术首先,Sora 通过一个叫做“视频压缩网络”的技术,将输入的图片或视频压缩成一个更低维度的表示形式,这一过程类似于将不同尺寸和分辨率的照片“标准化”,便于处理和存储。这并不意味着忽略原始数据的独特性,而是将它们转换成一个对 Sora 来说更容易理解和操作的格式。(二)空间时间补丁接下来,Sora将这些压缩后的数据进一步分解为所谓的“空间时间补丁”(SpacetimePatches),这些补丁可以看作是视觉内容的基本构建块,就像是我们前面相册中的每一张照片都能分解为包含独特景观、颜色和纹理的小片段。这样,不管原始视频的长度、分辨率或风格如何,Sora 都可以将它们处理成一致的格式。通过这种方法,Sora能够在保留原始视觉信息丰富性的同时,将不同来源和风格的视觉数据统一成一种可操作的内部表示形式。这就像你在查看世界名胜相册时,尽管照片多种多样,但你依然能通过相同的方式去理解和欣赏它们。这种处理多样化视觉数据的能力,使得 Sora 在接收到如猫坐在窗台上这样的文本提示时,不仅能理解这个提示背后的意图,还能利用它的内部表示形式,综合利用不同类型的视觉信息,生成与文本提示相匹配的视频或图片。就好比是从全世界的视觉数据中找到那些能够拼凑出你想象中的“猫坐在窗台上”场景的片段,并将它们组合起来,创造出一个全新的视觉作品。三、Sora 视频生成过程零基础AI入门指南05(一)视频压缩网络想象一下,你正在将一间杂乱无章的房间打扫干净并重新组织。你的目标是,用尽可能少的盒子装下所有东西,同时确保日后能快速找到所需之物。在这个过程中,你可能会将小物件装入小盒子中,然后将这些小盒子放入更大的箱子里。这样,你就用更少、更有组织的空间存储了同样多的物品。视频压缩网络正是遵循这一原理。它将一段视频的内容“打扫和组织”成一个更加紧凑、高效的形式(即降维)。这样,Sora就能在处理时更高效,同时仍保留足够的信息来重建原始视频。(二)空间时间潜在补丁提取接下来,如果你想要细致地记下每个盒子里装了什么,可能会为每个盒子编写一张清单。这样,当你需要找回某个物品时,需查看对应的清单,就能快速定位它在哪个盒子里。在 Sora 中,类似的“清单”就是空间时间潜在补丁。通过视频压缩网络处理后,Sora会将视频分解成一个个小块,这些小块含有视频中一小部分的空间和时间信息,就好像是对视频内容的详细“清单”。这让Sora在之后的步骤中能针对性地处理视频的每一部分。(三)视频生成的 Transformer 模型最后,想象你和朋友一起玩拼图游戏,但游戏的目标是根据一段故事来拼出一幅图。你们先将故事拆分成若干段落,每人负责一段。然后,你们根据各自负责的故事段落选择或绘制出拼图的一部分。最终,大家将各自的拼图部分合并,形成一幅完整的图画,讲述了整个故事。在 Sora 的视频生成过程中,Transformer 模型正扮演着类似的角色。它接收空间时间潜在补丁(即视频内容的“拼图片”)和文本提示(即“故事”),然后决定如何将这些片段转换或组合以生成最终的视频,从而讲述文本提示中的故事。通过这三个关键步骤的协同工作,Sora 能够将文本提示转化为具有丰富细节和动态效果的视频内容。不仅如此,这一过程还极大地提升了视频内容生成的灵活性和创造力,使 Sora 成为一个强大的视频创作工具。四、Sora 的应用(一)电影制作:预览与概念验证在电影制作领域,Sora的视频生成技术可被应用于项目的早期阶零基础AI入门指南06段,特别是在预览和概念验证环节中。一家知名的电影制作公司可利用 Sora 生成了数个关键场景的预览视频,这些视频基于简单的文本描述,如“未来城市在黄昏的背景下,主角站在高楼之巅俯视下方。”Sora不仅成功呈现了文本描述中的细节,还以其独有的视角和创意,为创作者提供了灵感,帮助他们更加准确地定义最终的视觉样式。通过这种方式,Sora显著减少了从概念到视觉呈现的时间和成本,同时增强了创意的多样性和创新性。(二)设计领域:产品概念和广告创意在设计行业,一个创意机构可采用 Sora 技术为其客户设计新产品的概念视频和广告。通过向 Sora 输入产品的描述和预期效果,机构能够迅速获得一系列创意丰富、视觉吸引的视频,展示了产品在不同环境下的使用场景。这种应用不仅提高了设计流程的效率,还为客户提供了更加直观和动态的产品展示方式。此外,利用Sora 生成的视频也用于社交媒体广告,通过生动的视觉故事叙述,有效提高了广告的互动性和受众的参与度。(三)创意产业:音乐视频和动画一个新兴的音乐制作团队可用 Sora 为他们的最新单曲创作了一部音乐视频。通过向 Sora 提供歌词和主题描述,团队得到了一系列与歌曲情感和故事匹配的视频片段。Sora 的技术不仅在视频中成功融入了抽象和象征性的元素,还模拟了动态摄像机运动和复杂的人物互动,增加了视频的艺术性和观赏价值。此外,在动画制作领域,Sora可被用来快速生成原型动画,帮助动画师探索不同的风格和叙事方法,加速创作流程,同时提供丰富的视觉材料以供最终产品的参考。(四)虚拟现实和游戏:环境设计和资产创建虚拟现实(VR)和游戏开发商也可探索使用 Sora 来设计环境和创建资产。一个 VR 体验项目团队可通过 Sora 生成了一系列极具沉浸感的环境场景,包括从密林深处到未来城市的全景视图。Sora在这一过程中展现出的能力包括了对场景细节的精准捕捉以及在生成过程中考虑用户交互和探索的可能性。此外,一款即将发布的视频游戏使用 Sora 来创建游戏内的资产,如角色、道具和环境元素,这些通过 Sora 生成的资产不仅保持了视觉上的一致性,还加快了开发进度,降低了制作成本。五、Sora 视频生成的局限(一)物理世界模拟的局限性零基础AI入门指南07Sora 虽然能够生成具有一定复杂度的动态场景,但在模拟物理世界的准确性方面仍然存在局限。例如,对于复杂的物理互动,如玻璃破碎的精细过程,或是涉及精确力学运动的场景,Sora有时无法准确再现。这主要是因为 Sora 目前的训练数据中缺乏足够的实例来让模型学习这些复杂的物理现象。(二)长视频生成的困难Sora 在生成长时间视频时面临的另一个挑战是如何保持视频内容的长期一致性。对于较长的视频,维持人物、物体和场景的连续性和逻辑一致性变得更加困难。Sora 有时可能会在视频的不同部分产生矛盾,例如,人物的衣着突然变化,或是场景中物体的位置不一致。(三)准确理解复杂文本指令虽然 Sora 在理解简单的文本指令并生成相应视频方面表现出色,但对于复杂的、含有多重含义或要求精确描绘特定事件的文本指令,模型有时会遇到困难。这限制了 Sora 在更加复杂创意内容生成上的应用。(四)训练与生成效率Sora 作为一个高度复杂的模型,其训练和视频生成的时间效率是一个不容忽视的挑战。高质量视频的生成通常需要较长的时间,这限制了Sora 在实时或快速反馈场景中的应用。六、Sora 对传媒业的影响(一)Sora 对传媒业的意义1.重构信息生产方式,赋能内容生产创新微观Sora能够高效快速根据用户提供的关键信息生成视频内容,可以有效辅助内容创作,提高创作效率,加速内容创作和迭代创意,丰富内容供给。Sora 可以打破内容创作壁障,拉近艺术与生活的距离,为传媒行业内容生产带来巨大变革。新技术、新玩法也为内容产业高效赋能,大大激发传媒产业活力。在新闻生产方面,Sora 将进一步分能动新闻生产,且基于预训练大语言模型、Transformer算法,Sora能完成上下文语境理解,增强视频新闻的可读性和新颖性。零基础AI入门指南082.提升信息生产效率,促进视频创作民主化微观Sora可以自动生成视频,无需人工拍摄和剪辑,大幅提高视频创作效率。同时,Sora 可以生成高质量的视频,画面逼真,细节丰富,这就为动新闻的生产提供了源源不断的动力。此外,Sora可以使视频创作更加便捷高效,普通人需输入文本即可生成高质量视频,降低了视频创作的门槛,使得视频创作更加民主化。3.重塑传媒业产业链,促进传媒行业智能转型中观以ChatGPT、Sora 为代表的人工智能未来或将成为内容生产的主流形态:借AIGC之力优化自然语言对讲功能,借AIGC功能可自动生成用户所需的内容,无需搜索即时生产即时消费等。AIGC赋能内容生产,将表现出更加多维立体及多样化特征,能满足各类用户的个性化需求。此外,Sora能推进媒体深度融合,推进新型搜索引擎,优化虚拟数字人等项目开展,为内容交互提供进入智媒时代的技术支持。当下,传媒领域实际应用层面,国外大部分影视机构在生产中已开始使用AI 相关技术支持内容生产流程优化。因此,拥有版权视频素材及数据和技术优势的视听传媒机构,已经开始与AI大模型训练,并衍生出新的产业格局和商业模式。4.深度赋能跨文化传播,促进文化交流与理解中观长期以来,语言差异成为横亘在不同国家民众交往过程中的一大阻碍。尽管英语作为国际通行语的普及与机器辅助翻译的发展一定程度上促成了“巴别塔”的重建,但对各国多数普通民众而言,使用英语或机辅翻译问讯沟通仍有一定门槛。随着人工智能时代的到来,Sora可以用于创作不同语言、文化和风格的视频,促进不同文化之间的交流与传播。这减轻了不同国家公民跨越语言、文化藩篱获取资讯的障碍,进一步增添了个体跨出“社交茧房”、了解他国和世界的动力,一定程度上促成了逆全球化浪潮中不同国家的重新连接。通用人工智能善于深度分析文化作品中的各个元素,例如风格、情感和意义,提供丰富的背景知识,并以受众能够理解和接受的方式解析作品。此外,通用人工智能具备非常广泛的知识,能够跨领域、跨文化、跨时空分析文化作品,带来新的见解和观点。同时,由于文化作品的极大丰富,通用人工智能还能够了解人们对文化内容的需求和兴趣,识别文化作品与人们的潜在关联,揭2024新传考研真经同行大家都要上岸呀!09示文化传播的有效思路和途径,为人们提供符合其需求的文化内容,主动促进人们对文化的消费,进而促进文化的交流与传播,也能接受人们的反馈,进而丰富文化创作方向,提升文化作品的质量,进一步丰富文化本身。(二)Sora 对于传媒业的挑战1.Sora 技术限制内容表达,品质和准确度仍存缺陷OpenAI在官网表示,目前Sora模型也有弱点:它可能难以准确模拟复杂场景的物理特性,并且可能无法理解因果关系的具体实例。例如,一个人可能会咬一口饼干,但之后,饼干可能没有咬痕。同时,该模型还可能混淆提示的空间细节,例如,左右混淆,并且可能难以精确描述随时间推移发生的事件,例如遵循特定的相机轨迹。比如在一个样片中,提示词为“考古学家在沙漠中发现了一把普通的塑料椅子,正小心翼翼地挖掘和除尘”,Sora生成的视频出现了椅子变形、自动行走等诡异的场景。2.Sora 模糊真实与虚拟边界,加剧深度伪造问题Sora 的普及将进一步加剧深度伪造问题,模糊真实与虚拟的边界。深度伪造又称为深度造假(Deepfake),是计算机的“深度学习”和“伪造”的组合,其出现于人工智能和机器学习技术时代。深度伪造指的是利用机器的深度学习技术,即生成式对抗网络(GANs),实现图像、声音、视频的篡改、伪造和自动生成,产生高度逼真且难以甄别效果的技术。此外,OpenAI 还需要花更多精力检查、拦截违反使用政策的文本输入提示,例如极端暴力、色情内容、名人肖像等。复旦大学新闻学院教授、博士生导师邓建国表示,“视频记者”这四个字中重要的不是“视频”而是“记者”。新闻报道追求真实(facts),而 Sora 全是虚拟(fictional),因此它从本质上对新闻业有坏处没有好处。它唯一可以被新闻业利用的也许是建构在新闻事实基础上的情景再现。3.Sora 加剧用户隐私侵犯风险,放大信息储存危机Sora等AI驱动的技术可能会威胁人们的隐私和数据安全,特别是在敏感信息的储存和处理方面。由于数据存储和传输的复杂性,Sora存在潜在的信息泄露风险。恶意攻击者可能会试图访问存储的数据,导致用户的个人信息泄露。由于 Sora 的开放性,模型可能被用于传播误导性信息、虚假新闻、仇恨言论或其他不良内容。这可能对用户和社会造成负面影响,并带来潜在的隐私问题。零基础AI入门指南104.Sora 应用冲击影视行业发展,拉响从业者失业警报Sora 的广泛使用,可能会导致多媒体制作领域出现改变,有可能会大幅降低制作视频的经济成本,但专业摄影师、编辑和动画师或将面临失业。此外,Sora对影视相关的产业影响比较大,它能大幅拉低制作成本,如果普遍使用的话,成本至少可以是原来的十分之一,所以 Sora 对传媒业中的视频剪辑师、后期制作、新闻主持人、游戏动画师、广告创意和设计岗位、内容创作者等岗位都有较大冲击。七、Sora 与深度伪造风险(一)视频传播中媒介伦理呈现的新特征1.伦理主体的变化:三元主体的形成网络视频传播的伦理主体,即谁应该为网络视频内容和传播后果负责。智能传播时代,媒介伦理主体已经不再局限于专业的新闻生产者,三元伦理主体,即职业新闻传播主体、个体传播主体、网络平台主体共同发挥作用的局面正在或者已经形成。2.伦理边界的变化:从职业伦理到社会伦理当前,网络视频的发展已进入全民化和社交化的新阶段。在全民参与图像社交实践的当下,媒介伦理规范的边界不再固定,新闻传播的职业伦理正迈向一种普遍意义的社会伦理,即网络视频传播的职业伦理逐渐成为一种社会意义的伦理规范。(二)网络视频传播中伦理失范的几种主要表现1.内容上:制作或传播虚假视频影像即网络视频在生产、制作、传播过程中存在人为的或者技术性失实与遮蔽,使得影像呈现与事实偏离,有图有视频但无真相。(1)自媒体发布的视频出现造假情况。一般采用的手段包括摆拍导演、影像合成、“移花接木”等。(2)专业媒体缺乏把关导致虚假视频的传播。作为目击者的普通人用智能手机拍下新闻性的瞬间,但其中也会夹杂虚假视频内容,经专业媒体采纳并用作报道或故事陈述后,则会加速了虚假视频的传播。(3)技术性虚假影像的传播。2019 年,一款名为ZAO的“换脸”APP 火爆一时,用户上传自己的照片后,该应用通过AI技术在视频中实现用户与明星的“换脸”效果,并生成新的“虚假”影像。该技术的成熟使零基础AI入门指南11得视频影像可以做到“以假乱真”。深度伪造/常考名词解释:深度伪造又称为深度造假(Deepfake),是计算机的“深度学习”和“伪造”的组合,其出现于人工智能和机器学习技术时代。深度伪造指的是利用机器的深度学习技术,即生成式对抗网络(GANs),实现图像、声音、视频的篡改、伪造和自动生成,产生高度逼真且难以甄别效果的技术。深度伪造这一概念最早源自社交新闻网站Reddit的一个名为deepfakes 的用户。该用户于 2017 年秋在 Reddit 发布了基于人工智能算法的换脸视频,把娱乐明星的脸换到色情视频上,得到广泛关注和转发。网络平台禁止了这一行为后,该用户将换脸算法在网上公布,成为一种开源代码供免费下载使用。由于合成技术的快速发展,深度造假也正变得愈加容易。同时,因为社交媒体上大量的个人图片可以被深度造假者获取,并用来训练他们的算法,服务于查找、勒索和污蔑等目的,如果这一新趋势发生在记者个人和新闻媒体上,后果可能不仅仅是假新闻的问题,受到损失的可能是整个新闻业的公信力。然而迄今为止,人们并没有开发出检测深度造假的有效工具。2.隐私权上:个人隐私画面和影像缺乏保护第一,普通用户在拍摄、制作、发布视频时,缺乏隐私保护的观念和必要的视频处理能力,从而导致用户个人隐私的曝光和他人隐私的曝光。第二,专业媒体在采用自媒体视频作为新闻源时,未充分保护视频中的个人隐私,造成新闻源的隐私被曝光。第三,在网络视频传播中,普通用户使用智能手机等便携设备,以维护公共利益、揭露社会问题为目的,拍摄、传播他人的个人信息,这也会导致个人隐私的曝光。3.价值观上:传播低俗、暴力、悲剧画面等不适当视频影像网络上传播色情、低俗、暴力、悲剧等视频影像的问题十分突出,早在 2018 年国家网信办就联合多个部门开展网络短视频的集中整治,近年相关部门又继续发布了一系列的网络视频管理规范,加强对此类问题的管理。专业媒体和普通公民都应在网络环境下把控自身的传播内容。4.用户保护上:未成年人视频影像的呈现与保护十分重要未成年人是网络视频的主要用户人群之一。在短视频和网络直播中,容易出现未成年人的个人隐私、肖像等人格权未被充分保护零基础AI入门指南12的情况,如幼儿园老师将幼儿园课堂教学和课间娱乐内容拍摄后上传至抖音。此外,在未成年人参与的网络视听节目中,有的为了流量和利益,过度消费未成年人,甚至用成年人的话题进行“包装”“炒作“。最后,当未成年人作为视频拍摄者或传播者时,网络平台需规范准入机制与内容的监管,避免未成年人合法权益和身心健康受到侵害。(三)重构网络视频传播伦理规范的可能路径1.从个体美德到数字伦理个体美德是指从个体层面提高传播美德,要求视频制作者、发布者、传播者都要符合社会公德、承担社会责任。然而,除了倡导个体传播的美德外,我们还应思考更普遍的数字伦理原则,例如呼吁从网络视频行业层面建立具有普遍意义的视频传播伦理规范,作为一种数字伦理原则加以推广并实施。近年来,由全球15名知名学者发起的在线生活宣言倡导重构超连接时代的诸多概念,他们认为非但不能放弃在复杂系统中的责任,还需要对个体和集体的责任观进行重新评估。2.从职业伦理到平台伦理首先,网络视频传播伦理可以将新闻传播的职业伦理作为基础。传播者要坚持真实性原则,回到“再现真实”的基本要求,认真核实影像来源和准确性,坚持真实性为根本的伦理契约精神。其次,构建一种新型的网络视频平台伦理。互联网平台已成为一个信息的“黑箱”,平台的伦理问题、价值观问题变得十分重要,包括网络视频传播平台在内的各种互联网平台,实际上应该从公共利益的角度出发,将伦理规范作为一种具体的、可实施的传播政策加以运用。3.从道德自律到交往伦理在数字时代,道德自律或者美德当然是不可或缺的。但在追求自律的基础上,还应有更高的精神追求。互联网社会需要建设与其交往潜能相适应的对话伦理,一是培育对话的程序伦理(包括可理解性、真实性、正当性和真诚性等),二是构建对话的实质伦理(成就自我、互蒙其惠、促进公共利益和公共之善等)。建构一种基于网络视频传播与社交的对话伦理,是我们应当追寻的目标。八、应对Sora风险:审美优化力的提升零基础AI入门指南13在 AI 技术特别是图像和视频生成技术迅速发展的当下时代,每个人的选择和审美能力变得更加关键。这种能力的重要性不仅体现在个人审美偏好的表达上,更深层次地,它关系到对信息、文化价值以及社会意义的深度解读和精准筛选。这一综合能力,我们称之为“审美优化力”。(一)审美优化力的关键审美优化力不仅是个体对美的直觉反应,而是一个包含多维度技能的复杂构成,它体现在以下几个关键方面:1.审美鉴赏力这是审美优化力的基础,涉及个体对美的直观感知和欣赏。这不仅仅是对美的一种感受,更是一种能力,能够让我们在无数的创作中识别出那些触动心灵的作品。它要求我们对色彩、形状、构图以及情感表达等元素有着敏锐的洞察力。2.文化解码力这是一种能力,使我们能够解读和理解艺术作品背后隐含的文化、历史和社会价值。它不仅仅是对作品表面的欣赏,而是深入到符号学、语境分析以及传统价值的理解和应用。这种能力使得创作不仅是视觉上的享受,更是文化上的对话和传承。3.伦理辨识力在当今这个充满复杂信息和道德挑战的时代,伦理辨识力变得尤为重要。这涉及到在创作和分享内容时,对版权、隐私保护、社会责任等伦理问题的深刻理解和考量,确保作品在传播价值的同时,也是在维护一个公正和道德的社会环境。4.趋势洞察力这是一种超越当下,预见未来的能力。它不是简单地追逐流行,而是基于对当前审美趋势的深刻洞察,预测未来可能的变化,并据此做出前瞻性的选择。这种能力要求个体既要有广阔的视野,也需要有敏锐的洞察力,能够在不断变化的审美潮流中保持先锋地位。5.创意整合力这是审美优化力的高级阶段,要求个体不仅具备坚实的审美基础,零基础AI入门指南14还必须有能力跨界整合和创新。这意味着能够将不同领域的知识、技能和创意融合在一起,创作出既具有个人风格又能与广大观众产生共鸣的作品。审美优化力的培养是一个长期且动态的过程,它需要个体不断地在学习、实践和反思中成长。在 AI 技术越来越成熟的今天,审美优化力不仅是个人表达自我、追求艺术创新的重要工具,更是在信息泛滥、文化多元的大背景下,引领社会审美、促进文化传承和维护社会价值观的关键力量。通过持续地培养和优化这一能力,我们不仅能够提升个人的艺术素养,更能够为社会带来正面的文化影响,推动人类社会的审美进步和文化发展。(二)审美优化力中的优化1.认知升级审美优化力的核心在于认知的升级。这涉及到如何通过教育、实践和反思,提高个体对美学原理、艺术技巧和文化背景的理解和应用能力。认知升级要求个体不仅吸收知识,更要学会批判性思维,对传统审美进行重新解读和挑战,以形成独到的审美视角和创造力。2.情感共鸣的深化优化审美力也意味着加深与观众情感共鸣的能力。在创作过程中,理解和激发观众的情感反应是艺术作品成功的关键。这要求创作者不仅要有深厚的情感体验,还需要有能力通过作品传达这种情感,让观众能够产生共鸣。优化这一方面,需要对人类心理学、情感表达和交流策略有深入的理解和应用。3.技术与艺术的融合在当今AI 技术高度发展的背景下,优化审美力还需要在技术与艺术的融合上下功夫。这不仅仅是将新技术应用于艺术创作的表面层面,更重要的是理解技术背后的原理,以及它们如何扩展艺术表达的可能性。优化这一过程,涉及到技术熟练度的提高,以及如何创造性地将技术应用于艺术创作,开拓新的表达方式。4.文化敏锐度的增强审美优化力的提升还需要加强对文化趋势的敏锐洞察。在全球化的今天,文化流动快速,审美趋势和价值观不断变化。优化审美力,就是要增强个体对这些变化的敏感度,能够捕捉到新兴的文化现象和审美方向,将这些元素融入到自己的创作中,使作品更具时代感和文化深度。5.伦理责任的提升最后,从深层次原理来看,优化审美力还涉及到伦理责任感的提升。在创作和分享作品时,考虑到作品的社会影响、文化敏感度以及伦理道德标准,是现代艺术家和创作者不可或缺的能力。这种优化不仅保障了艺术创作的社会责任,也提升了作品的深远影响力。参考:清华大学新闻与传播学院沈老师相关研究Sora,WikipediaSora,赛博禅心,Sora 原理解读Ai研习社,免费Sora 学习手册从Sora谈起:OpenAI的AGI 路线是什么,赛博禅心震撼!“文生视频”模型一夜刷屏,中国记协Sora对新闻业有坏处?庖丁解News展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




零基础AI入门指南 -绝世好 Sora .pdf



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/1237406.html