智能内容生成在催生什么传播新变局_陆小华.pdf
《智能内容生成在催生什么传播新变局_陆小华.pdf》由会员分享,可在线阅读,更多相关《智能内容生成在催生什么传播新变局_陆小华.pdf(6页珍藏版)》请在咨信网上搜索。
1、专题研讨数字新闻研究83青年记者2023年2月上 陆小华智能内容生成在催生什么传播新变局2022 年,智能内容生成领域既出现了具有引人注目生成能力的 AI 模型,也出现了上线几天即在美国高校入学资格考试(SAT)中获得中等学生水平成绩的智能聊天机器人 ChatGPT。对 2023 年重要科技进展的预测中,智能内容生成技术成为多家媒体的选项。智能内容生成技术的重要进展和应用,正深刻影响数字媒体发展、媒体深度融合走向,催生传播新变局。值得政策制定者、媒体管理者和研究者们深思的是,用一段文字所生成的图片、视频距离数字内容生产与传播还有多远?智能内容生成会催生什么新变局?为了既能够在内容生产、网络传播
2、、舆论博弈、认知塑造等领域有效利用智能生成能力,又能够有效抑制深度合成等可能造成的认知混乱和危害,当前无论在路径选择、资源投入,还是政策设计、规则制定等方面,都需要做认真准备,做出方向选择,展开有力行动。依文稿生成交互视频:五年前的调研追踪智能内容生成技术及其在内容生产中的运用,是笔者媒体生涯中曾重点关注和调研过的。这既是因为作为研究者需要一直关注、研究新媒体发展,也是因为作为媒体管理者职责所在,希望借助智能内容生成技术提升新华社视频生产能力、增强竞争力。2017 年调研时,重点关注了美联社与 Wibbitz 公司在依文稿自动生成视频方面的合作。以色列年轻人佐哈尔达杨(Zohar Dayan)
3、发明了应用 Wibbitz。只要内容文本中提供一行 JavaScript 代码,Wibbitz 就可以运用自然语言理解和算法从文章中抽取摘要并从网上获取相关图片,然后将这些图片、信息、配音等生成用 HTML5制作的交互视频,可分享到社交媒体上。早期,Wibbitz对英语和葡萄牙语辨识度较高。2011 年 Wibbitz 在以色列创立,两年后进入美国市场,2012 年获得 Horizons Ventures 公司的 230 万美元投资。1Wibbitz 能够解析关键信息并直观有效地呈现,使内容生产机构愿意尝试将Wibbitz 集成在他们的网站上。2017 年 Wibbitz 公司获得的 2000
4、 万美元的 C 轮融资,就主要是媒体所投。其中,德国知名传媒集团贝塔斯曼旗下子公司 Bertelsmann Digital Media Investments 领投,美国天气频道、美联社以及法国 TF1 公司跟投。原有投资方 NantMobile、lool Ventures 和 Horizons Ventures 同样也参与了本轮融资。Wibbitz 联合创始人兼首席执行官达杨认为,这次的投资方在视频制作方面也都有一定经验,体现了对 Wibbitz的认可。Wibbitz 的技术主要就是为各家媒体现有视频团队提供补充支持,让他们以较低成本自动制作大量视频。而剩下那些高端工作,则留给团队成员去完成
5、。公司的目标就是尽量减少自动制作视频和手动制作视频之间的差别。现阶段,媒体对于在内容创作方面使用人工智能技术这一行为的接受程度越来越高,已经或者开始意识到它所带来的价值。据报道,Wibbitz 公司当时已经与包括彭博社、考克斯传媒集团、美国天气频道在内的新闻机构达成合作。2调研时关注的另一个视频生成平台是纽约的 Wochit。同样诞生于 2012 年的 Wochit,官网自称是“白标视频编辑器”(Wochit Frame,White-label Video Editor),称可以“为您的客户提供视频力量”,可以为所有技能水平的创作者提供直观界面和功能,提供多种模板、多种功能满足用户的不同需求,
6、生成的视频可以分享到社交媒体上。这个应用可作为插件集成到用户的平台上从而具有视频创作能力,用户可根据平台需求调整视频编辑器的外观、功能。3Wochit 与全球多家新闻视频采集机构签订了合作协议,可帮助用户将原始新闻视频资料通过剪辑生成“独家内容”,生成工作的大部分由算法帮助完成。用户可以上传自己的文字稿件,Wochit 平台可搜索提供对应的视频素材,供用户选择素材和模板后,再使用具有“拖拽功能”的剪切工具进行视频剪辑,就能制作出与文字摘 要:智能内容生成技术取得重要进展,进入应用增长期,正深刻影响数字媒体发展、媒体深度融合走向,催生传播新变局。为了既能够在内容生产、网络传播、舆论博弈、认知塑造
7、等领域有效利用智能生成能力,又能够有效抑制深度合成等技术可能造成的认知混乱和危害,当前无论在路径选择、资源投入,还是政策设计、规则制定等方面,都需要做认真准备,做出方向选择,展开有力行动。关键词:生成式 AI;智能内容生成;传播;新变局;智能传播DOI:10.15997/ki.qnjz.2023.03.025专题研讨数字新闻研究青年记者2023年2月上84稿件相关的视频内容,用户还可在视频内打上自己的水印标识。Wochit 作为一款视频平台,可帮助视频“小白”在短时间内制作、剪辑出视频。2016 年 10 月,新加坡报业控股集团旗下风险投资基金 SPH Media Fund 宣布领投 Woch
8、it 最新一轮 1300 万美元的风险投资,其他参与投资的包括德国媒体 ProSiebenSat.1 和其他个人和机构。2017 年对智能内容生成技术的调研,客观上是那个阶段对可用于视频智媒体平台的人工智能技术调研的一部分。2017 年 3 月 3 日上线运行的新华社全球视频智媒体平台,在规划、建设时就是以增强体系竞争力为核心目标,实现了融合运作体系的同步构建,体现了流程优化、平台再造和各种媒介资源、生产要素的有效整合,实现了信息内容、技术应用、平台终端、管理手段的共融互通。“新华社全球视频智媒体平台”项目 2019 年获媒体技术领域唯一国家级奖项中国新闻科技“王选奖”一等奖。在组织推动新华社
9、全球视频智媒体平台建设、运行的同时,笔者就在积极调研与音视频采集、生产、分发相关的人工智能技术,为此探访过国内这个领域的多个企业,包括一些头部企业。相对而言,人脸识别等技术当时在国内更为风行,并没有发现可用于音视频生产流程的智能内容生成产品。但智能内容生成技术发展动向与产品,是笔者作为研究者一直密切关注的。媒体技术建设从来不是单纯技术运用,既要为媒体融合、业务运行、增强影响力服务,又要密切跟踪对于内容生产与传播格局可能产生重大影响的新技术、新趋向。新媒体、新传播、新格局等新闻传播领域的重大变革,往往是由某种新发明、新技术、新应用推动的。智能传播科技的发展已经产生了这种推动作用。但包括智能内容生
10、成在内的新技术可能产生更大催化作用。ChatGPT 与 AI 模型:智能内容生成的重要进展人工智能在多个领域取得长足进步是不争的事实。在智能内容生成领域,有两个重要进展引发了强烈关注。其一,是 ChatGPT(智能聊天机器人)。结合了搜索引擎和文本生成功能的智能聊天机器人 ChatGPT,由人工智能研究实验室 OpenAI 于 2022 年 11 月 30 日推出,用户通过聊天可以获取诗、讲话稿、新闻稿等诸多类型的文本。有报道说,ChatGPT 上线 5 天用户数量已突破100 万。因试用人数太多,后曾关闭试用。ChatGPT 还参加了美国高校的入学资格考试(SAT),取得中等学生水平的成绩,
11、还用老友记主角口吻创作了剧本对白。OpenAI 由埃隆马斯克和投资家萨姆阿尔特曼(Sam Altman)等人创办,2018 年马斯克退出公司董事会。2018年,OpenAI 推出第一代 GPT,之后两年迭代了三个版本。2020 年,GPT-3 问世,这是一个拥有 1750 亿参数、利用 45 万亿字节文本数据进行训练的算法模型。在它出现之前,世界上最大的语言模型是微软的 Turing-NLG,不到 2 亿参数。从关于 GPT 的论文中可以了解到,GPT是通过文字接龙以及人工引导接龙反馈的模式训练这一语言模型的。最新推出的ChatGPT大约相当于GPT的3.5版本。4在本文的写作中得到一位智能科
12、技专家转来的信息,据 ChatGPT&AI News 透露,“GPT-4 即将推出,这将使 ChatGPT 看起来像一个玩具。GPT-3 有 1750 亿个参数,GPT-4 有 100 万亿个参数。”ChatGPT 作为智能内容生成重要进展的价值,还可以从微软的新动作中看出来。根据 2023 年 1 月 10 日美国财经媒体 Semafor 的报道,微软公司等投资机构正就向 ChatGPT 的开发者 OpenAI 投资 100 亿美元开展谈判。交易达成后,OpenAI 的估值将达到 290 亿美元。Semafor 报道说,微软的注资将是复杂交易的一部分,收回投资前,微软都将获得 OpenAI
13、75%的利润。达到门槛后,微软将拥有 49%的股份,其他投资者持有 49%,OpenAI 的非营利性母公司持有 2%,不过该报道并未说明在微软收回资金之前的持股情况。此外,该交易还设定了每类投资者的利润上限。此前,华尔街日报报道称,OpenAI 正在试图以大约 290 亿美元的估值出售现有股票,Thrive Capital 和 Founders Fund 等风险投资机构则正在从现有股东手中购买股票。这个消息加剧了对ChatGPT 关注的原因,不仅是拟投资金额,更因为根据2023 年 1 月 7 日美国科技媒体 The Information 的报道,微软公司将可能把 OpenAI 的人工智能技
14、术纳入其办公软件 Office,这个设想一旦落地,将深刻影响 Office 庞大用户的工作和生活习惯。1 月 3 日 The Information 曾报道,微软新版搜索引擎必应(Bing)提供自然语言理解搜索结果,而不仅是链接列表。微软与 OpenAI 合作早已开始。2019年,OpenAI 获得了微软 10 亿美元的投资。随后 OpenAI在微软的 Azure 云计算服务上开发其人工智能超级计算技术。5其二,是可依据文字生成图片和视频的 AI 模型。英国新科学家周刊网站一篇2022 年,人工智能让把一切绘制成图成为可能的文章说,能够根据简单的描述性文本生成像照片一样逼真的图像的 AI 模型
15、出现,可能是“最大冲击之一”。2022 年前这种将文本转化为图像的 AI 还是一项相当不成熟的技术,但 2022 年这项技术得到迅猛发展,此年美国科罗拉多州博览会美术竞赛上获奖作品之一就是 AI 创作的。这篇文章引述了英国伯明翰大学马克李的分析:在硬件和软件优化的共同作用下,智能内容生成技术迅速发展。开始,研究人员将谷歌公司工程师 2017 年发明的一种名为转换器的算法用于生成图像。此前,这类 AI 模型被用于构建像“生成型已训练专题研讨数字新闻研究85青年记者2023年2月上变换模型 3”(GPT-3)这样的文本生成模型。然后,在硬件功能变得更强大基础上,拥有训练这些模型的资金和资源的大公司
16、开始免费提供部分研究成果,甚至很有远见地向更大范围内公众提供有限使用机会,使更多科学家涉足这个领域。这篇文章引述 Hugging Face 网站创建人之一托马斯沃尔夫的话说,尽管转换器模型在图像生成方面取得初步进展,但一种名为“扩散”的新型算法最近几个月一直处于领先地位。转换器算法往往会提供一些怪异作品,扩散模型能够创作出具有精细纹理的作品。用人工智能创作定制艺术品所需的成本和时间将大幅减少,这最终可能会对人类创作者产生巨大影响。这篇文章说,封面创作者抱怨 AI 已经抢走了他的佣金,客户正在选择免费生成的图片。6智能内容生成技术走向与突破点:智算专家的解析智能内容生成技术将如何发展?笔者部分借
17、用德尔菲法7,提了三个问题,请天津大学几位智能计算专家做解析。虽然本文读者未必有多少是搞智能内容生成技术等人工智能、智能传播科技研究的,但这几位专家的回答,对于新闻传播领域的政策制定者、决策者、操作者、研究者们,是有重要启发意义的;对智能传播科技、人工智能研究者们则可能是研究方向的重要提示。问题一:ChatGPT 和可依据文字生成视频的 AI 模型的出现,是否意味着智能内容生成技术取得重大突破?李克秋(天津大学智能与计算学部主任、教授):过去一年,生成式 AI 模型成为人工智能领域中的新热点,以 OpenAI 的 ChatGPT 和 DALL-E 为代表的技术在创作文字、图像、视频等性能上表现
18、出色,在对用户意图的理解和结果的准确性、完成度和易用性上都达到了前所未有的高度。虽然不能过度神化此次技术突破,但在增长范式上,与此前的模型确实拉开了巨大的代差。其核心源于算力的大幅提升,对“大模型”(基座模型)认识的变化,也离不开对新的模型结构上的成功探索,以及数据质量和规模的改善。从这个角度来看,智能内容生成技术能达到如今的水平也是必然趋势。需要特别提到两个在本次突破中起到关键作用的技术:第一个是强化学习。强化学习在大模型训练的反馈上提供了更强大的机制,这也使它逐渐从只应用在游戏等几个孤岛场景中脱离出来。相比于此前的技术,近期的大模型训练能够更为深入地挖掘和理解用户的潜在意图。未来可以将反馈
19、目标更明确化,从不可控的生成向可控,从黑盒到可信智能演变。第二个是长篇/幅的注意力机制。注意力是维护模型在持续任务上的上下文一致性的核心机制。新晋模型明显的优势在于可维持较长的对话,生成长时序真实感强的视频等等。但即便如此,幻象问题依旧是一个亟需改进的话题,从而避免“一本正经胡说八道”的行为。喻梅(天津大学智能与计算学部副主任、教授):智能内容生成技术已经取得了重大进展,其中包括使用GPT 类型的语言模型进行文本生成以及使用生成式对抗网络(GANs)等模型来生成图像和视频。ChatGPT 是一种可以生成文本对话的语言模型,而生成视频的 AI 模型则可以根据给定的文本描述生成相应的视频。这些模型
20、的出现是智能内容生成技术取得重大突破的具体体现,它们可以自动生成大量高质量的内容,并且在某些情况下可以达到人类水平。然而,目前来看还没有一种智能内容生成技术能够完全取代人类创作者,因为它们还缺乏对上下文和场景的理解能力。王 岚 君(天 津 大 学 新 媒 体 与 传 播 学 院 研 究员):ChatGPT 可以认为是现象级应用,其中也有OpenAI“学术明星”效应的加持。然而,从技术角度看,ChatGPT 是以 GPT3.5 为预训练模型基础的,比较独特的 Reinforcement Learning with Human Feedback(RLHF)也已经有一段时间的研究历史,不是最新技术。
21、ChatGPT 可以说是在技术成熟路径上,但并不是一个突破性的进展。郑岩(天津大学新媒体与传播学院副研究员):Open AI 发布的 ChatGPT 模型有着强大的信息整合和对话能力,在自然语言处理上面表现出了惊人的能力。能从文字生成视频的 AI 模型的出现也使得大量科研机构和人员涌向 AIGC 技术的研究。这些模型是很有意义的工作,智能内容生产技术的研究也因此得到进一步的推动。但我觉得单一的算法模型迭代升级很难被定性为一个领域的重大突破。这些模型引起广泛关注的原因之一在于其易用且实际的功能,包括根据用户需求自动生成代码、以聊天的形式与用户交互等。当前的研究创新都还在依赖超大规模的数据和强大的
22、算力支撑的大模型,算法和模型仍需要耗费大量资源去不断地完善。邵明来(天津大学新媒体与传播学院助理研究员、硕士生导师):ChatGPT 是大型语言模型,主要定位智能聊天机器人,结合了搜索引擎和文本生成功能。ChatGPT采用了更先进的自然语言处理技术,并在训练过程中使用了大量高质量自然语言文本数据,这使其能够更好利用语料库中的信息,提高处理文本信息的效率。另外一个主要提升点在于记忆能力,可实现连续对话,极大提升对话交互模式下的用户体验。但是,ChatGPT 现在还是存在不少问题。一是在具体问题回答上,仍然和具有专业经验的人士有明显差距。比如要制定一个出行计划,专题研讨数字新闻研究青年记者2023
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 智能 内容 生成 催生 什么 传播 变局 陆小华
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。