在当今数字化时代,人工智能正以前所未有的速度和规模发展,给人类社会的发展和社会进步带来巨大的影响和变革。随着大数据、云计算等技术的成熟发展,AI大模型展现出勃勃的发展生机和巨大的增长潜力。2023年春节前夕,美国大语言模型ChatGPT狂飙登台;2024年春节期间,美国多模态大模型Sora推出,引发热议;2025年春节,DeepSeek横空出世,使中国国产AI大模型成功转型,迅速从“跟跑”走向“并跑”。作为AI的一个重要分支,人工智能生成内容(AIGC)近年来备受关注,因为这项技术融合了自然语言处理、机器学习和深度学习等前沿人工智能技术,通过分析大量数据来识别其中的规律和模式,从而生成与原始数据相似或全新的内容。现在这种技术已经广泛应用于新闻、娱乐、教育、医疗、金融和广告等各个行业。随着技术的不断进步,我们有理由相信,AIGC将来会在更多领域发挥更大的潜力,为人类的生活和工作带来更多便利和创新。

供图:沈阳

AIGC
Q1:AGI、GAI、GAN、LLM等名词都是人工智能话题中经常听到的、看到的,这些常见名词与AIGC有什么区别与联系?
曹三省:AGI(Artificial General Intelligence),即“通用人工智能”,是目前人工智能技术发展的一个重要方向和愿景,它强调通过具备自主感知、认知、决策、学习、执行和社会协作等能力,且符合人类情感、伦理与道德观念的“通用人工智能体”的大规模运用,在复杂动态的环境和场景下,自主生成并完成任务,在人们工作和生活的方方面面发挥重要作用,提高工作效率,改善生活品质,提升人类体验。
GAI(Generative Artificial Intelligence),即“生成式人工智能”,是当前人工智能技术发展的热点和焦点所在,它的基本原理是通过让智能体大量学习数据,然后进行自我迭代和泛化,生成新的、人们没有见过的各类内容,包括文字、图片、声音、视频、程序代码、数学物理模型等。
GAN(Generative Adversarial Networks),即“生成式对抗网络”,是一种近年来兴起并得到广泛应用的深度学习技术,是目前生成式人工智能中的一项关键技术。一个生成式对抗网络是由“生成器”和“判别器”组成的,生成器致力于创造出逼真的数据、以“欺骗”判别器,而判别器则努力把生成器制造出来的数据和真实存在的数据进行鉴别和区分,二者通过不断的动态对抗,实现数据生成能力和质量的提升。
LLM(Large Language Model),即“大语言模型”,是指采用大量的人类自然语言文本数据进行训练的深度学习模型,其能够理解人类语言的文字含义,并以此为基础进行一定程度上乃至无限地接近人类自然语言的文字内容生成。目前,大语言模型已经获得越来越广泛的应用,成为人工智能系统“讲人话”“懂人事”的重要技术基石。
AIGC(Artificial Intelligence Generated Content),即“人工智能生成内容”,是指通过各类人工智能新技术的综合运用和创新迭代而形成的一种显著的创新趋势、信息生态和发展愿景,在AIGC下,智能体成为内容生产的关键主体,它能够在人类需求的驱动下,通过对人类已有高质量信息内容的深度学习和理解,进行人类能够感知和认知的文字、图片、音视频等媒体内容,以及人类不可直接感知但具有重要作用的各类代码、模型等数据内容的泛化生成。
总之,AGI、GAI、GAN和LLM这4个技术领域和概念,与AIGC存在着紧密的关联。AGI是上述概念中最为宏观的一个,它代表着人工智能发展的重要愿景和方向,即“通用化”,其中也包括了信息内容生成意义上的“通用化”。GAI与AIGC似乎是同文同义,也存在一定意义上的“技术主体”与“态势趋势”的因果关系:AIGC由GAI而生,因GAI而AIGC。GAN是当前AIGC技术与产品中的一项关键技术,它通过“生成”与“判别”两个内在技术体系的“左右互搏”,实现高质量AIGC系统的“自我提升”与“内驱力”。LLM则是以人类语言为基础的AIGC的一项技术基石,没有LLM对人类语言的学习和理解,也就不会有获得人类感知体系和认知体系高度认可的高质量AIGC。
AIGC
Q2:AIGC的发展离不开技术的支持。AIGC的关键技术有哪些,请用通俗易懂的话语介绍其原理。
曹三省:MoE,即“混合专家架构”,是一种AI系统的体系结构,在DeepSeek中有着典型的应用。MoE架构强调AI模型中不同专家系统模块的互补协作,就像搭建起了一个多专业、多学科的专家团队,其中的每位专家都有自己的学术专长,模型在处理一个任务时,无论是处理一段文字、理解一幅图像还是回答一个问题,任务都是被分配给最擅长处理该任务的专家模块去做的。
CLIP,即“语言—图像对比预训练模型”,是当前AIGC技术中非常典型的一项预训练模型技术,它的功能和作用是通过采用来自互联网的大规模文字与图像信息(起始阶段达到了4亿条数据)对它自身的两个主要功能模块,即图像编码器和文本编码器进行训练,建立起图像内容和自然语言文本的关联关系,让大模型能够读懂已有的图像,并进而能够有效识别新图像中的内容,把图像内容转化成人们能够理解的语言文字。
预训练模型,是当前AI技术的重要基石。它的基本原理是采用大规模数据,预先训练特定的神经网络模型,从而使这个模型能够达到以往常规的神经网络难以实现的能力水平。通过对大规模数据的分析处理和深度学习,预训练模型能够掌握这些数据所包含的有用的信息特征,这些特征进而可以用于新内容生成等智能任务,让高质量的AIGC成为可能。
多模态技术,在AI领域中通常是指通过整合不同模态下的数据,包括图像、文字、音频、视频等,来增强我们所采用的模型的理解能力、推理能力和创造能力的技术。通俗地说,一个人在演讲时,通过丰富的肢体语言,再加上PPT、视频等内容展示,就能够让听众更好理解自己,而这就是多模态技术在AI中所发挥的作用。多模态技术是由几项关键技术共同支撑的,它们包括数据融合、模态对齐、特征提取、表示学习、跨模态转换等,这些技术从不同角度支持了丰富的多模态数据在AIGC下的有机结合。
生成算法,是AIGC中相对于“准备阶段”的预训练、自然语言处理等技术的、在内容生成阶段发挥作用的算法技术。目前已经广泛运用的生成算法包括文本生成、图像生成、音乐生成、视频生成等。常见的生成学习算法有高斯判别分析算法、朴素贝叶斯算法、拉普拉斯平滑算法等,这些算法从不同的数学原理和模型出发,支撑了各具特征和优势的内容生成能力。
陈建海:生成式对抗网络(GAN)是2022年以前使用的AI内容生成技术。GAN是一种由两个神经网络组成的模型,一个是生成器(负责生成内容),另一个是判别器(负责判断生成的内容是否真实)。这两个网络相互对抗,生成器不断改进生成的内容以“欺骗”判别器,而判别器则不断提升自己的判断能力。通俗地讲,就像一个画家和一个评委,画家努力画出更好看的画,评委则不断提高自己的鉴赏能力,直到两者达到一种平衡。
扩散模型(Diffusion Model),这是一种基于扩散思想的生成式建模方法。它的目的是学习从纯噪声生成图片的方法。目前,OpenAI的GLIDE和DALL-E2、海德堡大学的Latent Diffusion和Google Brain的ImageGen等主流模型,都是基于Diffusion模型,是目前为止生成的图片效果质量最高的方法。通过训练一个U-Net,接受一系列加了噪声的图片,学习预测所加的噪声。然后,经过两个过程,即前向过程和反向过程,生成我们所希望的图片。前向过程逐步向输入的真实图片添加噪声最终得到一个纯噪声的图片,其对于每个训练集所有的图片都能生成一系列噪声程度不同的加噪图片。在训练时,这些不同程度的噪声图片+生成它们所用的噪声是实际的训练样本。训练好模型后,就可以基于这个模型通过一个反向过程的采样去噪就能生成所希望的图片了。
沈阳:深度学习:AIGC的基石,类似于让AI通过“模仿”人类大脑的方式学习。它通过大量的数据训练,让AI逐渐掌握如何识别模式、生成内容。就像你教一个孩子看图识字、听歌学词,AI通过这种方式学习并生成内容。
大语言模型(LLM):这类模型专注于语言处理,它通过分析海量的文本数据,掌握了如何理解和生成自然语言。它的工作原理类似于根据大量书籍、文章等的学习,懂得如何写出流畅、逻辑清晰的文章。
自注意力机制(Self-Attention):这种技术让AI在生成内容时,不仅考虑当前单词或图像的局部信息,还会注意到整个上下文或图像的整体结构。就像在写文章时,不仅关注每个词的意义,还能考虑整篇文章的流畅度和逻辑性。
变换器(Transformer):大语言模型的基础,它帮助AI更高效地处理大规模数据。在文本生成时,通过“注意力机制”把输入的所有信息进行加权处理,从而生成更合适的输出。简单来说,它能帮助AI抓住重点,避免遗漏重要信息。
这些技术共同作用,让AIGC能够在创作方面不断突破,实现生成文字、图片、音频等多种内容的能力。
AIGC
Q3:当前,AIGC广泛应用于各个领域,请介绍AIGC的具体应用场景。以广电机构纷纷入局AIGC为例,其会给广电行业带来哪些改变?
陈建海:AIGC应用场景包括文本、图像、音频和视频四种类型的内容生成场景,已经涵盖工业、医疗、金融、传媒、教育、娱乐、电商等诸多领域。文本生成方面,AIGC赋能新闻报道稿件的创作,可以快速生成简明扼要的报道。作家和内容创作者利用AI工具生成故事大纲、角色设定或对话,帮助激发灵感。聊天机器人场景中,企业使用自然语言处理技术开发智能客服,实现自动回答用户问题和提高服务效率。图像生成方面,在艺术创作中,AIGC能够生成独特的艺术作品,艺术家可以将其作为灵感来源或合作伙伴;在广告设计中,广告公司利用AI生成不同风格的广告图像,以满足市场的多样化需求;在虚拟试衣中,电商平台采用AI生成的模型图像,帮助顾客在线试穿服装,提升购物体验。音频和音乐生成场景下,AIGC可以生成新的音乐作品,作曲家可以将其作为创作的基础或灵感来源。语音合成AIGC的文本转语音技术可用于生成自然听感的语音,用于有声书、语音助手等应用。视频生成场景中,AIGC用于短视频和动画制作,可以帮助用户快速制作短视频,自动剪辑和生成动画内容,降低制作成本。在社交媒体和视频平台上,AIGC可以根据热门趋势自动生成视频内容,吸引观众。游戏开发场景中,用于动态内容生成,AIGC可以生成开放世界游戏中随机的任务、角色或环境,增加游戏的可玩性和新鲜感;AI可以驱动游戏中的NPC(非玩家角色),使其拥有更自然的行为和对话。在教育领域,AIGC不仅可以生成个性化的学习材料和测试题,帮助学生根据自身的学习进度和需求进行学习,还可以作为虚拟教师,提供即时生成的答疑和辅导,提升学习效率。在医疗领域,AIGC用于医学影像生成和分析,不仅可以生成医学影像的合成图像,帮助医生进行诊断和治疗计划,还可以自动生成患者的诊疗报告,减少医生的文书负担。在法律和合规检查方面,AIGC可以根据模板和用户输入自动生成合同和法律文书,AIGC工具也能够分析文本内容,检查合规性和潜在法律风险。
郭豪珺:广电机构纷纷入局AIGC,给广电行业带来了改变。AIGC工具的变化引发了生产关系变革,这主要体现在生产者对生产工具的“所有权”及“使用权”方面。与传统的高投入与高收益不同,AIGC作品的支收比和转化率并不是一个固定的数值,而是一个动态变化的过程。在实际应用中,受技术成熟度、选题创意、作品目的、市场接受度、应用场景、运营宣传策略等综合因素影响,创作者需要根据自身情况和环境灵活调整生产工具,良性发展创造更多的价值。根据上述AIGC生产工具与生产关系的变革特点,AIGC的创作团队构成方面也需要做相应的适配,从传统的“创意与制作型”向“创作与新技术应用并重型”转变,主要包括编程人员、网络工程师、AIGC系统应用员、创意与制作人员四大类构成。其中,编程人员负责提供AIGC工具部署时的底层相关技术支持与保障,包括但不限于程序代码调试、模型训练及部署、插件安装调试、环境依赖调试等。网络工程师则负责提供“符合”AIGC工具使用的网络环境,按需搭建轻量化通用AIGC工具及运维部署,解决工具使用时交互访问各类第三方网络地址或工具等问题。这两类工种旨在解决AIGC时代使用开源、本地部署或UI化程度较低的新生产工具时,不得不面对且需要解决的两个跨专业问题——“编程”和“网络”。
韩健:AIGC的出现推动AI从以“判别式”为主向以“生成式”为主演进,给以视听产品制作和服务为主要内容的广电行业带来了前所未有的机遇。一是推动生产方式智能化,大幅提升内容生产效率和质量。通过AIGC技术深入挖掘广电领域丰富数据,打造的语言、图像、音频大模型或多模态大模型将化身有着丰富知识和资深经验的“行家里手”,推动选题策划、热点筛选、素材剪辑以及文字、图像和音视频编辑等工作由高度依赖从业人员经验转向由AI承担,大幅缩短了内容生产时间,提高了内容质量。例如,央视网打造的“智策大模型”,两会期间创作了《AI时政画报》系列报道,实现了图文、视音频作品的智能化生产,极大丰富了画报的内容和形式。二是培育视听新模式新业态,大幅提升内容体验感和竞争力。众多广电机构纷纷推出AI导演、虚拟主播等创新产品,可以实现7×24×365全天候高效运转,满足全时段各类受众的文化需求,并为观众带来新奇的观看体验。例如,上海电视台发布基于手语大模型的交互式数字人手语翻译项目《润爱无声助聋门诊场景》,让AI服务听障人群。
沈阳:AIGC正在快速渗透到各个领域,带来了革命性的变化。尤其是在广电行业,AIGC的应用正在改变传统内容的生产方式,提升效率,并创造新的可能。
内容生成与创作:AIGC能够自动生成新闻稿、剧本、广告文案等内容。这让广电机构能够快速响应市场需求,提升创作效率。比如,AIGC可以根据热点话题自动生成新闻稿,或根据某个主题创作电视剧剧本,大大减少了人力和时间成本。
个性化推荐与定制内容:AIGC可以帮助广电机构分析用户的观看习惯,生成定制化的内容推荐。例如,AI根据观众过去的观看记录,自动推送符合其兴趣的节目或电影,提升用户黏性和满意度。
虚拟主持人和AI主播:在一些新闻和娱乐节目中,AIGC还被用来生成虚拟主播和主持人。这些AI主播可以以真人般的方式呈现信息,且24小时不间断工作,帮助广电机构节省人工成本,并能快速生成并播报新闻。
内容审核与编辑:广电机构需要审核大量的节目内容,AIGC能够通过自然语言处理和图像识别技术,自动筛选不符合规定的内容。这不仅加快了审核流程,还减少了人工错误,提高了内容审核的准确性和效率。
增强互动与虚拟场景:AIGC可以用于创作沉浸式的虚拟现实或增强现实内容。例如,在综艺节目中加入AI生成的虚拟场景,或让观众与虚拟人物进行互动,可以增加节目趣味性,提升观众体验。
总的来说,AIGC的引入,给广电行业带来了更高的效率、更低的成本和更多的创新空间,未来可能会出现更多基于AI的节目形式和互动体验。
AIGC
Q4:AIGC是一柄双刃剑,其在助力各行业繁荣与发展的同时,也存在一些风险。这些风险具体包括哪些?可以采取哪些防范措施?
陈建海:AIGC存在一些风险,包括以下几个方面。首先,内容质量与真实性。其次,版权与知识产权。再次,算法偏见与伦理问题。从次,安全与隐私风险。最后,就业影响。
针对以上风险,防范措施主要如下。第一,提高内容审核标准。第二,制定法律法规。第三,加强数据管理与隐私保护。第四,伦理与教育。第五,就业风险应对。
郭豪珺:AIGC是一柄双刃剑,其在助力各行业繁荣与发展的同时,也存在生成虚假有害信息、侵犯隐私、算法歧视、侵犯知识产权等风险。广电作为主流媒体应坚持守正创新,通过受众导向的内容创作和技术创新来传播主流意识形态与价值观,旨在传达积极正面的信息,提升公众的文化素养和社会责任感,确保所传播的内容能够满足公众的信息需求,维护自身的社会影响力与公信力,有效地在复杂多变的信息环境中引导正确的舆论方向。主流媒体传播渠道相对稳定,在长期的发展过程中已形成较为固定的形式习惯,AIGC技术加持作品内容生产,现阶段仍以视音频、文字形态为主要载体。受播出质量标准、媒体核心定位、法律法规约束、专业素质要求等多方面共同作用,技术的变化不会干扰主流媒体对内容评判标准的本质要求,主流媒体要以谨慎态度对内容质量进行严格把控,播出作品需符合信息合理性、逻辑合理性、准确性、客观性、原则性、艺术性、价值性及公正性等。
韩健:技术的发展从来都是一柄双刃剑,其进步在带来产业发展、经济增长和社会进步的同时,也会产生一些潜在风险。我们应平衡好发展与安全的关系,既不能因技术进步伴生的潜在风险而“因噎废食”,也不能对出现的问题置之不理,应通过技术创新、机制完善等手段让技术更好地服务于人。
一是发展和应用负责任的AI。一方面,确保数据来源合法合规。另一方面,支持广电行业与研究机构、AI企业合作探索和应用可信、可控、可靠的AI技术,从源头控制技术的潜在风险。二是完善治理体系。首先,加大对AIGC生成内容的审核力度。其次,对AIGC生成内容进行显著标识。最后,打造多元协同治理体系,充分发挥政府监管作用,增强行业自律以及内容生成机构责任意识,建立动态监管框架,为AIGC创新应用保驾护航。
AIGC
Q5:未来,AIGC在广电及其他行业发展前景如何?还会有哪些更具想象空间的领域?
曹三省:对于未来AIGC在广电行业中的运用,可以观测到如下总体趋势。
第一,以人为本的信息传播与信息服务的根本需求,促使广电行业深耕并实现人与AI的有效协作,人机协作正在成为现代社会和工作环境中的重要趋势。
第二,广电行业长期从事的播出级、专业级高质量视听内容生产与专属传播工作的能力基础,将为未来AIGC所需的高质量数据资源的持续供给提供支持。除了在算力基础设施上可能存在的瓶颈与制约,目前观测到的未来人工智能发展中的一项重要的瓶颈问题在于对AI的持续高质量训练数据投喂。
第三,要进一步强化自主可控的AIGC技术的持续创新和深入运用。在复杂的国际科技创新与综合实力竞争与博弈的环境下,我国广电行业更需要的是自主研发的技术产品和能力平台,这也将使广电行业进一步从应用场景角度出发,通过科技创新,提升行业协同服务能力。
陈建海:未来,广电行业将进一步打开AIGC融合发展的更大想象力,在不断向内突破、向外兼容的过程中持续焕发生机。
首先,AIGC用于内容创作与制作和自动剧本生成。其次,个性化节目推荐。再次,后期制作可以实现智能剪辑和特效制作。最后,广告投放中的动态广告生成和内容驱动的广告。根据用户数据,AI可以实时生成个性化广告内容,提高广告的投放效果。通过分析正在播放的节目内容,AIGC可以生成相关联的广告,提高广告的相关性和吸引力。
未来,随着技术的不断进步,AIGC在广电及其他行业的应用将更加深入,更具想象空间包括虚拟现实和增强现实、人机协作以及情感与社交智能领域。在虚拟现实和增强现实方面,结合AIGC的内容生成能力,AI可以创造沉浸式的虚拟体验,改变娱乐、教育和培训的方式。在人机协作方面,AIGC与人类创作者的协作将成为常态,AI不仅是工具,更是创作伙伴,激发出更多创新。在情感与社交智能方面,未来的AIGC将能够理解和模拟人类的情感,生成更具人性化的内容,与用户建立更深层次的连接。
郭豪珺:AIGC技术与工具的每一次迭代与进化,其在功能性、服从性、效率性、易用性和结果一致性等方面都会展现出显著的进步。在这样一个竞争激烈的环境中,仅仅依赖专精单一的专业技能已经难以立足,因为新的工具和技术总能在不经意间超越传统方法。面对挑战,加强培养和储备具备复合型能力的创作人才尤为重要,这些人才不仅需要拥有深厚的技术功底,还应当具备广泛的创意视野和跨学科的知识背景,能够成为连接技术与创意的桥梁,促进不同专业背景人员之间的有效沟通与协作。
AIGC作为新质生产力,带来了内容生产方式的根本性变革,提供了前所未有的创新手段和效率提升。面对高速发展的技术与尚不明确的发展形态,既要专注于作品细节的打磨与生产流程优化,更需要对行业发展趋势、对生产工具研发方向、对用户群体深层次需求变化,保持高度敏感和持续关注,以确保能够灵活地调整自身的技术路线和发展策略。
韩健:未来AIGC在广电领域的发展前景可期。首先,AIGC技术以其强大的内容生成能力开启了内容创新“万花筒”,为广电行业提供了全新的内容创作和呈现方式,孕育了丰富的应用场景和广阔的创新空间。其次,按照AI领域的“新摩尔定律”——规模定律(Scaling Law),随着算力规模持续增大、高质量训练数据的持续提升,以大模型为代表的AIGC技术仍有较大的成长空间,对广电领域的赋能效应将进一步显现。最后,随着模型可解释性、准确性以及数据的可管、可控、可溯等技术的进步,当前由AIGC技术引发的潜在风险将进一步减少,为爆发式应用扫清障碍。
未来,AIGC有望为广电领域带来更多颠覆性影响。第一,实现“千人千面”的智能内容和产品推荐、制作或成为可能。第二,推动广电与其他行业跨界融合拓展增长新空间。利用AIGC技术,促进广电领域与文旅、教育、公益、健康等领域深度融合,形成跨界融合、良性互促的生态系统,激发各领域广泛形成新商业模式、新产业形态和新增长空间。
AIGC反映了当前人工智能技术在内容创作领域的应用潜力。AIGC的出现预示着未来我们可能看到更多由AI驱动的创作,如文本、图像、音频甚至视频。这种技术的普及,将身影遍及广告、娱乐及教育等各个行业,改变人们对创作和消费内容的传统认知。总之,AIGC作为一种新兴技术,正在逐步走向成熟。本期科普直播间,5位专家学者从概念、技术、应用场景、存在风险及预防措施、未来发展等方面为我们进行了全面阐述,我们期待着,在未来的日子里,AIGC能够帮助人类更好地完成各种任务,为全球的科技发展注入源源不断的活力。

转载来源《广播电视信息》官方公众号