作者:
刘发军 黄 凯
(上海科技馆)
【摘要】
本研究聚焦于ChatGPT,加强科普场馆在数字化建设中对ChatGPT的整体认知,期待通过对此类新型人工智能技术的应用,为科普场馆开展数字化转型服务提供参考与借鉴。通过分析ChatGPT 的发展历程、技术特征、技术应用及应用方式,在ChatGPT系统实践的基础上,总结ChatGPT为科普场馆数字化转型带来的机遇,包括在科普场馆协助研究、数字展览、智能客服等方面的效率提升和赋能,同时探讨了ChatGPT带来的风险挑战,包括内容科学性、信息安全性、使用目的性、依赖性以及法律法规问题,并针对性地给出了相应对策。
【关键词】
科普场馆;ChatGPT;人工智能;数字化转型
2020年文化和旅游部印发《关于推动数字文化产业高质量发展的意见》和2021年国务院印发《“十四五”旅游业发展规划的通知》中提出要强化自主创新,加快推进以数字化、智能化为特征的智慧文旅。2023年国务院印发《数字中国建设整体布局规划》中提出,要推进文化数字化发展,深入实施国家文化数字化战略,提升数字文化服务能力。
科普场馆作为重要的文旅场所,在普及科学知识和科技成果方面一直扮演着重要角色。科普场馆数字化转型,一般指通过利用一种或多种新兴数字化技术(例如:AI、大数据等,本文指AI技术ChatGPT),促进其重塑管理、运营和服务,进而提升核心竞争力。随着数字化技术快速发展,近年来,科普场馆在数字化转型的潮流中不断探索新的技术方式,通过扩大AI等新技术应用场景,迭代打造数字化科普场馆,以更好地满足观众需求和期望,赋能科普场馆发展。
2022年11月30日,美国人工智能研究实验室OpenAI发布了ChatGPT,ChatGPT一经问世便引发了科技界的巨大关注,在社会层面形成广泛热议,在短短两个月时间里全球活跃用户突破1亿,成为史上增长最快的消费者应用。ChatGPT可在通用与垂直场景下进行多点应用,比如:文本生成、问题求解、机器翻译、知识搜索及聊天等,ChatGPT有望革新、重塑各行各业的内容生成与交互方式。当出现新技术变革时,科普场馆如何结合实际抓住ChatGPT带来的机遇并应对挑战,对科普场馆数字化转型具有重要意义。因此有必要对ChatGPT的发展历程、技术特征、技术应用等总结分析,并在此基础上展望ChatGPT对科普场馆数字化转型的应用机遇和挑战,为科普场馆数字化转型提供参考与借鉴。
(一)
ChatGPT
简述
人工智能生成内容(Artificial Intelligence Generated Content,AIGC),是继专业生产内容(Professionally-generated Content,PGC)、用户生产内容(User-generated Content,UGC)之后的新型内容生成方式,典型应用方式包括AI写作、AI问答、AI编程、AI绘画、AI视频生成和AI语音合成等,ChatGPT是AIGC的一款具体应用产品。
ChatGPT是一种基于深度学习技术的自然语言处理(Natural Language Processing,NLP)AI大模型,通过大算力、大规模训练数据来处理文本数据,输出符合语境要求的应答内容。ChatGPT全称为“Chat Generative Pre-trained Transformer”,Chat是“聊天”的英语词汇,GPT是“生成型预训练变换模型”的英语词组缩写,ChatGPT可翻译为“聊天生成预训练转换器”或简称“优化对话的语言模型”。ChatGPT基于GPT-3.5,使用人类反馈强化学习技术(Reinforcement Learning from Human Feedback, RLHF),将人类偏好作为奖励信号并微调模型,实现有逻辑的对话能力。
(二)
ChatGPT
模型演进
截至2023年8月,GPT系列模型发展经历了以下五个阶段,其技术主要演变如下:
GPT-1:发布于2018年6月,特征为无监督预训练和有监督微调,参数量达1.17亿,预训练数据量约5GB
[8]
,包含预训练和微调两个阶段,GPT-1先在大量的无标签数据上训练语言模型,然后在下游具体的有标签数据集上进行微调。
GPT-2:发布于2019年2月,特征为无监督预训练和多任务学习,参数量达15亿,预训练数据量约40GB
[9]
,使用相同的无监督模型学习多个任务,期望对不同任务的相同输入产生不同的输出。
GPT-3:发布于2020年5月,特征为无监督预训练和海量参数,参数量达1750亿,预训练数据量约45TB
[10]
,采用海量参数来进行训练和学习,GPT-3不追求GPT-2中的零次学习设定,而是通过少量样例理解并执行任务,聚焦模型的上下文学习能力。
GPT-3.5:特征为引入RLHF。通过引入人类反馈强化学习,使用人工对模型回复进行打分排名,使模型更好地理解并完成指令。
GPT-4:发布于2023年3月,特征为大规模多模态模型,可以接受图像和文本输入并产生文本输出。模型经过不断优化和调整,提高了输出内容的真实性和对期望行为的遵守程度。
(三)
ChatGPT
技术特征
ChatGPT作为一种大型自然语言处理模型,具有以下主要技术特点。
Transformer架构:ChatGPT是一种基于Transformer架构的自然语言处理模型,采用了Transformer架构中的编码器、解码器结构,用于处理输入和生成输出,是一种广泛用于自然语言处理任务的架构。
大规模多模态:前几个GPT模型以语言模型为任务核心,目前已发展到GPT-4,GPT-4可接受图像和文本输入并产生文本输出,是一个大规模的多模态模型。GPT-4虽然在许多现实世界场景中不如人类,但在各种专业和学术基准上表现出人类水平的表现,包括以大约前10%的分数通过模拟律师考试。GPT-4经过预训练可以预测文档中的下一个令牌(一种用于验证身份和授权访问的凭证),训练后的调整过程提高了输出的真实性以及对期望行为的遵守程度。
海量数据训练:GPT系列模型基于海量训练参数,参数量从亿级跃升至千亿级,而GPT-3.5和GPT-4训练参数目前还尚未公开。
数据标注:GPT前三个阶段模型不需要依赖人工标注数据进行训练,而是通过大规模的无监督学习方式,但ChatGPT在GPT-3.5基础上,开始依托大量人工标注数据,通过专业标注人员为ChatGPT提供人类指令的高质量答案,从而优化GPT-3.5无法理解人类指令含义及无法判断输入等情况。
强化学习:强化学习即通过奖惩分明的系统打分,使用RLHF,来更新参数以产生越来越高质量的回答。在与ChatGPT的互动过程中,人们发现它会承认错误、修复自己的答案,这是源于它从训练中获取的强化学习并重新思考的能力。
(四)
ChatGPT
技术应用
目前,ChatGPT通过订阅方式服务B端和C端用户。对C端用户,OpenAI发布了ChatGPT Plus订阅服务,每月收费20美元,对比免费版本,即便在高峰时段用户也能正常访问ChatGPT,用户响应时间会更快,同时也可以优先使用新功能。对B端用户,OpenAI通过发布ChatGPT API服务B端用户,用户可把ChatGPT集成到产品中,具有8K(1K=1024B)上下文窗口(约13页文本),每1K提示令牌将花费0.03美元,每1K完成令牌将花费0.06美元;具有32K上下文窗口(约52页文本),每1K提示令牌将花费0.06美元,每1K完成令牌将花费0.12美元。
通过不断降低用户使用成本,ChatGPT将有望加快商业化落地,主要包括但不限于以下方面的应用:
自动问答:用于构建自动问答系统,例如在线客服等。通过训练模型,根据问题自动输出回答,帮助用户快速解决问题。
文本生成:用于生成文章、摘要、翻译等文本,通过训练模型学习文本的语法和语义规则,生成高质量的文本。
辅助编程:用于辅助编程,修改软件Bug,辅助程序员写代码,检查代码,以及优化代码等,让编程更有效率。
机器翻译:用于机器翻译,通过输入源语言文本,翻译单词、短语和段落,并进行语法检查等,同时也可以输出多目标语言的翻译结果。
(五)同类产品发展情况
随着ChatGPT风靡全球,国内外头部科技公司竞争愈加白热化,国内自研的AI大模型也呈蓬勃发展态势,例如:阿里巴巴2021年11月发布的M6模型,模型参数10万亿;华为2021年4月发布的盘古NLP大模型,模型参数2000亿(见表1)。
百度和谷歌等相继推出ChatGPT的对标产品。2023年3月16日,百度发布“文心一言”试用版,开启邀请测试;2023年3月22日,谷歌发布Bard测试版本,2023年2月20日,复旦大学自然语言处理实验室发布MOSS产品,邀公众内测。
如今的科普场馆作为文化产业的重要一环,许多场馆都吸纳了科学中心的部分优秀属性,通过构建“以观众为中心,需求为导向”的数字化科普场馆,对智慧服务、智慧管理、智慧运营等场景进行赋能,进一步提升公众用户体验和管理效率。
在智慧服务方面,为公众提供票务、展项预约、虚拟展览、客服、在线科普(直播、短视频、科普游戏等)和智能导览等服务。例如,智能导览为观众提供场馆信息、展厅分布、展项热度、影片等信息,通过规划参观路线,提供室内精准定位,快速导航到场馆目的地。
在智慧管理方面,主要对科普场馆库房资产、藏品、数字资源、科研、办公等进行数字化赋能,为科普场馆运营管理人员提供数字化手段。例如,利用3D建模和大数据等技术对科普场馆展览、教育、藏品、科研等资源进行数字化转换,构建数字资源数据库,支撑开发新的VR和AR数字文创产品。
在智慧运营方面,主要提供日常运营服务的数字化能力,主要包括公众服务、场馆安防及场馆能效管理。例如,通过实时监测和分析公众参展时段人数、排队时长、高峰人数等数据,助力科普场馆陈列展览及安全防范等运营服务。
结合ChatGPT强大的计算能力和AI服务能力,ChatGPT可广泛应用在科普场馆教育、研究、展览、藏品、游客服务及日常工作等场景,以下是ChatGPT带来的一些主要应用机遇。
(一)协助研究
首先,ChatGPT可协助科普场馆研究人员快速检索和收集资料,通过不断追问可获得进一步信息。
其次,ChatGPT还具有多种目标语言翻译能力,能快速把研究内容翻译为多目标语言的文本,还可以对翻译内容进行语法检查。如把一段研究内容同时翻译为对应的英文和日文。
ChatGPT作为自然语言对话式问答系统,可帮助快速回答问题。例如,当研究人员需要获取问题答案时,输入“AI在科普场馆展览设计技术”,ChatGPT即可生成文本答案,帮助快速获取信息。ChatGPT还可以辅助校对文本内容,并进行适当润色。
此外,ChatGPT可快速进行研究课题的文献调研,提供参考文献的相关参考。但如要参考ChatGPT提供的文献综述或文献内容,在使用之前需要注意核对参考文献、文献内容及文献期刊是否真实,以保证引用文献或相关内容的真实性,否则ChatGPT可能生成错误的文献回答,对文献的综述不具有真实性。
因此,通过ChatGPT协助研究,需要特别注意输出文本内容的真实性、可用性、科学性、严谨性。
研究内容回答
(二)展览策展
在展览策展方面,传统的策展工作需要策展者大量阅读和处理各种文献资料,耗费大量时间和精力。ChatGPT可快速高效分析并提取与展览主题相关信息,自动生成策展回答,从而提升策展效率。
首先,ChatGPT可协助策展者进行展览资料检索和收集,快速列出策展资料查阅清单,如对清单条目追问,还可进一步获得具体信息。
其次,ChatGPT可为策展者提供展览比对、创意思路、主题构想、故事创作及展览建议等。ChatGPT给出的策展参考方案和展台设计内容,如上文描述,也可继续对方案和内容进行追问,以便获得进一步信息。
最后,在ChatGPT 给出参考方案和设计内容的基础上,策展者可以不断丰富和改善需求,通过不断向ChatGPT输入更精准的描述,让ChatGPT生成更符合策展者需要的策展内容。
虽然ChatGPT在分析和处理策展相关信息方面的自动化程度较高,可以显著提高策展效率,但策展需要考虑展览主题、文案、展品选择、展品设计、参观者需求等多方面因素。如涉及复杂展览主题和专业性强的内容,需要结合相关展览领域的专门知识和策划人员的经验来判断;再者受限于ChatGPT的审美,许多内容仍然需要额外的人工来处理。因此,需要根据科普场馆实际情况应用ChatGPT,同时结合策展者的专业知识和经验,制定更完整和创新的展览计划和内容,以便更好地为展览策展赋能。
科普场馆策展资料辅助查阅
科普场馆策展参考方案辅助
(三)展览讲解
首先,提供智能化讲解。结合不同的展览主题和内容,ChatGPT可为观众提供全方位在线展览讲解服务,通过与观众互动,回答观众所需要了解的展览主题、展品、展品特点、科学知识等内容,辅助观众进行科普知识检索,充分调动观众观展的参与性和积极性。ChatGPT可根据观众特点及提出的问题,自动生成展品介绍和解释,包括展品科学原理、历史背景、应用场景等讲解内容,为观众提供个性化及全面深入的讲解,帮助观众更好地理解和掌握展品及科学知识。对参观者在展览中提出的问题和反馈,ChatGPT通过机器学习进行分析和处理,可进一步挖掘观众需求,及时调整和改进讲解内容,不断提升讲解效果。
其次,提供多目标语言讲解。科普场馆观众可能来自不同国家,其语言各异,ChatGPT可提供多目标语言讲解,使讲解适应不同观众的语言背景,以满足不同语言观众的需求,进而提升讲解质量和效率。通过利用ChatGPT技术,观众可更详细地参观和了解科普场馆的展览和展品,同时也可以更深入地感受文化多样性带来的魅力。
值得注意的是,展览讲解需要考虑到观众的需求和反应,而观众的需求和反应非常复杂和多样化,因此ChatGPT在展览讲解中还需结合人工讲解的专业知识和经验,共同为展览讲解提供更好的服务。
(四)客服咨询
对科普场馆观众开展传统的咨询服务,通常需要较多人力和设备支持,对成本和人员要求较高,而使用ChatGPT能自动处理和回复各种问题,尤其对高频通用问题可提供快速回答,从而提升客服效率,优化用户体验。
通过建立科普场馆客服专门知识库来构建ChatGPT客服咨询系统,基于ChatGPT构建的客服咨询系统,具有多目标语言输出、多触点、自动化、自主学习的客服服务能力。
ChatGPT客服咨询系统支持网站、移动设备应用、微信公众号、小程序等多种触点,更重要的是,ChatGPT支持多目标语言输出,无论是在咨询、接待、观众自助查询等客服过程中,都能为观众提供多种目标语言服务。
例如,结合科普场馆的基础数据,ChatGPT可回答观众想要的场馆信息(场馆地址、开放时间、门票价格、购票方式、交通方式、停车场等)、展览信息(展览名称、主题、时间等)等信息。输入常见咨询问题,ChatGPT能够快速给出回答。与人工客服相比,ChatGPT的回复速度非常快,可较为准确地回复用户简单的咨询问题,缩短用户等待时间;但在处理复杂敏感问题时,会存在一些错误,尤其容易出现与事实不相符的情况,误导用户。
因此,实际工作中需要将ChatGPT技术和人工客服结合,一方面通过ChatGPT不断学习和优化知识库提升客服的服务效率和回答准确度,另一方面通过人工客服提供复杂场景的客服服务,从而为观众提供更全面、更细致、更快捷的客服服务。
场馆咨询回答
(五)其他方面
在推广宣传方面,根据科普场馆的特点及目标人群,为推广宣传提供针对性的辅助支持,包括给出背景调研、建议方案的输出,也可辅助提供宣传资料、创意文案、语言翻译等服务。在工作事务方面,ChatGPT能够辅助完成撰写邮件、报告、提案、检查错误等工作,还可以提出工作日程安排、执行计划等反馈,充分协助完成日常工作。在突发事件方面,ChatGPT可提供相关突发事件解决建议,辅助解决突发事件,例如:展览现场的设备损坏、人群拥挤、展品破损、消防隐患等,工作人员可立即通过ChatGPT获取解决方案的相关辅助,根据提示执行远程操作、监控调取、安全逃生、电话报警等行动。另外,ChatGPT可为科普场馆技术运营、运维等提供技术支撑辅助服务。
ChatGPT是大语言模型(Large Language Model, LLM)的一个应用场景,随着AI应用的爆发式涌现,基于LLM的智能体(AI Agent)将具有广泛前景,可普适行业与业务场景,只要能应用LLM的地方都可以构建相应的Agent来赋能。例如,具有代表性的AI Agent-AutoGPT,可作为一种强大工具解决通用问题,与ChatGPT不同的是,用户无须不断对ChatGPT提问以获得对应回答,只需为其提供一个AI名称、描述和目标,AutoGPT就可以按照设定的目标,自动完成绝大部分工作。因此,科普场馆可结合实际,构建科普场馆的AI Agent来赋能场馆应用。
在科普场馆数字化转型中,通过利用ChatGPT对科普场馆的科普研究、展览策展、客服咨询、场馆管理等赋能,在一定程度上可重塑科普场馆的管理、运营和服务,进而提升科普场馆管理运营水平和用户体验,但科普场馆在应用ChatGPT过程中,也面临以下主要应用挑战。
(一)内容科学性
ChatGPT的基础是一个生成式语言模型,它根据概率分布关系生成最符合要求的语境内容,但无法保证内容的真实性和准确性,另外模型还在不断地调整和优化,在使用过程中可能会碰到所生成内容或回答内容的不真实(信息可信度)或具有某方面的诱导或带有偏见或带有暴力倾向或具有仇视、歧视或具有煽动性等。