专栏名称: 自然科学博物馆研究

《自然科学博物馆研究》是由中国科学技术协会主管，中国自然科学博物馆协会、科学普及出版社与中国科学技术馆联合主办的学术期刊，旨在促进自然科学博物馆行业的学术交流。

探究｜ChatGPT对科普场馆数字化转型的应用机遇和挑战

自然科学博物馆研究 · 公众号 · · 2024-06-13 16:29

正文

作者：刘发军黄凯

（上海科技馆）

【摘要】 本研究聚焦于ChatGPT，加强科普场馆在数字化建设中对ChatGPT的整体认知，期待通过对此类新型人工智能技术的应用，为科普场馆开展数字化转型服务提供参考与借鉴。通过分析ChatGPT 的发展历程、技术特征、技术应用及应用方式，在ChatGPT系统实践的基础上，总结ChatGPT为科普场馆数字化转型带来的机遇，包括在科普场馆协助研究、数字展览、智能客服等方面的效率提升和赋能，同时探讨了ChatGPT带来的风险挑战，包括内容科学性、信息安全性、使用目的性、依赖性以及法律法规问题，并针对性地给出了相应对策。

【关键词】 科普场馆；ChatGPT；人工智能；数字化转型

一、引言

2020年文化和旅游部印发《关于推动数字文化产业高质量发展的意见》和2021年国务院印发《“十四五”旅游业发展规划的通知》中提出要强化自主创新，加快推进以数字化、智能化为特征的智慧文旅。2023年国务院印发《数字中国建设整体布局规划》中提出，要推进文化数字化发展，深入实施国家文化数字化战略，提升数字文化服务能力。

科普场馆作为重要的文旅场所，在普及科学知识和科技成果方面一直扮演着重要角色。科普场馆数字化转型，一般指通过利用一种或多种新兴数字化技术（例如：AI、大数据等，本文指AI技术ChatGPT），促进其重塑管理、运营和服务，进而提升核心竞争力。随着数字化技术快速发展，近年来，科普场馆在数字化转型的潮流中不断探索新的技术方式，通过扩大AI等新技术应用场景，迭代打造数字化科普场馆，以更好地满足观众需求和期望，赋能科普场馆发展。

2022年11月30日，美国人工智能研究实验室OpenAI发布了ChatGPT，ChatGPT一经问世便引发了科技界的巨大关注，在社会层面形成广泛热议，在短短两个月时间里全球活跃用户突破1亿，成为史上增长最快的消费者应用。ChatGPT可在通用与垂直场景下进行多点应用，比如：文本生成、问题求解、机器翻译、知识搜索及聊天等，ChatGPT有望革新、重塑各行各业的内容生成与交互方式。当出现新技术变革时，科普场馆如何结合实际抓住ChatGPT带来的机遇并应对挑战，对科普场馆数字化转型具有重要意义。因此有必要对ChatGPT的发展历程、技术特征、技术应用等总结分析，并在此基础上展望ChatGPT对科普场馆数字化转型的应用机遇和挑战，为科普场馆数字化转型提供参考与借鉴。

二、ChatGPT概况

（一） ChatGPT 简述

人工智能生成内容（Artificial Intelligence Generated Content，AIGC），是继专业生产内容（Professionally-generated Content，PGC）、用户生产内容（User-generated Content，UGC）之后的新型内容生成方式，典型应用方式包括AI写作、AI问答、AI编程、AI绘画、AI视频生成和AI语音合成等，ChatGPT是AIGC的一款具体应用产品。

ChatGPT是一种基于深度学习技术的自然语言处理（Natural Language Processing，NLP）AI大模型，通过大算力、大规模训练数据来处理文本数据，输出符合语境要求的应答内容。ChatGPT全称为“Chat Generative Pre-trained Transformer”，Chat是“聊天”的英语词汇，GPT是“生成型预训练变换模型”的英语词组缩写，ChatGPT可翻译为“聊天生成预训练转换器”或简称“优化对话的语言模型”。ChatGPT基于GPT-3.5，使用人类反馈强化学习技术（Reinforcement Learning from Human Feedback, RLHF），将人类偏好作为奖励信号并微调模型，实现有逻辑的对话能力。

（二） ChatGPT 模型演进

截至2023年8月，GPT系列模型发展经历了以下五个阶段，其技术主要演变如下：

GPT-1：发布于2018年6月，特征为无监督预训练和有监督微调，参数量达1.17亿，预训练数据量约5GB ^[8] ，包含预训练和微调两个阶段，GPT-1先在大量的无标签数据上训练语言模型，然后在下游具体的有标签数据集上进行微调。

GPT-2：发布于2019年2月，特征为无监督预训练和多任务学习，参数量达15亿，预训练数据量约40GB ^[9] ，使用相同的无监督模型学习多个任务，期望对不同任务的相同输入产生不同的输出。

GPT-3：发布于2020年5月，特征为无监督预训练和海量参数，参数量达1750亿，预训练数据量约45TB ^[10] ，采用海量参数来进行训练和学习，GPT-3不追求GPT-2中的零次学习设定，而是通过少量样例理解并执行任务，聚焦模型的上下文学习能力。

GPT-3.5：特征为引入RLHF。通过引入人类反馈强化学习，使用人工对模型回复进行打分排名，使模型更好地理解并完成指令。

GPT-4：发布于2023年3月，特征为大规模多模态模型，可以接受图像和文本输入并产生文本输出。模型经过不断优化和调整，提高了输出内容的真实性和对期望行为的遵守程度。

（三） ChatGPT 技术特征

ChatGPT作为一种大型自然语言处理模型，具有以下主要技术特点。

Transformer架构：ChatGPT是一种基于Transformer架构的自然语言处理模型，采用了Transformer架构中的编码器、解码器结构，用于处理输入和生成输出，是一种广泛用于自然语言处理任务的架构。

大规模多模态：前几个GPT模型以语言模型为任务核心，目前已发展到GPT-4，GPT-4可接受图像和文本输入并产生文本输出，是一个大规模的多模态模型。GPT-4虽然在许多现实世界场景中不如人类，但在各种专业和学术基准上表现出人类水平的表现，包括以大约前10%的分数通过模拟律师考试。GPT-4经过预训练可以预测文档中的下一个令牌（一种用于验证身份和授权访问的凭证），训练后的调整过程提高了输出的真实性以及对期望行为的遵守程度。

海量数据训练：GPT系列模型基于海量训练参数，参数量从亿级跃升至千亿级，而GPT-3.5和GPT-4训练参数目前还尚未公开。

数据标注：GPT前三个阶段模型不需要依赖人工标注数据进行训练，而是通过大规模的无监督学习方式，但ChatGPT在GPT-3.5基础上，开始依托大量人工标注数据，通过专业标注人员为ChatGPT提供人类指令的高质量答案，从而优化GPT-3.5无法理解人类指令含义及无法判断输入等情况。

强化学习：强化学习即通过奖惩分明的系统打分，使用RLHF，来更新参数以产生越来越高质量的回答。在与ChatGPT的互动过程中，人们发现它会承认错误、修复自己的答案，这是源于它从训练中获取的强化学习并重新思考的能力。

（四） ChatGPT 技术应用

目前，ChatGPT通过订阅方式服务B端和C端用户。对C端用户，OpenAI发布了ChatGPT Plus订阅服务，每月收费20美元，对比免费版本，即便在高峰时段用户也能正常访问ChatGPT，用户响应时间会更快，同时也可以优先使用新功能。对B端用户，OpenAI通过发布ChatGPT API服务B端用户，用户可把ChatGPT集成到产品中，具有8K(1K=1024B)上下文窗口（约13页文本），每1K提示令牌将花费0.03美元，每1K完成令牌将花费0.06美元；具有32K上下文窗口（约52页文本），每1K提示令牌将花费0.06美元，每1K完成令牌将花费0.12美元。

通过不断降低用户使用成本，ChatGPT将有望加快商业化落地，主要包括但不限于以下方面的应用：

自动问答：用于构建自动问答系统，例如在线客服等。通过训练模型，根据问题自动输出回答，帮助用户快速解决问题。

文本生成：用于生成文章、摘要、翻译等文本，通过训练模型学习文本的语法和语义规则，生成高质量的文本。

辅助编程：用于辅助编程，修改软件Bug，辅助程序员写代码，检查代码，以及优化代码等，让编程更有效率。

机器翻译：用于机器翻译，通过输入源语言文本，翻译单词、短语和段落，并进行语法检查等，同时也可以输出多目标语言的翻译结果。

（五）同类产品发展情况

随着ChatGPT风靡全球，国内外头部科技公司竞争愈加白热化，国内自研的AI大模型也呈蓬勃发展态势，例如：阿里巴巴2021年11月发布的M6模型，模型参数10万亿；华为2021年4月发布的盘古NLP大模型，模型参数2000亿（见表1）。

百度和谷歌等相继推出ChatGPT的对标产品。2023年3月16日，百度发布“文心一言”试用版，开启邀请测试；2023年3月22日，谷歌发布Bard测试版本，2023年2月20日，复旦大学自然语言处理实验室发布MOSS产品，邀公众内测。

三、ChatGPT应用机遇

如今的科普场馆作为文化产业的重要一环，许多场馆都吸纳了科学中心的部分优秀属性，通过构建“以观众为中心，需求为导向”的数字化科普场馆，对智慧服务、智慧管理、智慧运营等场景进行赋能，进一步提升公众用户体验和管理效率。

在智慧服务方面，为公众提供票务、展项预约、虚拟展览、客服、在线科普（直播、短视频、科普游戏等）和智能导览等服务。例如，智能导览为观众提供场馆信息、展厅分布、展项热度、影片等信息，通过规划参观路线，提供室内精准定位，快速导航到场馆目的地。

在智慧管理方面，主要对科普场馆库房资产、藏品、数字资源、科研、办公等进行数字化赋能，为科普场馆运营管理人员提供数字化手段。例如，利用3D建模和大数据等技术对科普场馆展览、教育、藏品、科研等资源进行数字化转换，构建数字资源数据库，支撑开发新的VR和AR数字文创产品。

在智慧运营方面，主要提供日常运营服务的数字化能力，主要包括公众服务、场馆安防及场馆能效管理。例如，通过实时监测和分析公众参展时段人数、排队时长、高峰人数等数据，助力科普场馆陈列展览及安全防范等运营服务。

结合ChatGPT强大的计算能力和AI服务能力，ChatGPT可广泛应用在科普场馆教育、研究、展览、藏品、游客服务及日常工作等场景，以下是ChatGPT带来的一些主要应用机遇。

（一）协助研究

首先，ChatGPT可协助科普场馆研究人员快速检索和收集资料，通过不断追问可获得进一步信息。

其次，ChatGPT还具有多种目标语言翻译能力，能快速把研究内容翻译为多目标语言的文本，还可以对翻译内容进行语法检查。如把一段研究内容同时翻译为对应的英文和日文。

ChatGPT作为自然语言对话式问答系统，可帮助快速回答问题。例如，当研究人员需要获取问题答案时，输入“AI在科普场馆展览设计技术”，ChatGPT即可生成文本答案，帮助快速获取信息。ChatGPT还可以辅助校对文本内容，并进行适当润色。

此外，ChatGPT可快速进行研究课题的文献调研，提供参考文献的相关参考。但如要参考ChatGPT提供的文献综述或文献内容，在使用之前需要注意核对参考文献、文献内容及文献期刊是否真实，以保证引用文献或相关内容的真实性，否则ChatGPT可能生成错误的文献回答，对文献的综述不具有真实性。

因此，通过ChatGPT协助研究，需要特别注意输出文本内容的真实性、可用性、科学性、严谨性。

研究内容回答

（二）展览策展

在展览策展方面，传统的策展工作需要策展者大量阅读和处理各种文献资料，耗费大量时间和精力。ChatGPT可快速高效分析并提取与展览主题相关信息，自动生成策展回答，从而提升策展效率。

首先，ChatGPT可协助策展者进行展览资料检索和收集，快速列出策展资料查阅清单，如对清单条目追问，还可进一步获得具体信息。

其次，ChatGPT可为策展者提供展览比对、创意思路、主题构想、故事创作及展览建议等。ChatGPT给出的策展参考方案和展台设计内容，如上文描述，也可继续对方案和内容进行追问，以便获得进一步信息。

最后，在ChatGPT 给出参考方案和设计内容的基础上，策展者可以不断丰富和改善需求，通过不断向ChatGPT输入更精准的描述，让ChatGPT生成更符合策展者需要的策展内容。

虽然ChatGPT在分析和处理策展相关信息方面的自动化程度较高，可以显著提高策展效率，但策展需要考虑展览主题、文案、展品选择、展品设计、参观者需求等多方面因素。如涉及复杂展览主题和专业性强的内容，需要结合相关展览领域的专门知识和策划人员的经验来判断；再者受限于ChatGPT的审美，许多内容仍然需要额外的人工来处理。因此，需要根据科普场馆实际情况应用ChatGPT，同时结合策展者的专业知识和经验，制定更完整和创新的展览计划和内容，以便更好地为展览策展赋能。

科普场馆策展资料辅助查阅

科普场馆策展参考方案辅助

（三）展览讲解

首先，提供智能化讲解。结合不同的展览主题和内容，ChatGPT可为观众提供全方位在线展览讲解服务，通过与观众互动，回答观众所需要了解的展览主题、展品、展品特点、科学知识等内容，辅助观众进行科普知识检索，充分调动观众观展的参与性和积极性。ChatGPT可根据观众特点及提出的问题，自动生成展品介绍和解释，包括展品科学原理、历史背景、应用场景等讲解内容，为观众提供个性化及全面深入的讲解，帮助观众更好地理解和掌握展品及科学知识。对参观者在展览中提出的问题和反馈，ChatGPT通过机器学习进行分析和处理，可进一步挖掘观众需求，及时调整和改进讲解内容，不断提升讲解效果。

其次，提供多目标语言讲解。科普场馆观众可能来自不同国家，其语言各异，ChatGPT可提供多目标语言讲解，使讲解适应不同观众的语言背景，以满足不同语言观众的需求，进而提升讲解质量和效率。通过利用ChatGPT技术，观众可更详细地参观和了解科普场馆的展览和展品，同时也可以更深入地感受文化多样性带来的魅力。

值得注意的是，展览讲解需要考虑到观众的需求和反应，而观众的需求和反应非常复杂和多样化，因此ChatGPT在展览讲解中还需结合人工讲解的专业知识和经验，共同为展览讲解提供更好的服务。

（四）客服咨询

对科普场馆观众开展传统的咨询服务，通常需要较多人力和设备支持，对成本和人员要求较高，而使用ChatGPT能自动处理和回复各种问题，尤其对高频通用问题可提供快速回答，从而提升客服效率，优化用户体验。

通过建立科普场馆客服专门知识库来构建ChatGPT客服咨询系统，基于ChatGPT构建的客服咨询系统，具有多目标语言输出、多触点、自动化、自主学习的客服服务能力。

ChatGPT客服咨询系统支持网站、移动设备应用、微信公众号、小程序等多种触点，更重要的是，ChatGPT支持多目标语言输出，无论是在咨询、接待、观众自助查询等客服过程中，都能为观众提供多种目标语言服务。

例如，结合科普场馆的基础数据，ChatGPT可回答观众想要的场馆信息（场馆地址、开放时间、门票价格、购票方式、交通方式、停车场等）、展览信息（展览名称、主题、时间等）等信息。输入常见咨询问题，ChatGPT能够快速给出回答。与人工客服相比，ChatGPT的回复速度非常快，可较为准确地回复用户简单的咨询问题，缩短用户等待时间；但在处理复杂敏感问题时，会存在一些错误，尤其容易出现与事实不相符的情况，误导用户。

因此，实际工作中需要将ChatGPT技术和人工客服结合，一方面通过ChatGPT不断学习和优化知识库提升客服的服务效率和回答准确度，另一方面通过人工客服提供复杂场景的客服服务，从而为观众提供更全面、更细致、更快捷的客服服务。

场馆咨询回答

（五）其他方面

在推广宣传方面，根据科普场馆的特点及目标人群，为推广宣传提供针对性的辅助支持，包括给出背景调研、建议方案的输出，也可辅助提供宣传资料、创意文案、语言翻译等服务。在工作事务方面，ChatGPT能够辅助完成撰写邮件、报告、提案、检查错误等工作，还可以提出工作日程安排、执行计划等反馈，充分协助完成日常工作。在突发事件方面，ChatGPT可提供相关突发事件解决建议，辅助解决突发事件，例如：展览现场的设备损坏、人群拥挤、展品破损、消防隐患等，工作人员可立即通过ChatGPT获取解决方案的相关辅助，根据提示执行远程操作、监控调取、安全逃生、电话报警等行动。另外，ChatGPT可为科普场馆技术运营、运维等提供技术支撑辅助服务。

ChatGPT是大语言模型（Large Language Model, LLM）的一个应用场景，随着AI应用的爆发式涌现，基于LLM的智能体（AI Agent）将具有广泛前景，可普适行业与业务场景，只要能应用LLM的地方都可以构建相应的Agent来赋能。例如，具有代表性的AI Agent-AutoGPT，可作为一种强大工具解决通用问题，与ChatGPT不同的是，用户无须不断对ChatGPT提问以获得对应回答，只需为其提供一个AI名称、描述和目标，AutoGPT就可以按照设定的目标，自动完成绝大部分工作。因此，科普场馆可结合实际，构建科普场馆的AI Agent来赋能场馆应用。

四、ChatGPT应用挑战

在科普场馆数字化转型中，通过利用ChatGPT对科普场馆的科普研究、展览策展、客服咨询、场馆管理等赋能，在一定程度上可重塑科普场馆的管理、运营和服务，进而提升科普场馆管理运营水平和用户体验，但科普场馆在应用ChatGPT过程中，也面临以下主要应用挑战。

（一）内容科学性

ChatGPT的基础是一个生成式语言模型，它根据概率分布关系生成最符合要求的语境内容，但无法保证内容的真实性和准确性，另外模型还在不断地调整和优化，在使用过程中可能会碰到所生成内容或回答内容的不真实（信息可信度）或具有某方面的诱导或带有偏见或带有暴力倾向或具有仇视、歧视或具有煽动性等。

探究｜ChatGPT对科普场馆数字化转型的应用机遇和挑战

正文

请到「今天看啥」查看全文