23年9月Stevens理工学院商学院的论文“tradingGPT: multi-agent system with layered memory and distinct characters for enhanced financial trading performance ”。
大语言模型(LLM)GPT系列的最新发展中在各个领域都表现出了非凡的能力,例如帮助医疗诊断和管理分析业务报告。GPT的功效在于其解码人类指令的能力,这是通过在其记忆系统中全面处理历史输入来实现的。然而,GPT的记忆处理并不能准确地模仿人类记忆的层次性,人类记忆分为长期、中期和短期三层。这可能会导致LLM难以有效地确定瞬时和关键任务的优先级。为了弥补这一差距,引入一种具有分层记忆的创新LLM多智体框架。该框架非常适合股票和基金交易,在这些交易中,从分级财务数据中提取高度相关的见解对交易决策中提供信息至关重要。
在这个框架内,一个智体将记忆组织成三个不同层,每个层都由自定义的衰退机制控制,与人类的认知过程更紧密地联系在一起。智体还可以参与智体之间的沟通和辩论。在金融交易环境中,LLM是交易智体的决策核心,利用其分层记忆系统集成多源历史行为和市场见解。这使他们能够驾驭财务变化,制定战略,并与同行就投资决策进行辩论。另一个突出特点是使智体具有个性化的交易特征,这丰富了他们突出的基础记忆多样性,并提高了决策的稳健性。通过利用智体的分层记忆处理和一致的信息交换,整个交易系统展示了对历史交易和实时市场线索的增强适应性。这种协同方法保证了卓越的自动化交易,并提高了执行准确性。
针对TradingGPT的开发,本文系统地整合了2020年8月15日到2023年8月30日的大量多模态财务数据。这些数据集来源于金融数据库和API,例如Databento股价数据库、Alpaca News API、ARK公开的每日持股历史记录等。这些数据有两个目的:(a)为智体建立多层记忆,(b)使用ARK基金的历史交易记录对智体进行训练、指导和回溯测试,完善他们的交易决策和行动。在研究中,使用开源向量数据库FAISS[6],因为它能够将数据存储为高维向量,从而实现基于精确匹配的语义搜索。两个主要原因影响这个决定:(a)大部分数据,包括ARK Invest视频的音频转录(通过Whisper API翻译成文本),得益于FAISS独特的快速查询数据的底层结构。(b) FAISS的兼容性结合了OpenAI和特定股票代码(余弦)相似度的高效计算。然后,在系统的基本逻辑和LLM智体处理的指导下,这些原始数据模式,被引导到智体的认知模式中。一个全面的模式结构如图所示:
在交易范式中,宏观层面的市场指标被存储在长期记忆中,季度投资策略被分配到中期记忆中,每日投资信息被引导到短期记忆中。
这三个内存类构成图中数据仓库的智体认知模式中初始结构。
在交易系统中,智体根据两个不同工作流的结果做出明智的交易决策:
单智体工作流和多智体工作流,如图左侧所示。
在单智体工作流程中,当呈现特定的股票行情时,智体的LLM核心会根据从其分层记忆中检索到的重要事件生成评估和反思,其中包括交易建议及其背后的原因。
随后,智体可以根据这些生成的见解继续执行交易动作。
增强系统能力的关键功能是(a)即时反思:
该机制每天进行,允许智体整合每个记忆层的顶级事件和市场事实,如每日股价和ARK基金交易记录。
使用LLM和特定提示,智体生成五个交易建议:
“大幅增加”、“小幅增加”,“持有”、“略微减少”和“大幅减少”及其理由。
每个选项都与预先确定的交易价值相关联。
可以根据智体所代表的业务规模进行调整。
此外,这个反思捕获智体的交易量和回报。
(b) 扩展反思:
这提供了在指定时间段(如一周)内更广泛的绩效概述。
它包括股票价格、智体的交易趋势和自我评价。
即时反思直接指导交易执行,而扩展反思则作为回忆最近投资交易的补充参考。
这两种类型的反思都存储在智体认知模式的反思索引中,通过特定的标志进行区分。
对于出现在多个智体交易组合中的股票,TradingGPT通过辩论机制实现了智体之间的对话。
这一机制鼓励通常专门从事不同行业的智体之间合作,目的是优化交易结果。