【一个关于长上下文大语言模型(LLM)的综述性研究,涵盖了架构、框架、训练和评估四个方面的内容。亮点:1. 从架构、基础设施、训练和评测四大维度全面剖析;2. 涵盖从百万token到多模态长文的前沿研究;3. 总结10个未解难题,引领未来研究方向】
'Thus-Spake-Long-Context-LLM: a survey of long-context LLMs from four perspectives: architecture, infrastructure, training, and evaluation'
GitHub: github.com/OpenMOSS/Thus-Spake-Long-Context-LLM
#长上下文LLM# #自然语言处理# #技术综述# #AI创造营#
'Thus-Spake-Long-Context-LLM: a survey of long-context LLMs from four perspectives: architecture, infrastructure, training, and evaluation'
GitHub: github.com/OpenMOSS/Thus-Spake-Long-Context-LLM
#长上下文LLM# #自然语言处理# #技术综述# #AI创造营#