[CL] A Survey on Large Language Models with some Insights on their Capabilities and Limitations
网页链接
本文全面综述了大型语言模型(LLM),揭示了其涌现能力背后的机制,强调了规模法则和预训练数据的重要性,特别指出了代码数据在 CoT 能力中的关键作用,并通过实验验证了这一观点,同时也分析了 LLM 在多个领域的应用,并探讨了其局限性和未来发展方向。
网页链接
本文全面综述了大型语言模型(LLM),揭示了其涌现能力背后的机制,强调了规模法则和预训练数据的重要性,特别指出了代码数据在 CoT 能力中的关键作用,并通过实验验证了这一观点,同时也分析了 LLM 在多个领域的应用,并探讨了其局限性和未来发展方向。