文章介绍了如何利用AI工具,特别是具有深度联网搜索能力的大模型,提高信息检索效率和准确性。包括指定网站检索、通配符使用、限定时间范围、布尔逻辑的使用,以及提问技巧等内容。
通过掌握一些提问技巧,如苏格拉底式提问法、沃伦·贝格尔提问技巧等,可以更有效地从AI工具中获取答案。
本文详细介绍了如何利用AI工具,特别是那些具有深度联网搜索能力的大模型,来提高信息检索的效率和准确性。
随着今年DeepSeek的爆火,结合去年至今KIMI、通义千问、豆包大模型的快速发展,在日常工作中,很多同学都养成了“遇事不决,AI来答”的良好习惯。使用AI工具进行问答,往往能帮助我们快速提效,补全知识信息短板。同时,我们对于"深度联网搜索"模式的依赖程度也在日益上升,甚至有时候能让我们忘记了搜索引擎的存在。比如通义与DPSK的网页版:
在使用这些功能时,AI往往会通过一个思考体,将用户问题进行改写或转换,然后分别进行搜索引擎的召回,最终再将收集到的Docs进行总结和输出。有一些互联网搜索如Google Search的常见技巧,对于AI也是可以理解的,在使用prompt进行问答时结合使用,可以让AI的回答更加遵循我们的想法。
site语法可以帮助我们在检索时,让大模型优先根据我们指定的网站来进行检索,比如我想要查找华为的最新产品,并且是来自于华为官网的信息,那么我可以直接指定:site:huawei.com/cn。这里以通义为例:
或者我想问今年最新的房贷政策,要求大模型的总结来源一定是某政府网站,我可以用.gov.cn来结尾,这里我以kimi为例:
当检索时,我们只掌握了部分信息,或者我们想控制我们检索出来的内容包含某些东西,我们可以使用以下通配符,这些同样适用于百度/谷歌的直接搜索:
通配符
|
是否还生效
|
用法
|
+
|
生效
|
在
两
个
关键词之间加上加号
表示 搜索时
两者缺一不可
|
-
|
已经不生效,包括在谷歌搜索尝试:
|
在关键词的前面使用减号,也就意味着在查询结果中不能出现该关键词。
|
?
|
生效
|
匹配符,匹配的字符数要受到限制
|
*
|
生效
|
匹配符,匹配的字符数不受到限制。适
合我知道部分信息,但不清楚具体信息时的检索
|
示例如下
:
-
例子:
我想知道国内这个城市,张家? 的介绍
-
返回示例
:
可以通过datarange: 或直接 .. 进行检索资料的时间限定,筛选特定时间段的文档。比如:我想要检索2023年到2025年间的浙江房价:
以下内容摘自苏江老师的《学会提问 -- AI大模型时代与ChatGPT对话的关键技能》。
比如:
-
天气如何?
-- 🙅
-
今天杭州天气如何?
-- 🙆
比如:
比如:
-
Instruction(指令)
:
明确告诉AI你期望执行的任务,比如“请解释加速度是什么”,应简洁明了。
-
Context(背景)
:
选填,提供上下文信息,帮助AI更好地理解问题,比如“在古代中国的文化背景下,请微我编写一首古风诗”。
-
Input Data(输入数据)
:
选填,提供具体数据让AI进行处理,比如“下面是一组股票价格数据,请帮我计算出它们的均价”。
-
Output Indicator(指示器)
:
指示AI输出结果的类型或格式,比如“请用一段通俗易懂的文字解释量子计算的原理”。
以上是基础的prompt框架,在处理更复杂的问题时,还需要掌握另一种更加高级的prompt框架 -- CRISPE框架。
-
CR(capacity and role,能力与角色)
:
需要明确告诉AI它在对话中扮演的角色以及应该具备的能力。
“你是...”
-
I(Insight,洞察力)
:
涉及背景信息和上下文,让AI了解用户的具体需求和相关的背景知识。
“最近...”
-
S(statement,指令)
:
告诉AI我们希望它做什么。
“请你为我...”
-
P(personality,个性)
:
希望AI回答时呈现的风格或方式。
“用...风格”
-
E(experiment,尝试)
:
可以要求AI为我们提供大于一种解决方案或答案,以便用户有更多的选择和参考。
“提供...份...”
举个例子:
参考资料:
[1]https://docs.feishu.cn/v/wiki/EWl7wxKSQiLtndk2rLNceIr1nQg/aa
[2]苏江:《学会提问 -- AI大模型时代与ChatGPT对话的关键技能》
[3]Wei, J., Wang, X., Schuurmans, D., Bosma, M., Ichter, B., Xia, F., Chi, E., Le, Q., & Zhou, D. (2022). Chain of Thought Prompting Elicits Reasoning in Large Language Models.
本方案是基于开放可控数据湖仓构建的大数据/搜索/AI一体化解决方案。通过元数据管理平台DLF管理结构化和半/非结构化数据,提供湖仓数据表和文件的安全访问及IO加速。支持多引擎对接和平权协同计算,通过DataWorks统一开发,并保障大规模任务调度。
点击阅读原文查看详情。