专栏名称: 云中江树
云中江树的 AI 内容分享
目录
相关文章推荐
51好读  ›  专栏  ›  云中江树

深夜刷到OpenAI o1的演讲视频,我靠百度网盘...

云中江树  · 公众号  ·  · 2024-11-06 09:00

正文

作为经常关注AI圈动向的一员,同时又管理8个LangGPT社群,我的日常往往是这样的:

早上打开手机,社群里已经99+未读。

"兄弟们,Claude 3.5 New来了!"

"GPT的技术细节太强了!"

"谁看了昨晚Anthropic的发布会?"

"我刚研究完Mistral的新论文,这架构设计绝了..."

看着群里的讨论,有小伙伴激动,而大部分朋友都陷入了沉思:这些新模型和论文像潮水一样涌来,而我们,虽然很关注AI圈的动向,但除了每天被各种新闻轰炸,就是在第一时间装懂和真懂之间反复横跳。。

更要命的是,国际AI会议一场接一场,从ICLR到NeurIPS,从谷歌I/O到OpenAI DevDay。

时差?不存在的。语言障碍?请自行解决。

作为一名尽职的AI圈活跃的博主,我得时刻紧跟前沿,可惜我的英语水平还停留在"Hello World"的阶段...

当我为此苦恼的时候,我的朋友阿炳找上门来...

阿炳是群里相对活跃的一个人,一直在研究金融领域和AI的结合。

他跟我说,最近 百度网盘新出了个一个新功能——简单听记!或许能帮到你

哦?什么东西。只见阿炳快速给我截图看。

简单听记

“这个「简单听记」,就是为了帮助用户快速整理会议纪要。

它能够 将录音文件自动转化为文字,并支持用户根据需要进行编辑和调整,最终生成格式规范的调研报告。

包括电话录音啊,访谈记录啊都能直接塞进去一键导出。

哥,你不用烦恼了!”

哦?有意思,你再说说看,这玩意儿好用么,

只见阿炳,直接把他持仓的苹果线上会议的英文录音直接上传至百度网盘,然后启动了简单听记功能,等了几分钟,就直接把一个小时的音频内容生成了一份摘要。

苹果会议纪要

不仅区分人声、生成逐字稿、标记时间段,这都是AI听记的base功能,更有多种模板供你挑选,会议类,红头文件,公司调研,应有尽有...

模板挑选

有了这种好武器,赶紧拿来试试手,那天OpenAI直接发了“o1”模型,像人类一样慢思考,直接轰动整个AI圈。。

之后官方在YouTube上发布了“Building OpenAI o1”视频,朋友直接给我发了百度网盘的视频过来,打开一看有点懵逼。。

OpenAI o1

刚开始,就看到OpenAI的团队开始高速输出:"early on at open AI we were very inspired by the alpha go results and the..." "plentiful it's like imagine like having a the center for launching a rocket to..."

我的大脑开始疯狂运转:等等,他刚才说的alpha go results是什么意思?怎么又启动火箭了?不说没有中文字幕,连英文都没有,这是来考验我,等我出糗呢?

现在正好可以拿百度网盘的「简单听记」来实现了,按照刚才阿炳的操作,直接音频上传上去。

这里支持本地上传,也支持网盘现有音频文件一键导入,之后就打开了「简单听记」的功能。

简单听记

之后我们根据自己实际情况来选择音频语言和场景,稍等几分钟,就把20多分钟的讨论生成了逐字稿...

关于o1特点和其推理能力介绍

而且还可以根据每一个模块,每一段内容,都能自动识别并且完成 摘要整理

摘要

还可以把它转换成 “红头文件”

公文格式

还可以直接打印版的 “表格纪要” 格式,一键汇报,再也不用担心排版问题..

表格排版

为了验证准确性,我特意对照了英文原视频。除了极少数口音比较重的地方,识别率基本在95%以上。就算有个别词没听对,上下文语义也帮它自动修正了。

AI不仅在改变着我们的工作方式,甚至连学习和信息获取的方式都在悄然发生改变。

原来那些看起来游刃有余的大佬们,也是借助了AI的力量才能始终站在技术前沿。

比如,我朋友圈点赞之交的好友、经济学家格隆也用百度网盘简单听记功能总结过Meta的季度财报电话会议纪要。

格隆推荐

而现在,这个"秘密武器"也终于出现在了我的工具箱中。







请到「今天看啥」查看全文