专栏名称: IXDC
IxDC由广州美术学院设计学院、香港理工大学设计学院、网易、腾讯、华为、中国电信、中国移动、金山等单位联合发起。是全国第一个受政府认可和领导的交互设计专业委员会,致力于引领中国交互设计行业发展。
目录
相关文章推荐
ZOL中关村在线  ·  2024机圈热门技术总结:AI入端、纯血鸿蒙 ... ·  21 小时前  
EETOP  ·  中国考虑调查苹果税! ·  昨天  
EETOP  ·  国产GPU成功部署DeepSeek! ·  2 天前  
ZOL中关村在线  ·  尼康Z50II拍摄体验:拍照和视频功能均衡的 ... ·  3 天前  
51好读  ›  专栏  ›  IXDC

Apple Intelligence-苹果手机+AI,能有哪些体验创新

IXDC  · 公众号  ·  · 2025-01-04 08:30

正文

前言

苹果 WWDC 2024 发布的 Apple Intelligence,是一款强大的 AI 系统,广泛应用于 iOS、macOS 和 iPadOS,包括强大的 个性化写作、图像生成、全新的 Siri、集成 Chatgpt 等各项功能,可以了解用户的各种日常习惯、社交关系和日常通讯等内容,通过一个流畅的 AI 操作系统来响应用户各种场景下的使用诉求。


Apple Intelligence 有哪些体验?

一、 AI 与操作系统融合

现有的 AI 大模型专注于一个领域下的智能生成,如 Chat GPT 的文本处理能力、 Midjourney 文生图能力,都是根据用户的指令去完成单独的命令,而 Apple Intelligence 将 LLM 大模型的能力与用户的操作系统深度结合,从内容智能到行为智能,强调了人工智能在手机上的行动生成和整合能力,通过对手机里的各个 App 进行 全面的跟踪和分析,完成用户的操作指令。





二、多模态交互能力

2.1 文本处理

Apple Intelligence 为用户开启了提升写作能力和更高效沟通的新方式。借助 iOS 18、iPadOS 18 和 macOS 的全新全系统写作工具, 写作工具几乎可在任何书写位置使用,包括邮件、备忘录、 Pages、 Safari 浏览器 和第三方应用


👋 交互方式:键盘输入

一款AI键盘

文字润色、语气改写


除此之外,它还有亮眼的文字总结功能, 收件箱顶部的新部分会显示最紧急的电子邮件,例如当天的晚餐邀请或登机牌。在收件箱中,可以 长邮件内容总结成摘要, 用户无需打开邮件,只需轻点一下即可查看相关详细信息。 智能回复 功能也会提供快速回复建议,并会识别电子邮件中的问题以确保所有问题都得到解答。 对语言的深入理解也延伸到了通知上,桌面摘要可帮助用户在锁定屏幕上扫描通知的详细信息,并 自动识别通知的重要等级并重新排序,减少不必要的干扰。


👋 交互方式:自然语言交互

邮件摘要概览

网页摘要

桌面消息摘要:自动识别重要等级并排序

桌面消息摘要:重要消息优先推送


2.2 语音处理

新版 Siri 采用了全新的设计,当 Siri 处于活动状态时,优雅的发光灯会环绕屏幕边缘。 Siri 新增了连续对话功能,能够更自然地理解上下文内容,同时支持跨软件操作。 此外,用户可以输入文字给 Siri,并在文本和语音之间切换,以任何当时感觉合适的方式与 Siri 交流。



👋 交互方式:语音输入、自然对话

1、唤醒

Siri 全新形态:唤醒状态下,屏幕四周环绕动态光效

2、输入

自由切换语音/文本输入,双击底部 bar 唤起键盘

3、反馈

自然语言直接转指令



2.3 图像处理:文生图、图生图、故事编排


a、图像生成

利用苹果自带的 Image Playground 应用软件可以制作原创图像, 支持文生图功能, 可以通过文字描述、推荐概念特征、照片库里的人物来制作, 借助 Image Playground,用户可以在几秒钟内创建有趣的图像,从三种风格中进行选择:动画、插图或素描。Image Playground 提供了非常流畅的操作手势,通过简单的点选来进行参数的调控,还可以圈选手绘插图进行一键风格化绘制,它还提供专用应用程序,非常适合尝试不同的概念和风格。所有图像均在设备上创建,让用户可以自由地尝试任意数量的图像。


👋 交互方式:手势交互

点选:易上手的操作方式


圈选:有趣自然的交互手势


b、图像处理

以下是小编们体验的真机测评

一键涂抹消除

图片主体识别

Image Playground 图片生成


除此之外,甚至可以在相册中编辑创作影片, 感兴趣可以看一下链接中博主的体验测评

(https://www.bilibili.com/video/BV1KNYfenENL/?spm_id_from=333.337.search-card.all.click&vd_source=1e2b4a1a24958fcc40f6a7007d3cb89b)


c、视觉搜索

苹果发布的视觉智能(Visual Intelligence)功能,这个功能 对标Google Lens,视觉智能本质上是人工智能视觉,其中语言模型可以分析和理解图像。这一点 Claude、Gemini 和 ChatGPT 也能很好地做到。但苹果通过深度整合到手机系统中,提供了新的硬件交互方式,用户可通过 新设的相机控制按钮(Capture Button)点击访问其视觉搜索功能 ,方法更加用户友好。


👋 交互方式:物理按键+拍照/图片输入


应用场景:

应用场景 1:物品识别,无需拍照,对准可识别

应用场景 2: 识别 餐厅门头,直接看到评价、推荐菜







请到「今天看啥」查看全文