专栏名称: 腾讯ISUX
腾讯社交用户体验设计,简称ISUX (Internet Social User Experience),是腾讯核心设计团队, 负责腾讯社交网络相关产品的用户体验设计与研究。
目录
相关文章推荐
Linux就该这么学  ·  熬夜修网成常态?开源网络运维助手来拯救你 ·  2 天前  
普象工业设计小站  ·  一天被问三次!这瓶花香调好闻到爆! ·  3 天前  
普象工业设计小站  ·  央视点名!上海老人花2万买保健床垫称包治百病 ... ·  3 天前  
普象工业设计小站  ·  好风雅!唐风宋韵,尽在杯中 ·  4 天前  
51好读  ›  专栏  ›  腾讯ISUX

ISUX「四月、五月」行业设计趋势速递

腾讯ISUX  · 公众号  ·  · 2024-05-30 17:01

正文

【1】OpenAI 发布了 ChatGPT-4o

【2】Google 发布「AI 全家桶」

【3】 AirChat - 一个新兴的社交媒体平台

【4】 Amazon Music 和 Spotify均推出自家Playlist

【5】Meta正在为旗下的软件布局相关Ai能力

【6】TikTok在加拿大和澳大利亚地区上线TikTok Notes

【7】Screenity :免费且注重隐私的屏幕录制工具

【8】Bepper:可以聚合各类IM免费聊天工具

【9】人工智能修图软件Remini突然火爆

【10】Airbnb升级体验:通过一系列重点功能提升用户的使用体验。

【11】网红“鼻祖”Instagram重塑品牌形象



1、Open AI发布了Chat GPT-4o

在美西时间上午10点,OpenAI举办了一场盛大的春季新品发布会,向世人展示了最新的技术成果和产品更新。会上,OpenAI首席技术官米拉·穆拉提(Mira Murati)亲自登台,向观众介绍了这次更新的重点和亮点。

- 全面升级:ChatGPT-4o

这次发布会最重要的焦点是全新的旗舰模型—ChatGPT-4o。GPT-4o作为GPT-4的升级版本,不仅在文本处理方面有了重大突破,更是首次引入了多模态处理能力。这意味着它能够同时处理文本、图像和语音等多种输入类型,并产生相应的多模态输出。

GPT-4o的“Omnimodal”设计理念使得它能够与用户进行更加多样化的交互,能够准确捕捉到用户的情绪变化和语气。通过在直播中展示GPT-4o的功能,OpenAI的员工向观众生动地展示了这一技术成果。

-实时语音交互:

ChatGPT-4o能够在232毫秒内响应音频输入,平均响应时间为320毫秒,与人类在对话中的响应时间相近。并且即使是面对回答被突然中断、多人同时谈话等复杂的情况,GPT-4o 也能完美理解。

-情感识别与交互:

ChatGPT-4o感知用户情绪的能力使得它能够与用户进行更加智能和情感化的交互。通过陈信翰示范的场景,ChatGPT-4o不仅侦测到了他的急促呼吸,还幽默地给出了呼吸放慢速度的建议。此外,还能以不同的声音朗读故事,包括超级戏剧化的朗诵、机器人音调和唱歌等。

-实时视觉功能:

ChatGPT-4o通过手机摄像头实时解决数学问题,并仿佛一位真实的数学老师在旁边指导每一个解题步骤。同时,它还能通过观察用户的面部表情来分析用户的情绪,从而更好地与用户进行交流。

-更快响应,更多应用场景:

GPT-4o的新模型设计实现了所有输入和输出的处理都由同一个神经网络完成,大大提高了响应速度。不仅如此,GPT-4o在文本、推理和编码智能方面达到了GPT-4 Turbo的级别,在图像处理功能上更是令人惊喜。不但能识别/分析图像内容,还能充当“设计师”完成一些高阶的图像编辑合成任务。

根据指令对文本进行排版

根据图像合成海报

-新桌面应用和易用性提升:

OpenAI还宣布推出了桌面端ChatGPT应用,使得用户能够在自己的电脑上直接使用ChatGPT的功能,无需依赖于网络浏览器。此外,用户界面的改进将使得ChatGPT更加易用友好,用户可以更方便地定制ChatGPT的外观和设置。

OpenAI强调了其使命,即确保人工智能造福全人类。因此,他们不仅将GPT-4o提供给了所有用户免费使用,还在一定程度上提高了免费用户的使用额度。未来,他们还计划在ChatGPT Plus中推出新版语音模式的alpha版本,使得更多人能够轻松使用到GPT-4级别的人工智能。

总的来说,OpenAI的ChatGPT-4o的发布意味着人机交互进入了一个全新的时代。它不仅实现了多模态输入输出的重大突破,还在技术上带来了更多的创新和可能性。未来,ChatGPT-4o将成为人们生活中不可或缺的一部分,为人们提供更加智能、情感化和个性化的服务和体验。


2、Google 发布「AI 全家桶」

自OpenAI发布了ChatGPT-4o后,Google在Google I/O大会上也展示了其在人工智能领域的强大实力。Google在接近两个小时的发布会中多次提及AI,推出了一系列新产品和升级,涵盖了搜索、工作空间、多模态AI等多个方面,展现了其在人工智能领域的全面布局和持续创新。

-发布会亮点:

1. Google Search AI升级:Google Search AI引入了AI Overviews功能,这是一种增强版的AI搜索概述功能,能够进行多步推理。这使得Google Search在提供搜索结果时能够更加智能和全面。

2. Gemini大模型:Google推出了Gemini 1.5 Flash和Gemini Pro,分别支持100万和200万上下文,这意味着Gemini模型能够处理更长、更复杂的文本内容。Gemini模型的不断升级提高了Google在处理自然语言理解方面的能力。

3. Gemma多模态大模型:Google发布了Pali Gemma和Gemma2,这是一种开源的多模态大模型,能够同时处理多种类型的数据,包括文本、图像和音频等。这一举措意味着Google在多模态人工智能领域的布局。

4. AI in Google Workspace:Google将Gemini的能力和Side Panel的形式结合,将Google系列产品串联在一起,使得用户在工作中能够更加高效地使用人工智能辅助功能。

5. Gemini App:Google宣布将推出手机版的Gemini应用程序,即将支持AI视频对话,这将为用户提供更加便捷的人工智能交互方式。

6. Project Astra:Google推出了最新的多模态AI项目,包括Imagen3、Music AI Sandbox和Veo等,这些项目涉及图像、音乐和视频等不同领域,展示了Google在多模态人工智能方面的最新进展。

7. Google搜索的新功能:Google Search AI引入了AI Review功能,通过在搜索结果的顶部显示由AI生成的摘要,简化了用户的搜索过程。另外,多步推理功能使得用户在搜索时能够更加全面地获取相关信息,并且能够根据用户的搜索内容提供更具针对性的结果。

Google在Project Astra中推出了Imagen3、Music AI Sandbox和Veo等新技术,这些技术能够生成高质量的图像、音乐和视频内容,展示了Google在多模态人工智能领域的最新成果。发布会上展示的「狼」的生成图片,就是 Imagen 3 在一段叙述中,准确提取了 8 个细节信息,并且在图片中都有体现。

Imagen 3 还能应对一些更加抽象的图片创作,例如根据「彩虹色」「羽毛组成的 light」「黑色背景」的提示,生成的创意图片。

而Music AI Sandbox则可以根据用户的音乐创作扩展乐曲,并根据用户输入的提示词进行二次创作。

Gemini模型的进展:

Gemini模型的升级意味着Google在自然语言处理领域的能力不断提升,Gemini模型已经能够处理更长、更复杂的文本内容,进一步拓展了Google的人工智能应用范围。

安全和隐私保护:

Google在发布会上还强调了安全和隐私保护,通过SynthID技术为AI生成内容添加不可见水印,提高了内容的辨别度,以保护用户的隐私和安全。此外,Google还加强了对用户隐私的保护措施,例如在Android系统中增强了TalkBack功能,以帮助视力不佳的用户更好地使用手机。

-展望未来:

总体来说,Google在Google I/O大会上展示了其在人工智能领域的强大实力和持续创新,Gemini模型、Project Astra和新功能的推出,将为用户提供更加智能、高效的人工智能服务,为未来的人工智能发展打下坚实的基础。


3、AirChat - 一个新兴的社交媒体平台

这是由AngelList创始人Naval Ravikant和前Tinder高管Brian Norgard共同开发一个新型社交媒体平台,主要通过语音笔记创建帖子和消息。结合了Twitter和Clubhouse的特点,用户通过语音发表帖子,用户录制的语音笔记会通过AI转换成文字,支持多种语言。其他用户可以阅读或听取帖子及回复。

假设在关注的是自己关系链相关的好友,即使不看手机通过声音就能了解什么新动态,有哪些对话发生。

此类产品优势在于语音笔记比文字更丰富,有助于传达信息的情感和意图,同时验证用户的真实性。但其也面临挑战。AirChat与现有平台如X和Threads有许多相似之处,可能会面临用户基数增长后的管理挑战。并且同样打着语音社交旗号的Clubhouse及很多同类产品,目前也逐渐衰弱,语音社交的效率和实用性(尤其在社区产品领域)存疑。


4、Amazon Music 和 Spotify 都推出了自家Playlist

用户可以通过亚马逊的播放列表生成器 Maestro使用包括活动、声音或情感在内的提示来创建播放列表。

如果用户不确定写什么,可以选择屏幕底部的提示建议。几秒钟后,AI 生成的播放列表将出现,理论上与用户的输入相匹配。

Spotify推出了一项名为“AI playlists”的测试功能, 利用大型语言模型(LLMs)来理解用户的意图,并结合用户的听歌历史和偏好来创建个性化的AI生成播放列表, 允许用户根据文本提示生成个性化播放列表。

用户可以通过各种提示来创建更多样化的定制播放列表,例如“用来哄我的猫的歌曲”或“对抗僵尸末日的节奏”。

两家在设计上均采用了四角星花作为设计符号,色彩搭配上也均已弥散渐变的手法为主,也算当下主流的设计趋势了。


5、Meta正在为旗下的软件布局相关Ai能力

Meta AI 搜索将与传统搜索一起出现在每个应用的默认搜索框中,如果 Meta AI 对用户输入的查询有答案,搜索结果旁边会显示一个蓝紫色的圆圈。

同时还将提供一些 Ask Meta AI 的迷你提示。

WhatsApp实时AI图像生成功能。用户在与Meta AI的聊天中输入文本到图像的提示,随着输入更多细节,可以实时看到图像的变化。

示例:用户输入“Imagine a soccer game on mars”(想象一场在火星上的足球比赛),生成的图像会从典型的足球运动员迅速变化为展示在火星景观上的整个足球场。

技术亮点:Meta的Meta Llama 3模型现在能够生成“更清晰、更高质量”的图像,并且在展示文本方面表现更佳。用户还可以请求Meta AI对提供的任何图像进行动画处理,将其转换成GIF与朋友分享。

6、TikTok在加拿大和澳大利亚地区上线TikTok Notes

目前还是处于测试阶段,专门用于照片和文本内容分享的平台,作为是IG的竞品。用户可以选择是否在TikTok和TikTok Notes之间共享照片。

主页分为两个部分:一个用于查看你关注的人的帖子,另一个是“为你推荐”页面。“为你推荐”页面类似于小红书、Pinterest的主页的两栏瀑布流网格布局。

内容支持标题和长达4,000字符的说明文字,几乎是Instagram的两倍,与Instagram的美学内容相比,TikTok Notes似乎更注重实用性内容。

7、Screenity : 免费且注重隐私的屏幕录制工具

特点概述

免费: 无时间限制,易于使用的界面,丰富的功能。

隐私性: 不收集用户数据,只有用户自己能看到录制内容,支持自托管,开源。

功能丰富: 支持在任何页面上绘图,编辑视频,设置定时器,添加模糊效果和摄像头效果等。

无限制: 可以录制任意时长的视频,录制后的视频归用户所有,可以永久导出。

8、Bepper: 可以聚合各类IM免费聊天工具

Beeper 建立在 Matrix 之上,用户创建 Beeper 账户时,除了将13个聊天网络统一到一个应用程序中,还可以与 Matrix 网络上的人聊天

它的工作原理是由客户端应用程序和连接到其他聊天网络的网络服务组成。使用 Matrix 服务器和开源桥接技术连接14个不同的聊天网络。Martrix是一个开源的聊天协议,用于安全、去中心化的通信。


9、人工智能修图软件Remini爆火

五一假期,一款名为“Remini”的图像风格迅速成为了社交媒体的焦点。从小红书到微博、抖音、朋友圈等各大平台,用户纷纷上传了使用“黏土AI”风格处理过的旅游照片,引发了轰动。博主们纷纷称赞其“丑得太上头了”、“太太太可爱了”,一些推文甚至动辄收获成千上万的点赞和评论。随之而来的是一门赚钱生意。在闲鱼等二手交易平台上,许多商家开始提供代做“黏土AI”滤镜照片的服务,价格在1到2元/张不等,吸引了大量“想要”的客户。

Remini是由北京大觥科技公司于2019年推出的AI修图App,后被意大利公司Bending Spoons收购。2023年,凭借着“AI写真图像”、“宝宝AI生成”等功能,Remini在国外大火,而最近的“黏土AI”功能再次让它成为了热点。

尽管Remini的定价较高,订阅价格为68元人民币/周(约300元人民币/月),但新用户可以免费试用一周。Remini的人像生成效果备受用户喜爱,有人觉得是“丑得上头”,有人则认为是呆萌治愈。不少用户上传了旅游照片,AI基本还原了照片的场景和人物,但也会在细节上做一些“创作”,比如添加珍珠项链和耳环,甚至修改微笑嘴巴的形状。

除了Remini,市面上还有许多工具能实现类似的“黏土AI”效果。比如,AI图像生成软件Midjourney和国内的美图秀秀都支持类似的转绘功能,能够产生不错的效果。

“黏土AI”效果的技术原理并不复杂,通过图像识别、风格转换、AI重绘及细节优化等步骤,AI就能够将图片转化成黏土效果。市面上已有的开源图像生成模型,基本上都可以实现“黏土AI”效果。

Remini之所以能火,一方面是因为具备了创新的生成式AI技术、准确的市场定位、社交属性产品设计、热点营销策略、以及低门槛入门的定价策略。另一方面,这类应用要想维持热度,需要不断更新功能、解决隐私和数据安全问题,并建立可持续的商业化变现模式。Remini凭借其独特的风格获得了用户的喜爱,通过社交媒体实现了裂变传播,成为了今年首款爆火的生成式AI产品。


10、Airbnb升级体验:通过一系列重点功能提升用户的使用体验。

Airbnb 的设计风格简洁干净,细节精致,将入微的关怀融入到用户体验之中。

-“Guest Favourites(房客最爱)”系列

“Guest Favourites” 一个全新的分类集合,涵盖了 Airbnb 中两百万套用户最爱的房子。入围的房子会被标记”Guest Favorite”,用户也可以筛选,只浏览被标记的房子,便于快速查找。”Guest Favorite”的房子平均评分在 4.9 分以上,并且有非常良好的评论,来佐证房屋和屋主是很靠谱的。

评分体系的升级,快速浏览用户评论。优化了评分和评论的展示方式,关键信息一目了然。用户可以通过图表看到 1-5 星的评分分布状况;筛选不同纬度的评论内容;寻找自己最关心的经验和评论,例如出行方式的便捷性,居住的时长和感受等。除了筛选,新增了评论搜索,帮助用户更加精准地找到自己所关注的内容。

-新增”Listings Tab”,帮助房主管理更高效

Listing Tab,帮助房东高效管理与编辑,轻松展示房屋的特征特点。

在 Listings Tab,点击房屋进入编辑页面,这里包含“Your space (你的空间)”和“Arrival guide (到达指引)”两部分。

首先我们看“Your space”,房东可以在这里编辑关于房屋的所有细节信息,例如标题,类型,详细描述、房屋附带的设施等等。

在旧版本中,添加房屋设施的列表项很长,用户找到相应设施的勾选项成本很高。而新版本中,优化了分类逻辑,让用户可以方便快速地找到相应选项,大大提升操作效率。

Airbnb 此次优化了图片浏览体验,提出了”Photo tour (照片游览)”的概念。之前用户是在一个长长的图片瀑布流中查看浏览,难聚焦,目的性很弱,现在通过 Photo tour 的场景分类,让图片展示的逻辑更清晰,用户查看图片更有目的性。

当然,如果让用户分门别类地去上传图片,这一定是一个艰辛的过程,Airbnb 此次引入了 AI 能力,房东只需将一堆图片一次性上传,AI 会自动识别图片并做好场景分类。

图片上传之后,房东还可以针对每一个房间添加更细致的描述与设施选项。如果还想手动添加房屋或者空间,Airbnb 提供了 40 多种房屋或空间的类型可供选择,在该页面里,相应绘制了精致的 3D 图标,细节质感十分感人。

-Arrival guide (到达指引)

房东可以在这里把房客到达后所需的信息都呈现在这里,例如家里的 Wifi,房间的解释说明,入住需知等等。同时房主还可以用 Airbnb 账号连接家中智能锁,可以为不同客人在入住期间提供一套独立密码,无需每次手动改换密码锁的密码。遗憾的是,目前这一能力只在美国和加拿大得到支持,门锁硬件是指定与 Schlage (西勒奇)合作。

-收入与价格管理工具

全新的收入统计面板,为用户提供更清晰的收入统计信息,做到多个维度,可筛选,可定制,像公司财报一样,帮助用户了解自己的收支状况。例如展示不同时间段的收入详情,以及根据房屋预定量,预估下半年的收入情况。

帮助联合房东或合作伙伴妥善分配收入,用户可以与合作伙伴设置收入分成,分摊费用,例如清洁费等等。

另外,用户可以查看自己的房子在某一时期和其他房子的价格对比,帮助用户便于做价格设定。

11、网红“鼻祖”Instagram重塑品牌形象

早在2022年中,Meta 就发布了「IG rebranding」计划。至今团队除了重新定义了Instagram品牌标识的关键元素,并制定了一套全面动态视觉方案,涵盖了营销、产品和空间,包括更新的标志优化、全新的色彩体系、灵活的版式规范和字体家族,以及对产品UI的富有表现力的呈现。

-品牌元素视觉——字体、颜色、排版

由Colophon Foundry设计的定制字体系列。后续并由台湾Justfont为其延展定制中文字体(繁体)。「方方圆圆」的特征是从 logo 设计发展而来的特征。在现代几何风格中,仍保有手写笔画的随兴俏皮,看起来既现代又有人文温度。在 Script 版本中,大写 i 的字形呼应了原始品牌识别字型 Billabong 的写法。连写设计也让无衬线体更有手写体的味道。







请到「今天看啥」查看全文