[新闻]从冰冷到有温度,Sesame 60 亿募资剑指情

楼主: pl132 (pl132)   2025-05-03 17:27:28
从冰冷到有温度,Sesame 60 亿募资剑指情感语音 AI 市场
https://technews.tw/2025/05/03/sesame-makes-voice-ai-speak-warmly/
有多少次,你喊了“Hey Siri”之后,最终还是得拿起手机来处理事情。不只没有办法完
成事情,Siri 听起来很冰冷。
从手机助理、智慧音箱到未来的穿戴装置,不论是Siri、Alexa还是Gemini,语音助理始
终停留在工具层次:听懂指令、执行动作,却无法真正“交流”。
一群来自Meta核心的技术老兵试图打造真正“懂人心”的语音AI。不只是听懂,而是听出
情感、听出语气变化,因此成立了Sesame,还吸引明星创投如Andreessen Horowitz(
a16z)的押注,目前正在洽谈2亿美元(约新台币65亿元)新一轮募资。
领导Sesame的是Brendan Irib,也是被Facebook(现Meta)收购的Oculus VR的共同创办
人,而Sesame的产品除了语音AI外,还预计用眼镜当作载体,这点耐人寻味,因为Meta才
跟雷朋合作了AI眼镜,Brendan Irib的战略无疑有挑战前东家的味道。
▲ Sesame创办人Brendan Irib也是Oculus VR的创办人,成立新公司的发展策略有挑战前
东家的味道。(Source:Sesame,下同)
从Meta核心出走,挑战跨越语音AI的“恐怖谷”
Sesame的阵容非常雄厚,不仅多为连续创业家,也有过漂亮的出场经验。共同创办人暨执
行长Brendan Iribe曾以20亿美元将Oculus VR卖给Facebook(现Meta),成为虚拟实境(
VR)领域的关键人物;技术长Ankit Kumar则是扩增实境(AR)新创Ubiquity6的共同创办
人,该公司于2021年被社群平台Discord收购。
两人背景各异,一位深耕VR并直接参与Meta的技术布局,另一位专注AR领域并活跃于新创
生态圈。当Meta在内的科技巨头纷纷押注AI装置之际,这两位科技老兵也携手成立Sesame
抢攻这个大饼。
他们认为,现有的语音助理无论如何升级,仍然像是“在命令一部冷冰冰的机器”,而真
正的未来,应该是与AI像朋友一样自然对话,正如Brendan Iribe曾在社群中直言:“今
天我们仍处于谷底,但我们乐观地相信能爬出来。”这句话,既是对现有语音AI生硬、机
械式互动的不满,也是对公司新目标的期许。
带着这样的信念,Iribe与Kumar,并拉拢了另一位重量级伙伴,Meta Reality Labs前研
究工程总监Ryan Brown担任共同创办人,在2023年共同创立了Sesame。
不只是说话,Sesame还可以即兴扮演“侏儒工程师”
与Meta不同,Sesame专注于开发对话式语音模型(Conversational Speech Model,CSM)
,CSM是基于Meta Llama架构打造的语音模型,其核心目标是打破AI与真人之间的“互动
隔阂”。
Sesame开发了两个代表性语音助理:温暖、有活力的女性语音助手Maya,以及温厚、带点
幽默感的男性语音助手Miles。这两款AI语音助理的突破性在于:它们能接受对话被打断
、随情境调整语调,正如Sesame官网所述:“未来的电脑,应该像生命一样真实。”
根据实测,当对话中途突然打断Maya,她不仅能立即暂停说话、专注聆听使用者的插话内
容,更能根据上下文无缝接续话题。相较于Siri机器化的应对方式,Maya展现出更接近人
类的对话特质:懂得控制对话节奏的张弛快慢、配合情境调整语调高低,甚至能从声音线
索推敲使用者潜在需求。例如当侦测到使用者语气低落时,Maya会主动反问“你还好吗?
”并提供温暖的鼓励话语。
目前,Maya和Miles已在Sesame官网开放免费英文示范,未来将扩展支援至超过20种语言
。而与此同步开发中的AI语音眼镜,则预计结合语音模型,打造随时随地陪伴的体验,但
目前仍在原型设计阶段。
▲ Maya和Miles已在Sesame官网开放免费英文示范,而与此同步开发中的AI语音眼镜,则
预计结合语音模型,打造随时随地陪伴的体验,但目前仍在原型设计阶段。
这场重塑语音AI本质的挑战,无疑让Sesame自创立之初便成为焦点。也正因如此,尽管他
们的主要产品“AI语音眼镜”尚未问世,成果仍有待市场验证,依然吸引了硅谷重量级创
投的目光。
募资2亿估值上看10亿,Sesame能否成为新生独角兽?
在语音AI的赛道上,Sesame并非孤军奋战。科技巨头纷纷投入资源,推出各自的语音助手
产品:Meta推出Llama 4扩展其语音功能,此外,Meta AI也被整合至Ray-Ban Meta智慧眼
镜中,提供用户更直观的语音互动方式;Google则推出了Gemini语音助手,并与三星合作
,将其做为Galaxy系列手机的默认助手,取代了原有的Bixby;而Amazon也在近期升级了
Alexa,增强其语音对话能力,以应对市场竞争。
在这样的市场环境下,尽管产品尚未正式上市,Sesame已凭借突破性的语音技术与创办团
队的经历,吸引硅谷顶级资本押注。
2025年3月,公司宣布正洽谈一轮高达2亿美元(约新台币65亿元)的新融资,估值上看10
亿美元(约新台币325亿元),由红杉资本与Spark Capital主导;早前也已完成由a16z领
投的4,750万美元(约新台币15亿元)A轮募资,并获得Matrix Partners与Spark Capital
等多家知名机构的支持。
正如a16z、Spark Capital、Matrix Partners等早期支持者所看重的是团队试图打破过去
语音助理冷冰冰、指令式互动局限。当然,Sesame自己也坦承,目前系统在节奏、韵律自
然性等方面仍有待完善。

Links booklink

Contact Us: admin [ a t ] ucptt.com