
日前,豆宝推出了一款新产品——豆宝输入法。输入法是古老的工具产品。在移动端,用户早已习惯使用手机自带的输入法,或者效仿PC时代的习惯,使用搜狗输入法、QQ输入法等。凭借微信庞大的用户池,微信输入法迅速成为不少用户的新选择。但正如之前所说,微信似乎对输入法兴趣不大。三年来,它在输入方式上并没有增加复杂花哨的功能,甚至连AI能力都被扼杀了。这也符合微信长期的产品理念。相比之下,豆宝的输入法就显得“激进”了。它将输入语音视为其最大的卖点。传统的键盘输入仅保留拼音输入法,试图以更简单的用户体验来吸引用户。但很明显,豆宝和其背后的字节并没有对输入法市场有浓厚的兴趣。豆宝的输入法与微信上的另一种字节攻击类似。这个角度很混乱,也很微妙。豆宝此前是中国用户数量最多的AI应用,拥有1.7亿MAU(月活跃用户)。不过,与拥有14亿MAU的微信相比,豆宝仍有数量级差距。这就造成了一个长期的问题:字节拼尽全力为豆宝吸引近2亿用户;但如果微信全面整合腾讯自有的AI服务,那么字节在AI应用层超越腾讯也不是没有可能。事实上,腾讯已经在这么做了——微信的搜索框已经进化成了“AI搜索”。豆宝的解决方案是:既然不可能正面击败微信,那就必须“化身”为工具应用,直接“活”在微信的聊天框中,满足微信用户的AI应用需求,吸引微信的新用户。豆宝输入法就是在这样的背景下诞生的。的背景。除了输入法,从最基本的截图到高效的办公工具,最后到会议纪要的智能化,豆宝聚焦在一系列微信“空间”上获得了增长。拥有10亿用户的微信遇到了充满挑战的豆宝。前者具有强大的力量,而后者则不遵循通常的定义,专门针对微信的“弱点”进行攻击。眼前的战斗已经开始。打开豆宝输入法。页面布局和配色方案与微信输入法非常相似,降低了用户从微信输入法切换到豆宝输入法的门槛。相比微信输入法,豆宝输入法的优势在于语音识别。豆宝采用seed-ASR2.0模型代替传统的机械语音转录。与传统语音识别相比,基于大规模模型的语音识别可以理解语境、识别专业人士l 术语,并自动分句。实际测试中,它可以过滤掉说话时的“嗯、呃”等咒语和重复表达,还可以根据上下文调整语义。即使你使用中英文混合的表达方式,例如“帮我扫描电脑并复印一份,然后分享给大家”,豆宝的输入法仍然可以准确地识别和转录。此外,当用户在嘈杂的环境中使用语音输入时,豆宝还可以准确过滤背景噪音,识别真实的语音内容。使用微信输入法测试同样的内容。微信的输入法还可以识别中英文混合语音。但在嘈杂的环境下,尤其是地铁场景,豆袋输入法更为准确。豆宝输入法还提供150MB离线语音模型,即使在没有网络的情况下,也能实现0.8秒的低延迟语音转换。然而微信的输入该方法在离线情况下语音识别性能较差,且小错误较多。与微信输入法相比,豆宝输入法承担了皮法、五笔输入、手写输入、AI搜索等功能的管理,只保留了拼音输入和语音输入。另外,豆宝还限制了安装包的大小,APK为146MB。相比之下,Android版微信输入法约为200MB,iOS版为400MB。但豆宝输入法也有一些巧妙之处。例如,当用户在烧“CT值”等专业词汇时,输入“吴承恩是哪个朝代”,豆宝输入法就可以与医学解释相关。 微信输入法:豆宝输入法:在豆宝输入法发布时,字节跳动表示,之所以去掉传统输入法的常用功能,是为了凸显AI元素,发展AI作为主打方向。输入法的竞争。相比之下,微信似乎更看重输入法作为生态补充,尚未投入全部资源打造极致的AI体验。微信输入法的组织不仅仅是简单的帮助社交场景的功能,比如输入关键词关联表情包、小程序等,在深度语义组织和专业内容的帮助方面略显不足。微信输入法于2022年发布,2024年6月推出首个接入腾讯混元大模型的AI版本。 2025年1月迭代至4.0版本。但在实际产品体验过程中,微信输入法的AI能力受到了严重限制。这并不是Byte第一次挑战微信。 2019年初,字节推出了独立社交产品多闪,主打视频社交。对标微信朋友圈,提供“快照”、启动等功能在微信社交领域发起首次高调挑战。 2025年,多闪密集迭代31次,升级为即时通讯专用的“抖音聊天版”,登上App Store社交榜榜首,再次与微信展开生态协同竞争。随着AI时代的到来,豆宝成为挑战微信的又一个字节。 2025年6月,豆宝将全面上线AI播客功能。这个功能最大的特点就是真实感很强,比如自然的停顿、“嗯”这样的回声,甚至偶尔纠正一下主持人的舌头。同时,豆宝AI的播客处理速度非常快。只需3秒即可完成8万字英文文档播客的转换,并提供多种音色选择。它还会自动添加图像、生成播客的进度条和标签。而且,豆宝AI播客具有实时互动、多轮提问的能力关系。用户在收听过程中可以随时打断、断电,比如在听行业报告时,在播客过程中被问及市场规模预测的逻辑时,系统会根据文档内容给出目标答案。微信AI播客将于2025年8月开始灰度测试,仅在“新闻”板块实现,功能相当基础。快手播客,采用男女主播对话的形式,更多的是一种信息性的播客风格,并不具备像真实播客一样的互动感。豆宝的微信攻击触及了一些“微信空间”。以截图功能为例。微信截图支持方框、圆圈等基本标注,以及文字抓取、翻译等常用功能,足以满足日常使用的手机截图场景。但微信的截图功能并不包含任何AI能力。有了豆宝的屏幕截图提问功能,用户完成截图后,豆宝可以要求豆宝总结截图内容,也可以针对截图内容提出并回答问题。再比如,微信的主要功能之一就是传输文件,但微信的文件传输功能功效有限,无法对传输的文件进行深度处理。豆宝推出人工智能云盘。该功能不仅提供同步和多设备文件管理,更重要的是,它可以智能分析各种上传的文档和图像。例如,如果用户上传一个PDF规划的项目,微信只能让接收者查看原文,而豆宝可以提取PDF中的主要用途,然后总结整个文本。同时,云盘在普通文件的有效期期间没有问题。用户可以随时调用文件进行二次解读或编辑。对于专业人士对于经常需要处理各种文档的人来说,它比微信文件传输更可靠,并转移大量文件传输后的分析需求。 G 然而,从客观角度来看,微信表现得令人满意是有其深层次原因的。微信是一款国民级应用,带来社交、支付、资讯、生活服务等功能。微信的任何变化都需要评估其广泛影响。这种考虑无意中增加了变革的门槛和风险。产品团队在推出一项功能之前,必须考虑技术可行性和用户需求、对现有生态的影响、对不同用户群体的适应性以及舆论可能的反应。看似简单的界面配置,却让千万中老年用户感到困惑;一个新功能的推出,可以牵动数百万小程序开发者的利益。腾讯此前推出的IMA是一个典型案例。它的全称是“助理管理助理”的缩写。它本质上是一个专注于信息管理的人工智能工作平台。主要功能围绕知识管理、办公协作、智能写作等,能力包括AI网络搜索、知识库管理、AI写作辅助、会议纪要记录、图像解读等。还推出了微信小程序,方便用户快速采集微信生态内的公众号文章等知识库内容。但IMA作为面向知识库的工具,存在着创建文档、表格等基础操作很难找到入口的问题。打开后几乎是一个空白的界面。有用户反映,宣传语不明确,难以清楚了解产品的价值,导致实际使用率较低。出现这种情况不是因为技术问题还不够好,而是因为微信的用户基数非常大,使用场景太过多样化,任何功能都必须容纳所有用户,这导致最终功能变得更加臃肿和复杂。微信还背负着沉重的“技术债”:多年的发展积累了大量的历史数据,需要兼容不同版本的功能,保证支付等金融功能的充分稳定。技术栈的任何升级都会引发连锁反应,影响整个系统的稳定性。系统越大,变更的风险就越高。一个小错误可能会影响数千万用户。因此,微信开发团队应该感到自豪,每一行代码的修改都必须经过严格的测试和分析。这种谨慎当然是必要的,但客观上也限制了变革的速度。当竞争对手快速迭代并大胆测试新功能时就目前情况而言,微信应保持克制,以确保系统稳定运行为首要任务。微信团队当然知道哪些功能可以做得更好,哪些体验可以优化,但他们必须考虑改变的成本。一项新功能可能会让一些用户满意,但也可能会冒犯其他用户。接口配置可以提高效率,但也会增加学习成本。一切都需要取舍和权衡。微信的更新往往是微妙的、渐进的,没有发生根本性的改变。新功能的推出都会经过长时间的内测和灰度测试,确保足够稳定才全面发布。即使发布后,也会保留旧版本的入口,给用户适应的时间。这种方式保证了稳定性,但使得微信在变化速度上落后于挑战者。作为挑战者的豆宝,情况则完全不同。它没有需要兼容的历史版本,没有不能得罪的庞大用户群体,也没有牵一发而动全身的复杂生态。如果您想尝试新功能,可以快速上线测试。如果效果不好,可以下线进行调整。无需担心会造成用户流失或舆论危机。这种灵活性使得豆宝能够无缝地响应市场变化。当发现用户对某个功能有强烈需求时,可以在几周内开发并上线;当竞争对手推出新功能时,它可以快速跟进甚至做得更好。这个速度是微信难以比拟的。豆宝在寻求改变,微信也在寻求改变。这不是能力的差异,而是角色和安全位置的差异。挑战需要通过创新打开市场,所以必须是激进的;现有企业需要保护其现有优势,因此必须保持稳定。
特别声明:以上内容(包括ding图片或视频(如有)由自媒体平台“网易号”用户上传发布。本平台仅提供信息存储服务。
注意:以上内容(包括照片和视频,如有)由网易号用户上传发布,网易号为社交媒体平台,仅提供信息存储服务。