趣丸千音作为AI视频翻译官,亮相36氪WISE 2025商业之王大会

     近日,被誉为“年度科技与商业风向标”的36氪WISE2025商业之王大会,在北京798艺术区传导空间落地。今年的WISE不再是一场传统意义上的行业峰会,而是一次以“科技爽文短剧”为载体的沉浸式体验。趣丸千音作为WISE首位AI视频翻译官,为大会的精彩演讲视频提供多语译制支持,助力中国AI企业发出全球之声。

     会上,趣丸千音CTO张强与尼尔森、华硕电脑、萌友智能及星世线STARAY等行业嘉宾围绕《用科技做品牌创品类》主题展开讨论,拆解AI商业实践中的真实逻辑。

     张强表示:“大模型拉平了很多技术团队的基础能力,又把基础能力天花板抬到了很高的位置。在这个背景下,把AI应用得好会变得更难,这也要求AI应用公司必须在自己行业里面要做得够深够透,才能真正把大模型这个技术范式用得好。趣丸千音基于对影视漫出海场景的深入理解,AI译制工作流一天可以量产30-40部短剧译制剧,成本较人工降低20倍以上,速度提升10倍以上,为‘国剧出海’注入了全新动能。”

     以下为经整理后的圆桌对话实录:

     主持人:第一个问题是谈增长,谈科技创新品类,科技突破品牌。在各自所在的行业当中,如果用科技去驱动创新或者创造品类,大家觉得是什么时候?以及科技是如何改变了各自行业的底层逻辑?

     张强:作为一个程序员,从技术角度谈一下我的想法。首先大模型的这种开发范式拉平了很多技术团队的基础能力,又把基础能力天花板抬到了很高的位置,在这个技术不断变强的背景下,其实把工具用得好会变得更难。所以我们必须要在这个领域里面,在自己行业里面要做得够深,才能真正把大模型这个技术范式用得好。

     另外,因为我们天花板变高了以后,我们能够站得更高,以前我们觉得不能做的事情,很多高价值的点我们看不到的,现在变成了可能,所以允许我们利用技术手段,在更多的高价值方向进行探索。

     主持人:明白,我们刚才其实提到了很多新品类的瞬间,但是我觉得有一类瞬间有的时候可能是被忽略掉的,就是声音,我不知道大家有没有感受到,其实声音这个行业,大概有十几年的历史了,我们最开始听到那个机器感的声音,一耳朵就能听起来,但是现在我们看到这个声音越来越有人感了,所以强总我的第一个问题想问,从语音技术的发展来看,这么多年了,您觉得现在有了一个质的飞跃吗?存在着这样的时刻吗?

     张强:当然存在这样的时刻,从去年到今年,一年多的时间里面,语音的技术取得了长足的进展,尤其得益于结合大模型的技术范式。我们在去年开源了一个语音大模型,叫MaskGCT ,当时刷新了全球多项SOTA,取得了很大范围的关注。但是以现在的技术水平再看那时候的模型,完全不是一个水准了。

     今年以来诞生了很多优秀语音模型,包括我们自己也迭代了几个版本。在这过程中,我们发现可以不只关注TTS的自然度,不只关注克隆像不像的问题。而是技术允许我们能够从语义、情绪、音色、韵律等多个维度对语音进行解耦。如果我们能实现这样的解耦的话,那我们对声音的每个维度都可以进行一个精确的编辑,然后每个维度不同的组合又能满足不同的场景的。比如,我把中文的语义换成英文的语义,那它可以做语音翻译,基于此我们孵化出了趣丸千音。又比如,节目中的主持人说错一句话,我们可以把它中间的内容进行修改,并保持本人的音色,省去了重新录制的麻烦。如果我们把音色换掉或者对音色进行编辑,它就是一个声音转换器。所以不同的组合可以满足不同的场景,也带来了不同的应用落地机会。

     主持人:我知道像我们的语音技术,更多的还是应用在了很多B端的场景,在B端这一块,您现在整个发展的状况,或者是说对于B端的应用场景要求更高、批量更大,您这边从效率或者流程上能跟得住吗?

     张强:趣丸千音上线不到半年,已经服务了几十家短剧出海的公司,我们在服务这些B端客户的过程中,无论是自己的认知还是对客户业务的理解都是逐渐加深的。像我们做短剧译制,真正用的人是短剧公司里负责海外发行的译制人员或运营人员。这些人真正的痛点不是在如何提高AI配音的自然度、发音地道上面,而是人工译制周期长、成本高、审校繁琐等问题,那解决这些问题的最终本质就是在帮助客户解决ROI问题。

     所以对应到趣丸千音这个产品,我们把AI能力与客户业务场景紧密结合,针对性地打造一站式AI译制工作流,AI一键完成“字幕擦除-翻译-配音-后期-成片交付”整个流程的工作,一天可以量产30-40部短剧译制剧,成本较人工降低20倍以上,速度提升10倍以上。另外,基于这个标准化的流程框架,我们也会推出定制化的解决方案。例如,针对做海外社媒变现的短剧客户,我们会推出“快译”的版本,在译制效率这个层面做到更快、更稳,满足不同客户的出海需求。

     主持人:还是回到了能够真实的帮助我们无论是C端还是B端,去解决这些真实的痛点。

     张强:是。对To B的企业来说,除了要懂客户的业务,更要懂客户的生意。只有理解了商业本质,你提出的AI解决方案才能直击要害,让客户愿意买单。

     主持人:我们最后这一题问在场的嘉宾,如果以各位的专业去预见,在各自的领域当中,未来24个月可以想见的科技催生品牌创新的机会在哪里?

     张强:我想说两点。第一点,我觉得Transformer会变成传统技术,虽然大模型现在还在快速演进但最终会变成“传统技术”,未来一定会诞生可持续学习、交互式学习一种新的算法框架。第二个,我觉得可以关注的点是有专业深度的智能硬件,AI 语音会在硬件层涌现出更大的商机。

     主持人:专业深度的智能硬件,好,收到。

标签:

上一篇:设计营商周2025圆满落幕 三天峰会吸引逾15,000人次参加
下一篇: