王者争霸:讯飞智能录音笔SR701/搜狗AI录音笔S1对比体验

作为一名码字编辑,时常穿梭于各类发布会、专访、群访等场景,而一款好用的智能录音笔,对码字编辑来说,就是生产力工具。

录音笔的发展与存储介质的发展息息相关,如今存储技术的发展已经到了一个非常高的水平,传统录音笔的很多需求已经被智能手机所取代。但在相对专业、高需求的场景下,智能化的实时转写、语音翻译、降噪等功能就成了核心竞争力。

在围观了老罗4月1日的带货主播后,笔者检索了目前20003000元价位的在售智能录音笔后,目前在售的只有科大讯飞智能录音笔SR701和搜狗AI录音笔S1。

讯飞智能录音笔SR701(以下简称讯飞SR701)与搜狗AI录音笔S1(以下简称搜狗S1)都是现阶段两家智能录音笔的旗舰产品,两款产品在外观结构上基本一致,均采用2个哈曼定向麦克风和6个矩阵麦克风设计,在产品售价上也非常接近,讯飞SR701售价2899元,搜狗S1售价2698元,讯飞SR701是在2019年5月份上市的,搜狗S1是在2020年2月份才上市的,讯飞SR701产品上市时间更早。

这两款王牌录音产品实际体验如何,我们在京东上采购了这两款产品,对这两款产品进行对比体验,一起来看一下这两款现阶段王牌智能录音笔具体表现。

外观

▲左为讯飞SR701,右为搜狗S1

讯飞SR701尺寸为122mm x 65mm x 11mm,搜狗S1尺寸为128mm x 64mm x 16.5mm。整体厚度来看,讯飞SR701更具优势,轻薄的外观对于经常进行语音采集工作的人群来讲,无疑是更加纤薄小巧。

▲左为讯飞SR701,右为搜狗S1

电池容量上,搜狗S1占优势,电池容量为2450mAh,讯飞SR701电池容量为2000mAh。不过讯飞SR701标配了18W的快充头,充电五分钟可以支撑2小时连续录音,而搜狗S1则配备的10W适配器,充电效率上,讯飞SR701弥补了电池容量小的遗憾。

▲左为讯飞SR701,右为搜狗S1

为了得到更好的收声效果,讯飞SR701和搜狗S1均采用了2个哈曼定向麦克风和6个麦克风阵列的设计,不过,搜狗S1的麦克风阵列集成在屏幕总成的玻璃上,如果想要保护设备而贴膜的话,可能会因为贴膜影响到麦克风阵列的收声效果。

在按键设置上,讯飞SR701引入了侧边指纹解锁按钮,这相比于传统的数字密码安全性更高些。搜狗S1的侧边则提供了物理按钮,可以一键开启录音功能,功能性上更方便。

从整体外观来看,讯飞SR701和搜狗S1各有特点,接下来,我们通过具体的使用场景对讯飞SR701和搜狗S1进行对比。

使用体验

科大讯飞在业界一直专注人工智能和算法,而搜狗则专注软件和应用的互联网公司。我们在这两家公司的产品就能看到这些特点。讯飞SR701系统采用深度定制的安卓系统,而搜狗S1则是基于MIUI定制,在UI的美观度上,搜狗S1显然更好一些,操作更接近手机;而讯飞SR701上来就比较直观了,理科生思维更加明显一些。

为了更直观做对比,我们设置了标准朗读(新闻联播)、会议采访、英语、课堂、噪音、远距离收音等场景的对比。比较遗憾的一点,因为疫情因素,无法实现大型会议现场的录音拾声转写。

▲左为讯飞SR701,右为搜狗S1

1、功能支持

搜狗S1支持APP客户端远程控制录音,讯飞SR701不支持该功能。

在应用支持方面,搜狗S1对文本支持并不友好,尽管可以通过手机或者电脑进行拷贝语音文件,但搜狗S1并不支持拷贝转写的文稿,需要通过网页获取这些文本;讯飞SR701云存储功能是按需存储,因此用户可以根据需要上传云文件到云服务器中,针对转写的文稿,讯飞SR701连接电脑就能自由拷贝。

搜狗S1共有四种录制模式供用户选择,分别是会议、听课、采访和音乐,其中音乐模式下可录制192Kbps和256Kbps的mp3文件和48kHz/16bit以及48kHz/24bit的WAV文件,其他模式下采样率均为16kHz/16bit。

讯飞SR701共有七种录制模式,分别是标准、采访、会议、演讲、备忘、音乐、省电模式。录制格式分别为ACC和WAV格式,其中音乐模式下采样率为48kHz/16bit,省电模式下采样率为16kHz/16bit,而其他模式均在32kHz/16bit采样率下进行。

在声音录制的质量上,讯飞SR701更好一些。

作为智能录音笔,语音转写功能和降噪自然是很多用户关心的,接下来我们看一下讯飞SR701和搜狗S1在语音转写和智能降噪上的表现。

2、标准朗读场景

首先我们来看一下第一段音频文件,原录音采自《新闻联播》4月5日《为了民族复兴英雄烈士谱系列报道》栏目。以下转写内容均在采访模式下进行,搜狗S1转写内容如下:

▲搜狗S1转写

搜狗S1文字转写功能需要登录搜狗语音助手专门的网页,然后从网页下载才能编辑转写的内容,搜狗S1的一个好处是,它可以智能识别录音文件中不同讲话人的声音,最多可以区分四个人,识别录音中的掌声、笑声以及语气词,这些接下来的例子中会有所提现。通过这段《新闻联播》内容的转写我们看到,搜狗S1在个别的人名、断句上有所欠缺。另外发音相近的一些词语也会被误识别,比如转写的内容中,“事迹”一词就被误转成“世界”,“新医药”被误转称“星医药”。

在来看讯飞SR701的转写表现,讯飞SR701在这篇报道中识别准确率基本上达到了100%,特别是在文字的断句上,表现比搜狗S1好很多,尽管“办利群书社”、“太阳能光伏”、“新能源汽车”在停顿上存在一些小瑕疵,但这并不影响整体的阅读。

▲讯飞SR701转写

3、发布会速记

接下来我们再来看看,转写抗疫指挥部新闻发布会的一部分讲话内容。首先我们来看一下搜狗S1的表现,在未开启智能辅助矫正功能情况下,我们看到搜狗S1转写过程中也将诸如“呃”、“哈”等语气词记录下来,如果开启智能辅助矫正,诸如语气词、重复词、停顿词等内容就会自动被过滤。

▲搜狗S1未开启智能辅助矫正

▲搜狗S1开启智能辅助矫正

不过,在转写的准确性上,搜狗S1这次出现漏词的情况,同一段音频,讯飞SR701识别准确率是100%。虽然不支持语气词的矫正,但是我们看到讯飞SR701在转写过程中并没有任何的错误。

▲讯飞SR701转写

▲搜狗S1转写

▲讯飞SR701转写

4、英文录音转写

接下来,我们再来看一下讯飞SR701和搜狗S1其他语言转写效果,讯飞SR701支持中英文内容转写。而搜狗S1支持中文、英文、日语、汉语、泰语、俄语、法语、西班牙语、德语、意大利语共10种语言转写,另外,搜狗S1还支持粤语、四川话、河北话、天津话、东北话、南京话、武汉话、陕西话、贵州话、济南话共10种方言转写,不过除了中文普通话转写,剩下的转写语言都属于体验内容。我们这里对讯飞SR701和搜狗S1的英文转写进行对比体验。这段内容共550词左右,为了对比方便,我们对转写的文字进行格式化处理,其中比对结果左侧框内为原始文本,右侧框内为转写文本。

通过转写内容对比,我们看到搜狗S1和讯飞SR701英文转写的识别准确率差不多,一部分词语因为太过相近两者均转写错误,比如“war”被转写为“wall”,“shall”被撰写成“should”,“fighter”被撰写成“fiber”,“fear”被撰写成“fair”,“can’t”被转写成“can”。这些本身由于发音问题的导致的转写错误,我们认为属于合理可以接受,如果去掉这些因素,我们从内容上看,讯飞SR701相对于搜狗S1在识别上会稍微好一些。

▲搜狗S1转写结果

▲讯飞SR701转写结果

5、噪音环境下测试

接下来,是讯飞SR701和搜狗S1强噪音下的降噪和转写体验。讯飞SR701和搜狗S1降噪策略不同,搜狗S1支持先录制后降噪,支持三种降噪强度,分别是真实音质、人声增强还有纯净人声。而讯飞SR701是根据六种不同的场景模式选择自动设置,无需用户临场调整。

在清明节假期期间,笔者所居住的房子有邻居在装修,电钻声、台锯声此起彼伏,如此噪音下,笔者又开启了扫地机器人,同时使用薯片的包装纸制造大量的噪音。

通过两段音频文件的波形图我们看到,整体的降噪效果搜狗S1更好一些,不过搜狗S1对声音的质量压缩的很多,人声是可以听到的,但由于背景噪音太大,搜狗S1原始音频会有类似脉冲式的噪音,同时一些细节上,人声会被误认为是噪音而被降噪,导致音频内容细节难以还原。讯飞SR701整体降噪效果并没有搜狗S1那么强悍,在这样强噪音情况下,勉强可以听到人声并能进行转写。

▲上方绿色为讯飞SR701波形图,下方紫色为搜狗S1波形图

从转写的效果上来看,搜狗S1降噪效果比较好,但降噪强度太大很容易影响录制的声音质量,因此在文字转写的准确率上搜狗S1与讯飞SR701基本差不多。搜狗S1在断句上依旧与讯飞SR701有一定差距,句子与句子之间常常会黏连在一起。

▲搜狗S1转写

▲讯飞SR701转写

6、远距离拾声效果

接下来,我们对两款录音笔进行远距离拾声测试,首先,我们在室内进行简单的低声远距离拾声,测试采用手机作为外放设备,音量为5%,距离录音设备为2.5米,周围环境无其他噪音源。测试音频素材为央视财经频道《遇见大咖》栏目雷军专访内容。以下为原文:

主持人:这句话好空啊我觉得。

雷军:是,在今天能有勇气讲这么空的花的又是什么样的人呢?四五年前手机行业谁用国产机啊,国产机等于山寨,对吗?我们不是这个行业,我们是几乎所有的行业都有这样的困难。他们不仅仅是用iPhone啊,你看他们家里面电视都是索尼、三星、夏普,同意吗?

这个时候我们去批评消费者是没有价值的,我觉得问题出在产业界,出在我们自己没做好。为什么索尼会这么受尊重?它是70年代开始的,之前他们产品也一塌糊涂,我再办个小米不是为了成就感,不是为了成就感,不是为了个人的财富,怎么怎么着,也不是为了满足什么虚荣心。我就是我想干一件我喜欢的事情,我希望这件事情对这个社会有帮助。

搜狗S1在这样低音量远距离拾声表现并不好,虽然有录制部分的声音,但由于降噪算法原因,部分声音会被误认为是噪音被消除或者减小,这就直接导致了部分音频内容缺失,大量音频细节都已经无法还原,音源质量大幅降低影响了转写效果,搜狗S1转写过程中基本上有大篇幅的内容没有正确转写,甚至部分音频无法正常听到人声。通过转写后的文本我们看到,搜狗S1这这种情况下,转写准确率极低,已经无法正常统计转写的情况。

▲搜狗S1转写

在这段录音的转写中,讯飞SR701也遇到了一些麻烦,但相比于搜狗S1已经好了很多,最起码部分内容确实能够成功转写的。在远距离拾声和转写上,讯飞SR701更好一些。

▲讯飞SR701转写

接下来,我们两款产品进行极限拾声测试,这里我们选择在开阔的室外环境进行测试,测试音频文件为央视新闻4月12日全球新冠肺炎疫情播报。讯飞SR701与搜狗S1均在距离音源15米位置进行拾声。

在拾声效果上,我们看到,搜狗S1虽然能有效的降低外部的环境噪音,但是由于测试距离过远,拾音过程中会将正常的语音被误认为是噪音,直接导致大量的声音信息被误过滤,录制音频内容基本上听不到语音内容,很多杂音来自环境声,这也直接影响了转写准确率。

▲搜狗S1转写

讯飞SR701也没有100%的识别。但在15米距离的测试中,讯飞SR701依旧保留大量的声音细节,虽然转写准确率相比于正常环境低一些,但是作为对比搜狗S1几乎没有识别出来完整的内容。

▲讯飞SR701转写

7、课堂笔记场景

在一些课堂场景,一些学生会通过录制课上内容方便课后整理,这里我们通过对高中历史课程线上授课内容转写,体验这两款录音笔的特点。

整段文本内容比较长,搜狗S1基本上全部识别出来了,但是其中识别错误的内容还是比较多。对比讯飞SR701,我们看到讯飞SR701准确度更高,识别准确率超过95%。

▲搜狗S1转写

▲讯飞SR701转写

通过对录音文件的转写和降噪,我们看到搜狗S1在功能上会更多一点,比如讲述人声音识别,英文识别以及降噪功能。

讯飞SR701则更专注识别准确性,在常规的中文交流场景下,讯飞SR701识别准确率更高。

音频文件网盘链接:https://pan.baidu.com/s/1bpUIkx5DZ50mMVGUip-xOQ (提取码:mgc3) 

资费标准

讯飞SR701机身存储为32GB,开机注册后赠送20GB的云存储空间,这些云存储空间可以录制AAC格式文件约250分钟,讯飞SR701这部分云存储空间永久免费;搜狗S1机身存储为64GB,附赠500小时云存储空间,不过这500小时云存储空间只能使用1年时间,如果到期后继续使用需要额外购买会员。

作为智能录音笔产品,讯飞SR701和搜狗S1都推出了专门的增值服务。

讯飞SR701在出厂时已经附赠了价值2999元/年的V3会员服务,这项服务是对于讯飞SR701用户永久免费。它包含20GB额外的云存储空间(约能存储375分钟音频文件),每月有30小时机器快转,每月还有3小时闲时转写,每次可批量上传音频100个,同声传译以及对话翻译不限次数使用。

搜狗S1则提供了268元/年的钻石会员服务,第一年免费,用完一年则需要额外支付会员费用。这项服务拥有500小时的音频文件云存储服务,另外转写时长24小时/日。同样也允许每次最多100个音频文件上传,同声传译和对话翻译不限次数使用。另外,搜狗S1的钻石会员服务还提供不限次数转写手动加速和小语种免费转写服务。

科大讯飞不同的一点是,它会提供专门的人工精转服务,这项服务也是通过充值实现的,这项服务可以选择输出文稿或者字幕,文稿可以标注角色,字幕可以标注时间戳。服务价格相对比较高。

在额外转写时长以及人工精转这类付费增值服务商,讯飞SR701提供的更多,同时讯飞SR701提供永久免费的V3会员,这一点相比于搜狗S1来讲确实实惠不少。

总结

讯飞SR701与搜狗S1作为两款出色的旗舰级录音笔产品无疑是现阶段智能录音笔市场出色的两个选择,讯飞SR701和搜狗S1优缺点如下。

搜狗S1优势:

内部UI美观,M键标记功能适合快速标记重点内容

有3.5毫米耳机口

APP适配关联度高,方便随时移动录制

电池容量大

机身存储与云空间大

附赠保护壳

支持人声区分,语气词、重复词去除

实体按键操作方便

降噪表现出色

附赠防风罩

搜狗S1不足:

机身太厚,加上保护套更厚

麦克风阵列与屏幕总成在一起,无法贴膜

不支持指纹识别

不支持BGI网络登录

转写文本无法通过USB快速导出

断句表现一般

录音开始后震动过大,容易影响声音质量

会员服务需要按年缴费

远距离拾声不佳

讯飞SR701优势:

机身纤薄

附赠防风罩

支持18W快充

支持BGI网络

支持指纹识别

连接电脑课快速获取转写文本

录音整体音质好

中文转写识别率高

ACC格式文件压缩质量比同条件下MP3文件质量更高

会员服务免费赠送

远距离拾声转写准确率更高

讯飞SR701不足:

UI较为单调

不支持导入讯飞输入法个人词库

不支持说话人分离

▲左为讯飞SR701,右为搜狗S1

综合来看,讯飞SR701和搜狗S1两款产品都有着不错的文字转写功底。如果想要更高的安全性能、随时快速电量续航和更高转写识别需求的用户以及一劳永逸的在线服务需求,而从我们相对有限的体验中也可以看到,搜狗S1优于设备的易用性及多语种/方言支持,讯飞SR701则优于语音转写的高准确性。

录音笔的很多录音、转写功能,现阶段的智能手机都可以通过软件实现。但智能录音笔面向的是需求相对较高的用户,自然而然,要求也会更高。如果你是录音笔轻度用户,对录音转写没有需求,则可以选择搜狗S1;如果你经常需要用到录音笔,且对录音转写有更高的需求,则讯飞SR701显然更适合。