澳洲付费语音转录业务兴起,大企业投资云端语音识别人工智能服务
在科技快速进步的今天,录制和转录会议、采访、演讲、讲座或对话都可以通过手机一步搞定。转录文本使用手机可能存在准确性的问题,但是配套安装一款合适的软件则可以轻松解决这个问题。而语音转录的需求不断增加,也引发了大企业和投资者的兴趣。
现在捕捉和转录音频的方法有很多。比如otranscribe.com和transcribe.wreally.com等网站就可以提供便利的转录服务,让用户在同一个网页上轻松浏览视频和音频的同时编辑文本,而无需在音频播放器和编辑器之间反复切换。此外,用户还可以控制播放速度、或者快进/快退等。
如果用户自己没有时间,还可以寻求在线人工服务。操作也很简单,用户只要把音频资料递交给在线客服、完成费用支付后即可获得有关转录的邮件。根据服务质量、音频质量、口音和语言、以及交货时间的不同,收费大概介于每分钟1澳元至数澳元不等。
目前提供转录服务的澳洲本土公司包括:Triple A Transcription、Spark & Cannon 和Type Transcripts。用户可以通过打开网页或手机移动端的方式获取此类服务。有些公司提供的应用程序,可以让用户在手机上完成录制、编辑、然后直接发送转录申请。
关于转录服务,最大的技术进步莫过于语音识别软件的开发。Dragon NaturallySpeaking就是一款非常精准的语音识别软件包,于1997年首次发布。忙碌的专业人士只需要说就可以轻松创建文档、报告、电子邮件、填写表格。这款软件是在计算机而不是在云端服务器运行,同时有多个专业版本可供用户选择。这款软件有一个弱点,就是不擅于转录陌生人的语音。
随后的一些大企业对云端语音识别人工智能服务进行了大力投资。以IBM公司的Watson系统为例,大大的提高了语音识别、转录为文本的准确性和功能多样性。
同样,其他通过网页或手机进行语音自动识别转录的软件也有很多。比如,Speechmatics、 Trint 和Temi都是既便宜又实用的软件,收费低至每分钟10澳分。
目前,安装有Siri和Google Assistant的智能手机本身就是一款转录设备。笔者曾经使用过一款名为Otter的自动转录服务,该服务既可以通过打开网页的方式,也可以通过手机移动端APP的方式进行使用。服务开发商AISense在今年2月份举行的“世界移动通信大会”上宣布了此款服务。
Otter增加了由暂停引发的段落缺口功能,并且可以在每一节前标记发言人姓名。同时,用户每个月可享有600分钟的免费转录服务,支付9.99美元(13.5澳元)即可享有每月6000分钟的转录服务。
如果用户使用的是安卓系统手机上的ACR录音软件,用户也可以把记录的电话录音发送至Otter,轻松获得电话录音的转录文本。苹果手机可能无法在通话时直接录音,但是可以通过安装其他应用程序来进行通话录音,例如TapeACall。