大象声科(深圳)科技有限公司

 

大象声科专注于机器听觉,是全球首家应用深度学习技术解决语音信号处理的人工智能公司,致力于提供尖端的智能语音增强和语音交互解决方案,打造更智能自然的人机交互体验。公司成功研发了智能降噪、语音唤醒、声纹识别、声源定位、波束形成等核心技术,针对手机、耳机、PC、云通讯、智能家居、智能车载、机器人等行业客户提供机器听觉解决方案。

采用英特尔相关技术:

1. Intel®Core™

2. Intel GNA

3. OpenVINO™

说起新冠疫情对“打工人”的挑战,那些无穷无尽的远程音频、视频会议肯定名列前茅。先不说各种各样的技术故障,光是会议中此起彼伏的背景噪音,就常常让人无可奈何。而一款能够在音视频会议中清晰传声的PC,无疑会成为商务人士远程办公的利器。英特尔AI百佳创新激励计划三期优秀团队大象声科,便成功将Vocplus PC——一套能够提升PC用户语音通信清晰度和语音交互体验的智能语音方案,成功落地于联想近期发布的旗舰产品YOGA Pro 14s上,让用户即使在嘈杂环境中,依然可以保持清晰顺畅通话、轻松唤醒语音助手。

三大技术, 给你更清晰更智能的语音体验

大象声科Vocplus PC 智能语音方案,基于计算听觉场景分析理论基础,应用深度学习技术,可以在音视频通话过程中,实时分离人声和背景噪声,提取清晰人声,是“打工人”出差旅行、音频视频、远程会议的得力助手。该方案中包含三大技术:

1

VoIP 语音增强

能够实时分离通话声音和背景噪音,传递用户清晰的声音。可以屏蔽键盘敲击声、小孩哭闹声等各类环境噪音,在“单人语音”模式下,更能隔离周围人声的干扰,让会议更加私密;

2

深度啸叫抑制

常见的多人会议中,多台设备同时开启麦克风,会产生刺耳的啸叫声。该方案的DHS深度啸叫抑制技术能够实时监测啸叫并抑制反馈回路,令多人会议语音通话更顺畅;

3

语音助手预处理

结合深度学习和麦克风阵列技术进行前端信号处理,实现远场智能拾音,兼容Cortana、Alexa等语音助手,有效提升其在噪声环境下的语音唤醒与识别率。

有了这三大技术做保障,无论是开放式办公室,还是商务旅行途中,不管你用微信、钉钉,还是 Zoom、Teams,都会得到清晰的语音通话质量,如同身处专业会议室之中;同时能够轻松唤醒PC语音助手,释放双手与创意。

三方合作优化,进驻英特尔处理器

AI 算法,是大象声科区别于其他方案的主要特征,这也对运行平台的算力提出了要求。作为英特尔AI 百佳创新激励计划的成员,大象声科同联想、英特尔三方通力合作,针对英特尔新一代酷睿处理器,特别是处理器内置的 GNA 硬件 AI 加速单元,优化 Vocplus PC 方案,相对单纯使用处理器,能耗降低 54%,从而以低功耗处理语音及噪声抑制等后台工作负载,最大限度增加电池续航时间。优化时用到的英特尔 OpenVINO™ 工具套件,是目前唯一的 GNA 部署工具,可以满足语音处理对功耗的苛刻需求。

现在大象声科的 AI 语音技术,已经集成在英特尔处理器的 GNA 单元中,可以帮助 PC 终端厂商升级 PC 语音通话和语音交互功能,缩短工程调试周期;此外,Vocplus PC 方案之前在联想ThinkBook 13s上也已成功落地,经量产验证,性能稳定可靠,可以助力PC终端厂商尽快推出让终端用户受益且更具市场竞争力的产品。

合作共赢,让AI赋能各行各业

凭借持续创新的科研能力和丰富扎实的项目落地经验,大象声科得到了业界的认可,而且和行业产业链上下游建立了紧密的合作伙伴关系,不仅成为了英特尔首个第三方 AI 语音算法合作伙伴,还顺利入选了英特尔AI 百佳创新激励计划

技术层面之外,英特尔还为大象声科提供了市场营销、宣传推广层面的协助。所有这些措施,让大象声科站在了科技业界巨人的肩膀上,站得更高,看得更远。正如大象声科董事长兼CEO 苗健彰所言:

借助英特尔AI百佳创新激励计划和英特尔强大的生态合作伙伴系统,相信不远的将来,我们的技术和产品将赋能智慧城市、教育、银行、零售等更多行业,释放更多生产力和创造力。