当前位置:首页 > 数码资讯 > 正文内容

企业生态|喜马拉雅“耳朵经济”背后的音频技术

2023-02-22 09:55数码资讯

自研全景声和场景音效技术,给耳朵做SPA

为了打造最佳的全景声听觉效果,喜马拉雅联手华为采用了AudioVivid(菁彩声)空间音频方案,支持包括电影院、有声剧场、音乐厅在内的不同场景渲染模式,实现声音版“3D电影”的效果。

除了全景声外,珠峰实验室采用多种前沿算法和动态编程组合封装技术,根据内容特性及不同音频波段分析,专业匹配有声读物,上线了十余款场景音效,包括剧院混响、人声独享、恐怖悬疑、现场环境、深沉抒情等,营造多元声音场景,还原真实声效氛围。要想让优质的音效能流畅运行在手机上,我们做了大量的推理加速工作,比如模型量化、剪枝、知识蒸馏等,从而大幅提升算力保障用户听感。

喜韵音坊有声小说创作工具,AI都是你的配角

喜韵音坊是珠峰实验室原创的网页版音频创作工具,它通过TTS技术帮助主播实现与AI共同创作音频节目。工欲善其事必先利其器,该工具不但能自动拆章、自动识别小说角色、批量合成,还能让AI给主播演配角、实现零成本一个人整台戏的多音色演播。

喜韵音坊的多种精修功能(重音、连读、停顿、语速等)配合人机结合的生产模式,让AI作品进一步媲美真人,约2个月就诞生几十部百万播放、3部千万播放“AUGC”优质有声小说作品。

万声具象——3D美型虚拟人直播和捏脸平台

喜马拉雅珠峰实验室已经迈向多模态AIGC,图像视频领域也可以整活了!技术上,喜马拉雅的虚拟人支持真人语音或TTS多样化驱动口唇和面部表情;内容形态上,离线视频生成、在线直播都可支持;人物形象方面,3D、卡通、二次元都可定制,原创捏脸乐此不疲。

 

 

实时变声,你的声音可以美化

不同于传统的变声,AI 变声是基于深度学习的声音转换(Voice Conversion)技术来实现的,可以实现任意发音人的音色定制,极大程度保留原始音色的特点。目前已有30余音色供使用,并已研发小说、新闻、亲子、广告、评书、商财、科普、历史、娱乐、情感、社科、助手12种风格,只需5分钟语料,就可以在1小时内完成模型建设,实现超快速音色定制。

— 企业介绍 —

喜马拉雅2022年成立珠峰智能实验室,定位于新一代音视频和智能语音交互技术,产品以及产业探索。研究方向包括多模态AIGC、 语音合成、变声、智能审核、AI文稿、全景声、虚拟人、信号处理、智能音效等音视频以及智能语音交互等技术领域。我们致力于探索全栈音视频领域前沿技术,用AI赋能创作者、用户和行业伙伴,使内容生产降本增效、使内容体验生动有趣,实现在文旅、电商、教育、金融、娱乐、车联网等全方位多领域深度合作。

— 关于互动体验区 —

本次大会期间,在场地二层中心地带安排了精彩纷呈的互动环节,其中面积最大的互动体验区,囊括了目前最热门的八大AI领域的代表项目:

AI芯片、AI数据、AI大模型、AIGC、元宇宙、智能机器人、智能出行、智慧健康

本次互动体验区搭建面积近千平方米,共有数十家国内外代表性的AI企业携代表性项目参与,旨在为到场观众提供全面体验AI最新能力的体验和经验,深入体会人工智能技术的精彩能力和美好前景。欢迎前来体验!

 

大会二层喜马拉雅互动体验区效果图(拟)

—— 2023全球人工智能开发者先锋大会 ——

由世界人工智能大会组委会、上海市人才工作领导小组办公室、上海市经济和信息化委员会、中国(上海)自由贸易试验区临港新片区管理委员会共同指导,上海市人工智能行业协会和上海临港经济发展(集团)有限公司共同主办的2023全球人工智能开发者先锋大会(GAIDC)将于2023年2月25日—26日在上海举行。

GAIDC始于WAIC上海人工智能开发者大会,历经三年发展沉淀,全面迭代升级。本届大会主题为“向光而行的AI开发者”,以AI开发者为核心,为AI开发者带来产业之光、科技之光、未来之光。

大会在上海最早迎接日出的地方——临港,通过论坛、团聚、学习赛、项目路演、人才交流、书友会、互动体验等多个板块,聚焦专业前沿内容,联合超过20家国内外开源组织、开发者社区,力邀全球技术大牛、导师大咖和AI开发者共同线下参与,同时与上千万专业开发者线上互动交流,营造自由活泼氛围。

大会将通过会中及会后全年持续运营人工智能开发者生态,让人才引领科技创新,创新吸引金融助力,金融推动产业发展,产业促进人才成长。

联络指南

媒体合作联系人:

党赞

13301885111

sandy.dang@sh-aia.com

论坛联系人:

张非易

17316400301

feiyi.zhang@sh-aia.com

互动体验区联系人:

刘建衢

13301889788

domi.liu@sh-aia.com

人才活动联系人:

王立军

13301889126

lijun.wang@sh-aia.com

扫码关注大会公众号报名预约

扫描二维码推送至手机访问。

版权声明:本文由ZBLOG发布,如需转载请注明出处。

本文链接:http://youzheba.com/s/1904.html

分享给朋友:

相关文章

Facebook“吹哨人”建言马斯克:推特必须开源才能成为公共广场

Facebook“吹哨人”建言马斯克:推特必须开源才能成为公共广场

据报道,Facebook“吹哨人”弗朗西斯·豪根(Frances Haugen)表示,如果埃隆·马斯克(Elon Musk)想把推特变成公共广场,就应该对其算法开源。马斯克之前曾经讨论过将推特打造成一个数字城镇广场,“以供讨论对人类未来至关重要的事情”。豪根是在上周一接受媒体采访时谈论这一问题的。她...

两大因素主导 苹果三大产品线遭砍单

据悉,苹果以需求减弱为由,通知中国大陆供应商本季减产AirPods、Apple Watch和MacBook元器件,中国大陆供应链受到需求下滑和防疫政策调整的双重挑战。法人认为,苹果砍单三大产品线,中国大陆立讯精密受创最大,广达、仁宝、精元、新普等中国台湾厂商同步警戒。需求下滑加防疫政策调整 供应链受...

笔记本与手机互联互通?英特尔:安排

笔记本与手机互联互通?英特尔:安排

大家都知道,英特尔是一家硬件公司,但它出品的软件也相当好用。之前一直盼着微软能够推出一款可以将PC和手机打通的软件,没想到英特尔先出手了。此前英特尔就宣布了协同软件Intel Unison,如今这款软件终于要与大家见面了。Intel Unison的功能就是将PC与智能手机连接起来,两者不仅可以传输数...

信号大提升?iPhone 15和iPhone 15 Pro或有这5大升级

信号大提升?iPhone 15和iPhone 15 Pro或有这5大升级

据报道,根据最近的传言,随着我们预计将在9月发布的iPhone15,苹果似乎正在寻求弥合其iPhone系列标准型号与高端型号之间的差距。据报道,苹果“严重关注”iPhone14系列的某些型号的表现,正在寻求重新评估它如何对待下一个iPhone系列的低端和高端型号。有传言称,目前仅由高端“Pro”iP...

2023通信产业十大技术趋势

近日,2022通信产业大会暨第十七届通信技术年会在线上举行,2023通信产业十大技术趋势正式发布。一是5G-Advanced推动连接更高效,毫米波、深层空分复用迎发展新机会;二是RedCap规模应用,无源物联网加速迭代,千亿连接开启发展新境界;三是算网融合走深走实,确定性网络应用加速转化;四是算力原...

中国信息通信研究院何宝宏: 《2022大数据白皮书》发布及解读

中国信息通信研究院何宝宏: 《2022大数据白皮书》发布及解读

2023年1月4日,在第五届“数据资产管理大会”上,《2022大数据白皮书》正式发布,中国信息通信研究院云计算与大数据研究所何宝宏对白皮书的主要内容进行了分享与解读。何宝宏表示,今年是我们第七次发布《大数据白皮书》。白皮书聚焦过去一年大数据领域涌现的新技术、新模式、新业态,分析总结全球和我国大数据发...