语音杂谈

en https://localhost:3000/favicon.ico 语音杂谈公众号“语音杂谈”更新 - 使用 Huginn 制作 https://localhost:3000 Sun, 19 Jul 2026 08:48:44 -0700 Sun, 19 Jul 2026 08:48:44 -0700 60 语音/音频处理学术速递[6.8] http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247546224&idx=3&sn=9fd45dbea70b0dec9e96700fee8ccfc0 Mon, 08 Jun 2026 03:00:45 -0700 643346 香港众高校联合开源音频大模型：语音、音效、克隆、编辑(加/删/换)、降噪，七种任务一个权重全部搞定！本体仅732M参数 http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247546224&idx=2&sn=b57965082d66eb48de7636b2846a9620 Mon, 08 Jun 2026 03:00:44 -0700 643342 【活动预告】INTERSPEECH 2026 论文预讲会启动 http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247546224&idx=1&sn=84f9bc256d1e9458e3512fd65c032924 Mon, 08 Jun 2026 03:00:44 -0700 643341 基于机器学习的被动声学监测，智能识别贝类捕食行为 http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247546202&idx=2&sn=ec359843801e8acb682982e7db668f61 Sun, 07 Jun 2026 21:01:12 -0700 643279 2026第二届CCF先进音频技术竞赛丨开启报名 http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247546202&idx=1&sn=da3873252317cae4e16a4f96f22d108e Sun, 07 Jun 2026 21:01:12 -0700 643269 【教程报告征集】NCMMSC 2026 教程报告征集 Call for Tutorials！ http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247546004&idx=1&sn=f89682b5f865628b95ae4bb89a313de5 Mon, 01 Jun 2026 03:30:43 -0700 641069 语音/音频处理学术速递[6.1] http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247546000&idx=3&sn=005a820253e94b112b9d0f909b9afea6 Mon, 01 Jun 2026 03:02:17 -0700 641066 老黄重新发明PC！全球首个Agent原生电脑问世 http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247546000&idx=2&sn=754ecbfdb491e615b679e0bb7c358449 Mon, 01 Jun 2026 03:02:16 -0700 641065 高德语音用20万小时数据做出来的开源TTS，说话人相似度拿了第一，支持11种情感+14类方言 http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247546000&idx=1&sn=37a1838f6d271f2a8bc06873b63e76ea Mon, 01 Jun 2026 03:02:16 -0700 641064 ACL 2026论文预讲会讲者招募中，你的成果值得被看见，共享学术盛宴！ http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247545970&idx=1&sn=6f4898fee0732d03a2bea2383bc27f8c Fri, 29 May 2026 19:01:54 -0700 640194 “智汇金融，声动未来”——CCF 语音对话与听觉专委会走进同花顺学术论坛圆满举办 http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247545981&idx=2&sn=f7e579db088a11697ca77447e459cd7f Fri, 29 May 2026 04:01:21 -0700 639925 小米开源可控视频音效生成模型 ControlFoley，音效生成自己说了算！ http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247545981&idx=1&sn=e93e428883203c839a3b6f56f66cd77e Fri, 29 May 2026 04:01:20 -0700 639924 pyVideoTrans：17.6K Star！一键实现语音识别+翻译+配音+声音克隆！ http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247545975&idx=2&sn=4e1da7fdd87eb3b075d11af38eb5607e Fri, 29 May 2026 03:01:06 -0700 639917 语音/音频处理学术速递[5.29] http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247545975&idx=3&sn=b92610bcb635cfdf630c270a732e383e Fri, 29 May 2026 03:01:06 -0700 639916 面向多语种声纹验证的轻量化解耦框架：Dual-LoRA http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247545975&idx=1&sn=b1c12a5ceee789b12e97b96d36144e41 Fri, 29 May 2026 03:01:05 -0700 639915 Claude Opus 4.8实测封神！强到离谱，也贵到肉痛 http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247545966&idx=1&sn=6424479e7bc4129e78c05b3f8ff1aea7 Thu, 28 May 2026 22:53:10 -0700 639885 语音/音频处理学术速递[5.25] http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247545890&idx=3&sn=e0b4cab35a70ffd65a580ce22b3970cd Mon, 25 May 2026 03:01:02 -0700 638482 从搜索到聊天：AI时代重新审视语音交互这件事 http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247545890&idx=2&sn=dda0e0104d1576d8c0488ec4600a1993 Mon, 25 May 2026 03:01:01 -0700 638481 第一期 | ACL 2026 论文预讲会（武汉大学国家网络安全学院多媒体安全实验室） http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247545890&idx=1&sn=ac49d998d063986f559b8707f4150b5c Mon, 25 May 2026 03:01:01 -0700 638478 NTU、NUS、上海AI Lab联合开源 Mega-ASR：刷新真实世界高噪语音识别纪录，复杂环境相对 SOTA 降 WER 超 30%，消费级显卡可跑 http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247545879&idx=1&sn=fe10836173b15a5317c321ecd7731dab Fri, 22 May 2026 19:01:10 -0700 637719 MeanAudio：单步生成！100 倍加速！首个 MeanFlow 文本转音频模型重磅开源 http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247544976&idx=2&sn=9be632d0d04c1d2747e4e5e8bce5dbaf Mon, 13 Apr 2026 03:00:45 -0700 633087 语音/音频处理学术速递[4.13] http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247544976&idx=3&sn=aadf8a8d0daa937374abf382f95ac949 Mon, 13 Apr 2026 03:00:45 -0700 633086 【征稿启事】第十五届中文口语语言处理国际研讨会 (ISCSLP 2026) 邀您相聚马来西亚槟城！ http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247544976&idx=1&sn=dc1d49eec285190f0da066086a7d3969 Mon, 13 Apr 2026 03:00:44 -0700 633073 语音/音频处理学术速递[3.30] http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247544680&idx=3&sn=481e008444f526046928f2e85b3151c9 Mon, 30 Mar 2026 03:08:39 -0700 630630 Suno 5.5 发布允许用户克隆声音演唱 AI 生成歌曲 http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247544680&idx=2&sn=1284d747138a494153c7b44722c8f1dc Mon, 30 Mar 2026 03:08:39 -0700 630628 ICASSP 2026｜MeanVC：基于平均流的轻量级流式零样本语音转换 http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng%3D%3D&mid=2247544680&idx=1&sn=be550df1d0c4764a623a4e5619f39e72 Mon, 30 Mar 2026 03:08:38 -0700 630627 基于WeNet的关键词识别WeKws - WeNet keyword spotting-3-其他模型构造 http://mp.weixin.qq.com/s?__biz=MzU4MTA0NDE5NQ%3D%3D&mid=2247496939&idx=4&sn=4c3d2acbdfdc05231161c62acf39168a Fri, 29 Jul 2022 19:00:39 -0700 629374 基于WeNet的关键词识别WeKws - WeNet keyword spotting-2-TCN模型forward http://mp.weixin.qq.com/s?__biz=MzU4MTA0NDE5NQ%3D%3D&mid=2247496939&idx=3&sn=5413692e8dbce0dac27cf24ffdebcc23 Fri, 29 Jul 2022 19:00:39 -0700 629373 基于WeNet的关键词识别WeKws - WeNet keyword spotting-1-TCN模型构造 http://mp.weixin.qq.com/s?__biz=MzU4MTA0NDE5NQ%3D%3D&mid=2247496939&idx=2&sn=ca269d2d65c22a3fe7d09bb940224870 Fri, 29 Jul 2022 19:00:39 -0700 629372 INTERSPEECH 2022论文解读｜Paraformer: 高识别率、高计算效率的单轮非自回归端到端语音识别模型 http://mp.weixin.qq.com/s?__biz=MzU4MTA0NDE5NQ%3D%3D&mid=2247496939&idx=1&sn=5aedc86899d5064fcb27583bf5c00180 Fri, 29 Jul 2022 19:00:38 -0700 629362 极速上手新一代 Kaldi 服务端框架 sherpa http://mp.weixin.qq.com/s?__biz=MzU4MTA0NDE5NQ%3D%3D&mid=2247496610&idx=2&sn=702413199010b8b2fff18c109b6eacbf Wed, 20 Jul 2022 03:30:47 -0700 629361 端到端语音识别应用基于前缀树的热词技术 http://mp.weixin.qq.com/s?__biz=MzU4MTA0NDE5NQ%3D%3D&mid=2247496610&idx=1&sn=f61290bb301a4cae89ccf0e40462b301 Wed, 20 Jul 2022 03:30:46 -0700 629360 论文分享|腾讯音乐天琴实验室两篇论文入选国际会议INTERSPEECH http://mp.weixin.qq.com/s?__biz=MzU4MTA0NDE5NQ%3D%3D&mid=2247496482&idx=2&sn=8251ff59810cd7db14a5d62ee06edff0 Sat, 16 Jul 2022 03:30:47 -0700 629359 IEEE TPAMI | 火山语音提出多源迁移高斯回归模型，效果超越多个SOTA方法 http://mp.weixin.qq.com/s?__biz=MzU4MTA0NDE5NQ%3D%3D&mid=2247496482&idx=1&sn=b7c7abc9be451939e252f3ca4f46f2dd Sat, 16 Jul 2022 03:30:46 -0700 629358 论文推介：语音指令识别中的最小序列混淆错误准则 http://mp.weixin.qq.com/s?__biz=MzU4MTA0NDE5NQ%3D%3D&mid=2247496436&idx=2&sn=4c37d9c3083c1b4f606acc6491028fd4 Thu, 14 Jul 2022 03:31:23 -0700 629357 【语音之家】AI产业沙龙—智能语音技术在美团的应用实践 http://mp.weixin.qq.com/s?__biz=MzU4MTA0NDE5NQ%3D%3D&mid=2247496436&idx=1&sn=40ec5d167c75a93276ca51afe2e2de73 Thu, 14 Jul 2022 03:31:23 -0700 629338 字节跳动 AI Lab 总监李航：语言模型的过去、现在和未来 http://mp.weixin.qq.com/s?__biz=MzU4MTA0NDE5NQ%3D%3D&mid=2247496373&idx=2&sn=281711deeff01720fb00eaf50344fd8f Tue, 12 Jul 2022 03:31:40 -0700 629337 新一代 Kaldi 中基于量化的蒸馏实验 http://mp.weixin.qq.com/s?__biz=MzU4MTA0NDE5NQ%3D%3D&mid=2247496373&idx=1&sn=83341a63d8450889c0439a6b92644625 Tue, 12 Jul 2022 03:31:40 -0700 629336 AIWIN 2022丨文本语音驱动数字人表情口型竞赛 http://mp.weixin.qq.com/s?__biz=MzU4MTA0NDE5NQ%3D%3D&mid=2247496327&idx=2&sn=d9320e99fe006766b6ecb6582c6d0e2c Sat, 09 Jul 2022 04:02:16 -0700 629334 论文分享丨NPU-ASLP实验室将携14篇论文参加语音旗舰会议INTERSPEECH2022 http://mp.weixin.qq.com/s?__biz=MzU4MTA0NDE5NQ%3D%3D&mid=2247496327&idx=1&sn=3934c9f011515101c700ae336e417155 Sat, 09 Jul 2022 04:02:16 -0700 629333