fbank介绍

fbank介绍

币团交易所
2023-08-21
栏目：区新闻
--
APP下载

Mel-frequency cepstral coefficients（MFCCs）和其它特征的组合称为 MSFBank，是一种通过离散余弦变换和限制滤波器组被用来提取音频的频率图特征的技术。MFCCs是一种常见的音频处理算法，它根据人耳的听觉特性分析声音特征，从而实现自动识别不同语音，并且可用来建立语音识别系统。

MSFBank是一种频谱图特征提取方法，它使用了一种称为节点分布函数（NDF）的函数来描述声音的波形，这一函数由一系列等间距并行滤波器组的输出构成。它使用了一系列在频率上某种方式特定分布（特别是在活动噪声区域）的NDF节点，输出的频谱图包含整个频谱范围所有频率。

该方法还可以用离散余弦变换（DCT）转换为MFCCs，包括语音信号的频率幅值量化，即把音频信号的波形投影到一系列正弦函数上，并在每一个余弦函数上取样，从而提取出一系列特征值的MFCCs系统组，来表达人类语言的特性，并且信息的失真度又能比较小。MFC Banks可以用来表示语音的变化特性，以及语音数据的统计纹理，有利于识别的准确性和压缩方面。

MSFBank最大的优点之一是它需要很少的处理时间，而且它可以从间隔数据中提取有用信息。其核心思想在于将声音信号分解为一系列特定类型的频谱图，这种技术可以被用来提取信号的频域特征。因为它可以只使用几个特征，就能够准确地获得语音的信息。在这方面，它有着不错的表现，并有可能在语音识别领域得到更多的应用。

fbank介绍

本文来源： 币团交易所

声明：本文由入驻区块链网的作者撰写，观点仅代表作者本人，绝不代表区块链网赞同其观点或证实其描述。

提示：投资有风险，入市须谨慎。本资讯不作为投资理财建议。

侵权：如发现文章侵权或者资讯不实，请发电邮jubao@qklw.com举报，平台查证后将第一时间处理。

关于区块链网发文章的介绍：

一、用户根据资质共为分五级：由低到高为C级、B级、A级、A+级、A++级，每天对应的免费发文数量为：3篇、5篇、20篇、40篇、100篇。
二、等级划分：个人用户初始为C级，企业用户初始为B级，个人用户和企业用户都根据文章质量晋升，企业用户晋升速度比个人用户快三倍，个人用户发布的文章不可顶置，不推荐第三方搜索引擎收录。
三、包含联络方式的文章（或者软文）只能发布在《企业快讯》频道下面的区新闻、区行情、区观察、区技术、区评分、区百科栏目里。
四、A级以下用户无法发布文章到区块链网的官方频道即：24小时快讯、打假、头条、百科频道。
五、文章至少一张图片（如果不上传封面，这张图片默认为封面），不可盗其它平台图片，但可以截图到本站，系统会自动上传。
六、发布优秀文章可以赚RMB，RMB可用于发布广告或软文，优秀文章指的是区块链业内新闻、打假资讯、技术分享、原创经验、百科知识等文章。
七、不管任何情况下，违反《平台协议》的文章将被删除，用户投诉经核实后亦会被删除。