Metadata-Version: 2.1
Name: aukit
Version: 1.4.2
Summary: audio toolkit
Home-page: https://github.com/KuangDD/aukit
Author: kuangdd
Author-email: kuangdd@foxmail.com
License: UNKNOWN
Platform: UNKNOWN
Classifier: Intended Audience :: Developers
Classifier: Topic :: Software Development :: Build Tools
Classifier: License :: OSI Approved :: MIT License
Classifier: Programming Language :: Python :: 3.5
Classifier: Programming Language :: Python :: 3.6
Classifier: Programming Language :: Python :: 3.7
Classifier: Operating System :: OS Independent
Requires-Python: >=3.5
Description-Content-Type: text/markdown
Requires-Dist: librosa
Requires-Dist: pydub
Requires-Dist: scipy
Requires-Dist: numpy
Requires-Dist: dotmap


![aukit](aukit.png "aukit")

## aukit
audio toolkit: 语音和频谱处理的工具箱。

### 安装

```
pip install -U aukit
```

- 注意
    * 可能需另外安装的依赖包：tensorflow, pyaudio, sounddevice。
    * tensorflow<=1.13.1
    * pyaudio暂不支持python37以上版本直接pip安装，需要下载whl文件安装，下载路径：https://www.lfd.uci.edu/~gohlke/pythonlibs/#pyaudio
    * sounddevice依赖pyaudio。
    * aukit的默认音频采样率为16k。

### v1.4.1
- 修正安装依赖报错的bugs。
- set系列改为convert系列，如set_sample_rate改为convert_sample_rate。
- Dict2Obj用dotmap模块的DotMap代替。

### v1.4.0
- 增加音频格式转换方法。
- 命令行批量处理语音，支持音频播放、语音降噪、音频格式转换。
- 增加命令行工具：auplay, aunoise, auformat。
- 调整日志输出方法。

### v1.3.12
- 减少不必要的依赖，最低依赖只保留pydub,  scipy, numpy, librosa。

### 版本
v1.4.2

### audio_cli
命令行，播放音频，去除背景噪声，音频格式转换。
支持递归处理文件夹内的全部音频。

#### 命令行

##### **说明**

- 用位置参数来控制。
- 名称说明
    * inpath：输入音频路径或目录。
    * outpath：输出音频路径或目录，如果为目录，则输出的子目录按照inpath的子目录格式输出。
    * sr：音频采样率，默认16000或自动识别采样率。
    * in_format：输入音频格式，主要用以限制为指定后缀名的文件，如果不设置，则处理目录的全部文件。
    * out_format：输出音频格式，主要用以音频格式转换，设置输出音频的后缀名。
- 中括号【[]】里面的是可选参数。

#### **工具**
- auplay: 播放音频

```
auplay inpath [sr] [in_format]
```

- aunoise: 语音降噪

```
aunoise inpath outpath [in_format]
```


- auformat: 音频格式转换

```
auformat inpath outpath out_format [in_format]
```




### audio_changer
变声器，变高低音，变语速，变萝莉音，回声。

### audio_editor
语音编辑，切分音频，去除语音中的较长静音，去除语音首尾静音，设置采样率，设置通道数。
音频格式相互转换，例如wav格式转为mp3格式。
切分音频，去除静音，去除首尾静音输入输出都支持wav格式。
语音编辑功能基于pydub的方法，增加了数据格式支持。

### audio_griffinlim
griffinlim声码器，线性频谱转语音，梅尔频谱转语音，TensorFlow版本转语音，梅尔频谱和线性频谱相互转换。

### audio_io
语音IO，语音保存、读取，支持wav和mp3格式，语音形式转换（np.array,bytes,io.BytesIO），支持【.】操作符的字典。

### audio_noise_remover
语音降噪，降低环境噪声。

### audio_normalizer
语音正则化，去除音量低的音频段（去除静音），调节音量。
语音正则化方法基于VAD的方法。

### audio_player
语音播放，传入文件名播放，播放wave数据，播放bytes数据。

### audio_spectrogram
语音频谱，语音转线性频谱，语音转梅尔频谱。

### audio_tuner
语音调整，调整语速，调整音高。

### audio_world
world声码器，提取语音的基频、频谱包络和非周期信号，频谱转为语音。调音高，调机器人音。


