Metadata-Version: 2.1
Name: airda
Version: 0.0.3
Summary: airda
Author: hitsz-ids
Requires-Python: >=3.10,<4.0
Classifier: Programming Language :: Python :: 3
Classifier: Programming Language :: Python :: 3.10
Classifier: Programming Language :: Python :: 3.11
Classifier: Programming Language :: Python :: 3.12
Requires-Dist: fastapi (==0.99.0)
Requires-Dist: httpx (==0.24.1)
Requires-Dist: jieba (==0.42.1)
Requires-Dist: langchain (==0.1.0)
Requires-Dist: mysql-connector-python (>=8.3.0,<9.0.0)
Requires-Dist: openpyxl (==3.1.2)
Requires-Dist: overrides (==7.4.0)
Requires-Dist: pandas (==2.1.1)
Requires-Dist: prompt-toolkit (>=3.0.43,<4.0.0)
Requires-Dist: pyarmor (==7.7.4)
Requires-Dist: pydantic (==1.10.12)
Requires-Dist: pymongo (>=4.6.2,<5.0.0)
Requires-Dist: python-docx (==0.8.11)
Requires-Dist: python-dotenv (==1.0.0)
Requires-Dist: python-multipart (==0.0.6)
Requires-Dist: pyyaml (>=6.0.1,<7.0.0)
Requires-Dist: scikit-learn (>=1.4.1.post1,<2.0.0)
Requires-Dist: shortuuid (==1.0.11)
Requires-Dist: sql-metadata (==2.8.0)
Requires-Dist: sqlparse (==0.4.4)
Requires-Dist: torch (==2.0.1)
Requires-Dist: transformers (>=4.39.0,<5.0.0)
Requires-Dist: unstructured (==0.10.16)
Description-Content-Type: text/markdown

## 📖 介绍
airda(Air Data Agent)是面向数据分析的多智能体，能够理解数据开发和数据分析需求、理解数据、生成面向数据查询、数据可视化、机器学习等任务的SQL和Python代码。
### 特性：

- **精准数据检索**：airda具有强大的数据处理和搜索能力，可以从成百上千张表中精准找数，满足您在大数据环境下的数据查找需求。
- **业务知识理解**：airda不仅能处理数据，还深入理解数据指标、计算公式等业务知识，为您提供更深层次、更具业务价值的数据分析。
- **多智能体协同工作**：airda采用面向数据分析需求的多轮对话设计，多智能体可以协同工作，进行数据分析代码的self-debug，提升分析效率，降低错误率。
- **数据可视化**：airda可以将复杂的数据通过可视化的方式呈现，让数据分析结果更易于理解，帮助您更好地做出决策。
### airda工作流程：
- **需求确认：** airda与用户建立对话，理解用户的需求。在这一阶段，airda会提出一系列问题，以便更准确地了解用户的需求。
- **任务规划：** airda会根据最终确认的需求内容为用户制定任务规划。这个规划包括一系列步骤，airda会按照这些步骤来为用户提供服务。
- **任务执行：** airda将规划好的任务分配给不同的智能体，如数据查找智能体、SQL生成智能体、代码生成智能体、可视化分析智能体等。每个智能体负责其专业领域的任务执行，协同工作以确保任务的高效完成。
- **应用生成：** airda根据用户需求任务将结果数据转化为应用成果，如指标大屏展示、数据API服务和数据应用等，这些成果能够以可视化的形式展示关键数据指标，提供API接口供其他系统或服务调用，以及根据用户需求生成具体的应用程序。![image.png](https://cdn.nlark.com/yuque/0/2024/png/197719/1710300903035-88553d9f-c683-4495-b48a-21ac46ec9c15.png#averageHue=%23f8f8f7&clientId=u2097a547-b42e-4&from=paste&height=433&id=zTI5J&originHeight=866&originWidth=1880&originalType=binary&ratio=2&rotation=0&showTitle=false&size=365231&status=done&style=none&taskId=ua5950672-3b82-42fc-b39f-bcffdb77ff4&title=&width=940)

### 完成进度：

- [x] SQL生成
- [x] 数据接入
- [x] 知识库
- [ ] 语料库
- [ ] 图表生成
- [ ] 任务规划

## ✨ 快速开始

### 环境要求

Python>=3.10

### 安装 airda

pip安装

```
pip install airda -i https://pypi.python.org/simple/
```

### 依赖安装

使用airda需要用到mongodb,可采用docker安装mongodb

```
#拉取mongo镜像
docker pull mongo
docker run -itd --name mongo -v /{path_of_mongo_data}:/data/db -p 27017:27017 mongo

```

### 自定义配置

环境变量

下载https://github.com/hitsz-ids/airda/blob/main/.env.template文件,自定义embedding模型,mongo配置,以及openai配置

```
airda env load -p {your_path}/.env_template
```

日志文件（非必须）

下载https://github.com/hitsz-ids/airda/blob/main/log_config.yml.template文件,自定义日志配置

```
airda log load -p {your_path}/log_config.yml.template
```



### 相关配置命令

添加你的数据源
```
airda datasource add -n {datasource_name} -h {host} -p {port} -k MYSQL -d {database} -u {username} -w {password}
#当前只支持kind为MYSQL的数据源
```
训练数据源的schema

```
airda datasource sync -n {datasource_name}
```
查询当前可用的数据源
```
airda datasource ls
```

### 开始问答

```
airda run cli -n {datasource_name}
#输入你的问题:
```







## 👏 贡献

我们欢迎各种贡献和建议，共同努力，使本项目更上一层楼！麻烦遵循以下步骤：

- **步骤1：** 如果您想添加任何额外的功能、增强功能或在使用过程中遇到任何问题，请发布一个 [问题](https://github.com/hitsz-ids/SQLAgent/issues) 。如果您能遵循 [问题模板](https://github.com/hitsz-ids/SQLAgent/issues/1) 我们将不胜感激。问题将在那里被讨论和分配。
- **步骤2：** 无论何时，当一个问题被分配后，您都可以按照 [PR模板](https://github.com/hitsz-ids/SQLAgent/pulls) 创建一个 [拉取请求](https://github.com/hitsz-ids/SQLAgent/pulls) 进行贡献。您也可以认领任何公开的问题。共同努力，我们可以使airda变得更好！
- **步骤3：** 在审查和讨论后，PR将被合并或迭代。感谢您的贡献！

在您开始之前，我们强烈建议您花一点时间检查 [这里](https://github.com/hitsz-ids/SQLAgent/blob/developing/CONTRIBUTING.md) 再进行贡献。


