Sono

AI 音频检测与修复工具

功能

AI 检测: 独立检测页面，检测音频是否由 AI 生成，支持 v1.0/v1.1/v1.2 三版本算法，A/B 对比分析
音频修复: 修复 AI 音频的常见问题（毛刺、撕裂、数字伪影等），支持 v1.0~v2.4a 多版本算法
智能缓存: 上传层按文件 hash 去重，修复结果按文件+算法+参数三重匹配命中，避免重复上传和冗余计算
任务取消: 全栈取消机制（前端按钮 + 后端 cancel_task），卡住任务可随时终止
AB 对比: 独立对比页面，播放服务器缓存的原始与修复后音频，实时切换对比
后端处理: Python 后端高性能处理（numpy+scipy 自研 DSP），流式频谱处理支持 60min 音频 @ 4GB RAM
实时进度: WebSocket 实时推送任务进度，自动降级到 HTTP 轮询
Android 支持: 通过 Termux 在 Android 设备上运行完整后端

技术栈

前端: React + TypeScript + Vite + Tailwind CSS
后端: Python 3.10+ (pyright strict mode 类型检查) + FastAPI + SQLite + WebSocket
音频处理: Web Audio API / NumPy + SciPy (librosa 已移除，使用自研 dsp_utils)
包管理: uv（桌面端）/ pkg + pip（Android）
类型检查: pyright strict mode（核心基础设施），算法模块按需降级

快速开始

前置要求

Node.js >= 18
Python >= 3.10
uv（推荐）或 pip

安装 uv

# macOS / Linux
curl -LsSf https://astral.sh/uv/install.sh | sh

# Windows
powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex"

安装前端依赖

npm install

启动开发服务器

npm run dev

启动后端服务（桌面端）

cd backend
uv venv .venv
source .venv/bin/activate  # Windows: .venv\Scripts\activate
uv pip install -r requirements.txt
python main.py

后端启动后访问 http://localhost:8000，API 文档 http://localhost:8000/docs

PM2 进程管理（可选）

如需使用 PM2 管理后端进程：

# 确保已安装 PM2
npm install -g pm2

# 启动后端（项目根目录）
pm2 start ecosystem.config.cjs

# 查看状态
pm2 status

# 重启
pm2 restart sono-backend

# 停止
pm2 stop sono-backend

注意：ecosystem.config.cjs 已从 .gitignore 中移除，请根据需要修改其配置。

构建生产版本

npm run build

Android (Termux) 部署

详细指南请参阅 docs/android.md。

快速部署

从 GitHub Releases 下载 release_android.tar.gz
传输到手机，在 Termux 中执行：

tar -xzf release_android.tar.gz && cd sono-android && bash setup_android.sh

之后每次启动：cd sono-android && ./start_android.sh
手机浏览器访问 http://localhost:8000

本地打包

npm run build
bash scripts/build_android_release.sh

与桌面端的差异

特性	桌面端	Android
包管理	uv + venv	pkg + pip（系统级）
numpy/scipy	pip 预编译 wheel	pkg 预编译
noisereduce	可用	不可用，回退内置频谱算法
pedalboard	可用	不可用，回退 scipy 滤波算法
librosa	可用(仅训练)	不需要，已用自研 dsp_utils 替代
前端访问	开发服务器	FastAPI 静态文件服务

使用说明

上传音频文件（支持 WAV、MP3、FLAC 等格式）
查看 AI 检测分析结果
选择修复算法版本和修复模式
应用修复并对比前后效果
下载修复后的音频文件

版本说明

AI 检测版本

v1.0: 基础 AI 检测算法
v1.1: 多维特征分析 + 混合创作判定
v1.2: 增强版特征分析，更精准的 AI 检测

修复算法版本

v1.0: 基础修复算法，稳定可靠
v1.1: 多频段压缩、自适应降噪、响度归一化（pedalboard 可选，缺失时自动降级到 scipy）
v1.2: 深度学习辅助修复、智能谐波增强、自适应响度优化
v2.0: 移动端优化版，自适应采样率，频域合并优化
v2.1: 移动端优化升级版，增强降噪和清晰度
v2.2: 频谱超分辨率 + 谐波增强 + 位深增强，完整处理管线
v2.2a: v2.2 轻量版，减少峰值内存占用
v2.3: 子带处理 + 频谱分组优化，更精细的频域控制
v2.3a: v2.3 轻量版，流式频谱处理，60min 音频 @ 4GB RAM
v2.4: 增强频谱修复 + 自适应多频段压缩
v2.4a: v2.4 轻量版，当前推荐版本

最近更新 (2026-05-11)

AI 检测独立页面 + 浏览器修复移除

AI 检测功能独立为专属页面，支持本地文件与服务端音频 A/B 对比分析，检测时间可追溯
移除浏览器修复通道及 Web Worker（后端修复速度和质量已全面超越浏览器端 DSP）
移除 audioRepairWorker.ts（889 行 JS DSP）、highFrequencyEnhancer.ts、DownloadButton.tsx 等死代码
简化 PlayMode 类型、DownloadModal、AudioPlayer 等组件，移除浏览器分支

即时播放 + 频谱优化 (2026-05-10)

修复播放闭包过期导致 streaming 播放失效的根因问题，大文件加载后可立即播放
频谱从128段精简至32段并增加频率/分贝坐标刻度，90fps 流畅渲染
服务器数据独立获取，后端连接即获取内存/存储信息
音频卡片解析时顺时针渐变高亮动画；解析中替换文件增加取消令牌保护

修复算法 v2.2~v2.4a (2026-05-07 前)

v2.2/v2.2a: 频谱超分辨率 + 谐波增强 + 位深增强
v2.3/v2.3a: 子带处理 + 流式频谱处理，60min 音频 @ 4GB RAM
v2.4/v2.4a: 增强频谱修复 + 自适应多频段压缩，当前推荐版本

项目结构

.
├── src/                    # 前端源代码
│   ├── components/         # React 组件
│   ├── hooks/             # 自定义 Hooks
│   ├── pages/             # 页面组件
│   ├── services/          # API 服务 + WebSocket
│   └── utils/             # 工具函数
├── backend/               # 后端源代码
│   ├── api/              # API 路由（含 WebSocket）
│   ├── services/         # 业务逻辑
│   │   ├── ws_manager.py # WebSocket 连接管理器
│   │   └── ...           # 音频处理服务
│   ├── training/         # 训练工具
│   ├── requirements.txt        # 桌面端依赖
│   └── requirements_android.txt # Android 依赖
├── scripts/              # 开发构建脚本
│   ├── build_android_release.sh  # PC端打包Android发布包
│   └── build_android.sh          # Termux端完整构建部署
├── deploy/               # 运行时部署脚本（打包进Android发布包）
│   ├── setup_android.sh  # Termux 一键部署
│   └── start_android.sh  # Termux 启动脚本
├── docs/                 # 文档
│   └── android.md        # Android 部署详细指南
├── pyproject.toml        # Python 类型检查配置 (pyright strict)
├── public/               # 静态资源
└── dist/                 # 构建输出

许可证

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 368 Commits
.github/workflows		.github/workflows
.trae		.trae
backend		backend
deploy		deploy
docs		docs
public		public
scripts		scripts
src		src
tests/e2e		tests/e2e
.env.example		.env.example
.gitignore		.gitignore
README.md		README.md
debug_exact.py		debug_exact.py
debug_hf_noise.py		debug_hf_noise.py
debug_steps.py		debug_steps.py
dev.sh		dev.sh
ecosystem.config.cjs		ecosystem.config.cjs
eslint.config.js		eslint.config.js
index.html		index.html
package-lock.json		package-lock.json
package.json		package.json
playwright.config.ts		playwright.config.ts
postcss.config.js		postcss.config.js
pyproject.toml		pyproject.toml
release_android.tar.gz		release_android.tar.gz
tailwind.config.js		tailwind.config.js
test_param_integration.py		test_param_integration.py
test_v22.py		test_v22.py
test_v32_params_complete.py		test_v32_params_complete.py
tsconfig.json		tsconfig.json
vite.config.ts		vite.config.ts

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Sono

功能

技术栈

快速开始

前置要求

安装 uv

安装前端依赖

启动开发服务器

启动后端服务（桌面端）

PM2 进程管理（可选）

构建生产版本

Android (Termux) 部署

快速部署

本地打包

与桌面端的差异

使用说明

版本说明

AI 检测版本

修复算法版本

最近更新 (2026-05-11)

AI 检测独立页面 + 浏览器修复移除

即时播放 + 频谱优化 (2026-05-10)

修复算法 v2.2~v2.4a (2026-05-07 前)

项目结构

许可证

About

Uh oh!

Releases 1

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Sono

功能

技术栈

快速开始

前置要求

安装 uv

安装前端依赖

启动开发服务器

启动后端服务（桌面端）

PM2 进程管理（可选）

构建生产版本

Android (Termux) 部署

快速部署

本地打包

与桌面端的差异

使用说明

版本说明

AI 检测版本

修复算法版本

最近更新 (2026-05-11)

AI 检测独立页面 + 浏览器修复移除

即时播放 + 频谱优化 (2026-05-10)

修复算法 v2.2~v2.4a (2026-05-07 前)

项目结构

许可证

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages