一个专为大模型优化设计的文本预处理工具,通过去除文本中的空格和换行符,显著减少Token消耗,提高AI处理效率。
- 🎯 专为AI优化: 彻底去除文本中的所有空格,减少大模型Token消耗
- 🖥️ 可视化界面: 基于tkinter的友好用户界面,操作简单直观
- 📝 实时预览: 处理前可预览结果,确保符合预期
- 🌍 全面支持: 支持中文、英文及各种特殊空格字符
- 📊 效果统计: 显示处理前后字符数对比,直观展示优化效果
- 💾 安全处理: 生成新文件,不覆盖原文件
处理前:
这是 一个 包含 很多 空格 的 测试 文件。
文本 中 有 普通 空格、 全角空格 和 多个连续空格。
这些 空格 会 增加 大模型 的 Token 消耗。
处理后:
这是一个包含很多空格的测试文件。文本中有普通空格、全角空格和多个连续空格。这些空格会增加大模型的Token消耗。
优化效果: 节省 30-50% 的字符数,显著减少Token消耗!
- Python 3.6 或更高版本
- tkinter (通常随Python安装包含)
-
克隆仓库
git clone https://github.com/你的用户名/AI-Text-Optimizer.git cd AI-Text-Optimizer
-
运行程序
python main.py
或者双击
run.bat
(Windows用户) -
使用步骤
- 点击"浏览"选择要处理的txt文件
- 确保勾选"所有文字连在一起(推荐)"
- 点击"预览处理结果"查看效果
- 点击"处理并保存"生成优化后的文件
AI-Text-Optimizer/
├── main.py # 主程序文件
├── run.bat # Windows一键启动脚本
├── README.md # 项目说明文档
├── LICENSE # MIT开源协议
├── requirements.txt # 依赖包列表
├── screenshots/ # 程序截图
└── examples/ # 示例文件
├── test_with_spaces.txt
└── test_sample.txt
- 📚 AI训练数据预处理: 优化训练语料,减少无效Token
- 🤖 ChatGPT/Claude输入优化: 减少API调用成本
- 📝 文档处理: 清理文本格式,提高处理效率
- 🔄 批量文本优化: 快速处理大量文本文件
- GUI框架: tkinter
- 文本处理: 正则表达式 (支持Unicode字符)
- 编码支持: UTF-8
- 跨平台: Windows/macOS/Linux
优化项目 | 效果 |
---|---|
普通空格去除 | 节省 20-30% 字符 |
全角空格处理 | 节省 10-15% 字符 |
换行符连接 | 节省 5-10% 字符 |
总体优化 | 节省 30-50% Token |
欢迎提交Issue和Pull Request!
- Fork 本仓库
- 创建特性分支 (
git checkout -b feature/AmazingFeature
) - 提交更改 (
git commit -m 'Add some AmazingFeature'
) - 推送到分支 (
git push origin feature/AmazingFeature
) - 开启 Pull Request
本项目采用 MIT License 开源协议。
- 感谢所有使用和贡献本项目的开发者
- 特别感谢AI社区对文本优化需求的反馈
如有问题或建议,欢迎通过以下方式联系:
- 📧 Email: 2502682947@qq.com
- 🐛 Issues: GitHub Issues
⭐ 如果这个项目对你有帮助,请给个Star支持一下!