Skip to content

🚀 专为大模型优化的文本预处理工具 | AI Text Optimizer for reducing LLM token consumption

License

Notifications You must be signed in to change notification settings

GaoSSR/AI-Text-Optimizer

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🚀 AI文本优化器 (AI-Text-Optimizer)

Python License Platform

一个专为大模型优化设计的文本预处理工具,通过去除文本中的空格和换行符,显著减少Token消耗,提高AI处理效率。

✨ 功能特点

  • 🎯 专为AI优化: 彻底去除文本中的所有空格,减少大模型Token消耗
  • 🖥️ 可视化界面: 基于tkinter的友好用户界面,操作简单直观
  • 📝 实时预览: 处理前可预览结果,确保符合预期
  • 🌍 全面支持: 支持中文、英文及各种特殊空格字符
  • 📊 效果统计: 显示处理前后字符数对比,直观展示优化效果
  • 💾 安全处理: 生成新文件,不覆盖原文件

🎬 效果演示

处理前:

这是 一个 包含 很多 空格 的 测试 文件。

文本 中 有 普通 空格、 全角空格 和    多个连续空格。

这些 空格 会 增加 大模型 的 Token 消耗。

处理后:

这是一个包含很多空格的测试文件。文本中有普通空格、全角空格和多个连续空格。这些空格会增加大模型的Token消耗。

优化效果: 节省 30-50% 的字符数,显著减少Token消耗!

🚀 快速开始

环境要求

  • Python 3.6 或更高版本
  • tkinter (通常随Python安装包含)

安装使用

  1. 克隆仓库

    git clone https://github.com/你的用户名/AI-Text-Optimizer.git
    cd AI-Text-Optimizer
  2. 运行程序

    python main.py

    或者双击 run.bat (Windows用户)

  3. 使用步骤

    • 点击"浏览"选择要处理的txt文件
    • 确保勾选"所有文字连在一起(推荐)"
    • 点击"预览处理结果"查看效果
    • 点击"处理并保存"生成优化后的文件

📁 项目结构

AI-Text-Optimizer/
├── main.py                 # 主程序文件
├── run.bat                 # Windows一键启动脚本
├── README.md              # 项目说明文档
├── LICENSE                # MIT开源协议
├── requirements.txt       # 依赖包列表
├── screenshots/           # 程序截图
└── examples/              # 示例文件
    ├── test_with_spaces.txt
    └── test_sample.txt

🎯 使用场景

  • 📚 AI训练数据预处理: 优化训练语料,减少无效Token
  • 🤖 ChatGPT/Claude输入优化: 减少API调用成本
  • 📝 文档处理: 清理文本格式,提高处理效率
  • 🔄 批量文本优化: 快速处理大量文本文件

🛠️ 技术实现

  • GUI框架: tkinter
  • 文本处理: 正则表达式 (支持Unicode字符)
  • 编码支持: UTF-8
  • 跨平台: Windows/macOS/Linux

📊 性能优化

优化项目 效果
普通空格去除 节省 20-30% 字符
全角空格处理 节省 10-15% 字符
换行符连接 节省 5-10% 字符
总体优化 节省 30-50% Token

🤝 贡献指南

欢迎提交Issue和Pull Request!

  1. Fork 本仓库
  2. 创建特性分支 (git checkout -b feature/AmazingFeature)
  3. 提交更改 (git commit -m 'Add some AmazingFeature')
  4. 推送到分支 (git push origin feature/AmazingFeature)
  5. 开启 Pull Request

📄 开源协议

本项目采用 MIT License 开源协议。

🙏 致谢

  • 感谢所有使用和贡献本项目的开发者
  • 特别感谢AI社区对文本优化需求的反馈

📞 联系方式

如有问题或建议,欢迎通过以下方式联系:


⭐ 如果这个项目对你有帮助,请给个Star支持一下!

About

🚀 专为大模型优化的文本预处理工具 | AI Text Optimizer for reducing LLM token consumption

Topics

Resources

License

Stars

Watchers

Forks

Packages

No packages published