Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

PaddleX 快乐开源活动 (2025 H1) #3557

Open
cuicheng01 opened this issue Mar 7, 2025 · 1 comment
Open

PaddleX 快乐开源活动 (2025 H1) #3557

cuicheng01 opened this issue Mar 7, 2025 · 1 comment
Assignees

Comments

@cuicheng01
Copy link
Collaborator

cuicheng01 commented Mar 7, 2025

📣PaddleX 快乐开源活动

旨在鼓励更多的开发者参与到飞桨低代码开发工具的开源建设中,帮助社区修复 bug 或贡献 feature,共建飞桨。

🌈命题任务

命题任务是我们总结整理PaddleX的需求得出,每个任务上标注了任务难度,大家可以选择参与。欢迎对这些需求感兴趣的开发者参与到这些任务的开发✌️✌️。在开发过程中,你能进行包括任务分解、代码撰写等工作,还会有飞桨的研发全程和你一起解决可能遇到的问题。还等什么,快来参与吧。🎉🎉

认领方式

请大家以 comment 的形式认领任务,如:

【报名】:1、3、2-3
  • 多个任务之间需要使用中文顿号分隔,报名多个连续任务可用横线表示,如 1-2
  • PR 提交格式:在 PR 的标题中以 【PaddleX No.xxx】 开头,注明任务编号

任务列表

PaddleX基础能力

mentor @changdazhou 1 @TingquanGao 2 @leo-q8 3 @zhangyubo0722 4、6 @BluebirdStory 5

序号 任务名称 任务类型 任务描述 难度 优先级 认领人/状态/PR号
1 PaddleX文档优化 文档建设 1. 优化PaddleX现有的文档文字描述,优化站点文档;2.整理和优化PaddleX的FAQ模块;3.增加VisualDL等文档的描述 🌟 P0
2 PaddleX推理能力测试 训推能力建设 基于PaddleX现有的单模型和模型产线,在不少于10种不同软硬件平台测试推理的功能稳定性和正确性 🌟 P0
3 OCR类产线的web端demo展示搭建 前后端开发 搭建不少于5个重要OCR类产线的web端demo应用 🌟 P0
4 OCR类模型的量化训练适配 训推能力建设 跑通不少于5个重要的OCR类模型的模型量化能力,精度和FP32对齐 🌟🌟 P1
5 数据标注流程打通 训推能力建设 将LabelStudio等标注软件和PaddleX现有的数据要求完全打通,可以产出符合PaddleX格式的标注数据,并打通自动化标注流程(包括加载PaddleX产出的模型权重或者预标注文件) 🌟🌟 P1
6 数据分析 训推能力建设 增强当前PaddleX的训练数据分析的分析能力,美化输出结果 🌟 P2

PaddleX特色能力

mentor @changdazhou 7 @TingquanGao 8、9

序号 任务名称 任务类型 任务描述 难度 优先级 认领人/状态/PR号
7 基于版面解析和大语言模型的文档翻译能力建设 特色能力 基于PaddleX版面解析V2产线,结合大语言模型,支持对文档图像的多语种翻译工作 🌟🌟 P0
8 基于版面解析的PDF转word能力建设 特色能力 基于PaddleX版面解析V2产线,支持将PDF转换为word 🌟🌟🌟 P1
9 基于版面解析的PDF转LaTex能力建设 特色能力 基于PaddleX版面解析V2产线,支持将PDF转换为LaTeX代码 🌟🌟🌟 P1

PaddleX部署能力

mentor @zhang-prog 10 @Bobholamovic 11、12

序号 任务名称 任务类型 任务描述 难度 优先级 认领人/状态/PR号
10 服务多语言调用示例完善 文档建设 补全产线使用教程中的C++、Java、Go等6种语言的服务调用示例。 🌟 P1
11 服务性能指标补充 文档建设 1. 测量服务的QPS、峰值内存占用、CPU利用率、GPU利用率等性能指标。包括两种服务化部署方案。 2. 将服务性能指标、最低硬件配置等信息补充到文档中。 🌟 P1
12 预训练模型下载功能建设 辅助功能 为PaddleX增加模型下载功能,支持将模块或产线使用的官方模型下载到指定位置。 🌟 P1

PaddleX创意应用

mentor @Sunting78 13 @liu-jiaxuan 14 @Bobholamovic 15

序号 任务名称 任务类型 任务描述 难度 优先级 认领人/状态/PR号
13 文档理解/总结/智能问答 创意应用 结合PaddleX现有OCR、PDF转Markdown、视觉、语音识别等能力,和文心大模、DeepSeek等大模型做深度结合,打造有创意的应用,如解题助手、文档总结、文档转脑图等 🌟 P1
14 漫画册/带文字图像智能翻译 创意应用 结合PaddleX 通用OCR能力、版面解析能力,结合inpainting模型和大语言模型,实现对带文字图像、漫画等的端到端文字翻译能力 🌟🌟 P2
15 图像智能解译 创意应用 结合PaddleX 视觉类模型、多模态模型、大语言模型,实现垂类场景图像的高精度智能解译能力 🌟 P2

看板信息

任务方向 任务数量 提交作品 / 任务认领 提交率 完成 完成率
PaddleX 快乐开源活动 15 0 / 0 0.0% 0 0.0%

统计信息

排名不分先后

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
Status: In Progress
Development

No branches or pull requests

5 participants