-
Notifications
You must be signed in to change notification settings - Fork 1
/
publish.yaml
195 lines (173 loc) · 5.43 KB
/
publish.yaml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
Edition: 3.0.0
Type: Project
Name: start-llamaindex
Version: dev
Provider:
- 阿里云
Description: 基于 LlamaIndex 构建 RAG 应用
HomePage: https://www.serverless-devs.com
Tags:
- 大模型
- AIGC
Category: 人工智能
Service:
函数计算:
Authorities:
- AliyunFCFullAccess
Description: RAG 应用中业务逻辑执行用到的计算资源。包含:原始文档分割、在线业务问答、机器人聊天 UI 与 RAG 应用模型服务托管使用的 GPU 资源
云数据库RDS:
Authorities:
- AliyunRDSFullAccess
Description: RAG 应用中使用的数据库。默认类型:PostgreSQL16.0,实例规格:pg.x8.medium.1
对象存储:
Authorities:
- AliyunFCServerlessDevsRolePolicy
Description: 上传知识库的存储桶。知识库上传后会自动触发文档的分割与入库
日志服务:
Authorities:
- AliyunFCServerlessDevsRolePolicy
Description: 应用日志库。存储服务执行日志
专有网络:
Authorities:
- AliyunFCServerlessDevsRolePolicy
Description: 云数据库所在的专有网络
Effective: Public
Parameters:
type: object
additionalProperties: false
required:
- region
- projectname
- db_name
- db_database
- db_username
- db_password
- llm_model
- embedding_model
- embedding_instance_type
- llm_instance_type
- embedding_instance_count
- llm_instance_count
- offline_role
- model_type
- oss_trigger_role_arn
- oss_bucket
- oss_prefix
properties:
region:
title: 地域
type: string
default: cn-hangzhou
description: 应用所在的地区
required: true
enum:
- cn-hangzhou
projectname:
title: 项目名
type: string
default: rag_on_llamaindex_${default-suffix}
pattern: "^[a-zA-Z_][a-zA-Z0-9-_]{0,127}$"
description: 项目名称,只能包含字母、数字、下划线和中划线。不能以数字、中划线开头。长度在 1-128 之间
db_name:
title: 实例名称
type: string
default: llamaindex_pgsql_by_CAP_${default-suffix}
description: Postgresql 实例名称
db_database:
title: 数据库名称
type: string
default: llamaindex_rag_database
description: Postgresql 数据库名称
db_username:
title: 用户名称
type: string
default: cap
description: Postgresql 数据库用户名
db_password:
title: 密码
type: string
default: AwesomeCAP_2024
description: Postgresql 数据库密码
embedding_model:
title: 模型 ID
type: string
default: iic/nlp_corom_sentence-embedding_chinese-base
description: ModelScope 模型 ID, 可以在 https://modelscope.cn/models 模型页获取
enum: # TODO: add more enum models
- iic/nlp_corom_sentence-embedding_chinese-base
embedding_instance_type:
title: GPU 卡型
type: string
default: Tesla 系列
description: Tesla 系列默认规格为 GPU:16GB, CPU:8vcpu, Memory:32GB。部署完成后您可以在模型配置中更改资源规格。
enum:
- Tesla 系列
llm_model:
title: 模型 ID
type: string
default: llama3:8b
description: LLM 模型 ID, 默认使用 llama3:8b
enum:
- llama3:8b
llm_instance_type:
title: GPU 卡型
type: string
default: Tesla 系列
description: Tesla 系列默认规格为 GPU:16GB, CPU:8vcpu, Memory:32GB。Tesla 系列推理速度较慢,部署完成后您可以在模型配置中更改资源规格。
enum:
- Tesla 系列
embedding_instance_count:
title: 实例数
type: string
default: 1
description: 运行模型的实例数
llm_instance_count:
title: 实例数
type: string
default: 1
description: 运行模型的实例数
offline_role:
title: 离线任务执行需要角色
type: string
default: 'AliyunFCDefaultRole'
pattern: '^acs:ram::[0-9]*:role/.*$'
description: 函数中需要基于此角色拉取上传至 OSS 的知识库
required: true
x-role:
name: AliyunFCDefaultRole # 角色名
service: FC # 服务账号
authorities:
- AliyunOSSFullAccess
oss_invocation_role:
title: OSS 触发器角色
type: string
default: "aliyunosseventnotificationrole"
pattern: "^acs:ram::[0-9]*:role/.*$"
description: OSS 使用此角色来发送事件通知来调用函数
required: true
x-role:
name: aliyunosseventnotificationrole
service: OSS
authorities:
- AliyunFCInvocationAccess
oss_bucket:
title: 对象存储存储桶名
type: string
default: ""
description: 用于存放 RAG 知识库。文件上传至 OSS 后,将会自动触发 RAG 知识库向量化的过程
required: true
x-bucket:
dependency:
- region
oss_prefix:
title: 对象存储存储桶前缀
type: string
default: CAP/rag/llamaindex
description: 将文件上传至存储桶特定前缀时将自动执行知识库向量化过程
model_type:
title: 模型类型
type: string
default: modelscope
enum:
- modelscope
description: 模型类型,选择 modelscope 会基于 cap 托管的模型服务。部署完成后您可以根据使用说明在项目变量中配置