仅使用python+numpy实现的逻辑回归模型
数据集在dataset目录下,分为下面三个文件
-
trainset.json: 内包含训练集数据,由1000条数据组成的列表,每条数据由一组输入数据和一个label值,输入数据为一个长度为9的数组,label为0则代表该输入数据属于第0类,label为1则代表该输入数据属于第1类。
-
devset.json: 内包含验证集数据,格式同trainset.json,由200条数据组成的列表,每条数据由一组输入数据和一个label值,输入数据为一个长度为9的数组,label为0则代表该输入数据属于第0类,label为1则代表该输入数据属于第1类。
-
testset.json: 内包含测试数据,是一个由100条测试数据组成的二维数组,形状为[100,9]
本模型将会采用 梯度下降法 训练一个逻辑回归模型,并使用此模型对testset.json中的数据进行预测。
在完成函数拟合后,将会使用得出的二分类模型对testset.json中的100条测试数据进行预测,并将此文件补充为与trainset.json相同格式的文件。
本算法只会采用python的numpy库自行实现模型的训练和测试。