4分 给出将你身边的事物(运动、游戏)抽象成为状态
用中文写出伪代码 修改search.py中的不同Algorithm 寻找:第二问需要修改的地方
6分:深度优先搜索 DFS(Stack实现) 6分:广度优先搜索 BFS(Queue实现) 6分:一致代价搜索UCS(Priority Queue实现) 6分:A star 搜索
修改search agent中的corner problem 寻找:第三问需要修改的地方
6分:Corners Problem:用DFS吃掉角落的豆
6分:Corners Problem:Heuristic
All the dots
次优搜索 Suboptimal Search
mnist-NN中给出tf实现的简单CNN结构,本体要求尝试使用PAC对图片进行降纬,后使用卷积神经网络的AlexNet架构进行识别,其中激活函数自己确定
需要完成的工作 0. 将所给的tensor flow代码转换成为PyTorch,完成PAC+LeNet-5训练和识别 (2) 2. 如果使用dropout和relu在LeNet-5会提升效果吗?尝试AlexNet (2) 3. 简化模型来加快训练速度 (2) 4. 设计更好的模型可以使用在28*28的模型中,对比0,1,2,3四种模型效果 ;利用PPT绘制模型的输入输出(2) 5. 前后的图片可视化处理 (2)
nlp中的prebert.ipynb给出完整的过程,要求完善model和训练过程的函数
(5) 去除语气词,给出词云图,对文本进行简单的分析
(5)利用pre-train的权重实现文本情感分析
实现complaints下的时刻表文本分析
(3) 理解GAN文件夹下的文件和结果,实现DCGAN的训练过程
(3)尝试观察得到model collapse的方法
并写出文献给出常见的解决方法
(4)利用下列模型修改baseline,对模型进行一些调整
LSGAN
SNGAN
(10) 阅读下列论文,总结DQN的不同trick Rainbow: Combining Improvements in Deep Reinforcement Learning.
(10)下列给出Highway-env的DQN网络的框架,修改输入算法CNN的框架 GitHub - Farama-Foundation/HighwayEnv: A minimalist environment for decision-making in autonomous driving
比较不同决策策略、奖励函数;输出决策轨迹
- 比如修改决策频率
- 根据交通知识修改奖励函数
- 输出可视化的决策轨迹