安装数据库相关报错
Autonomous Driving | Focal Loss for Dense Object Detection
提出一种处理不平衡类别的损失函数,对分类准确的样本小权重,给不确定的样本大权重。在保持检测速度的情况下(一阶段检测器),精确度达到二阶段检测器水平。
python多线程与多进程简易实现
近期需要提升代码运行效率,想通过多线程或多进程实现。一般来说,单进程程序运行起来会作为一个进程占用CPU资源,而一个进程可以包含1或多个线程。在多CPU核的机器上,线程之间可以并行执行,通过该方式可以提高代码运行效率。
使用Gperf查看模块函数级别CPU资源占用
查看C++程序函数级资源占用的方法。
Reinforcement Driving | Robust Reinforcement Learning using Offline Data
鲁棒强化学习可以形式化为一个最大值最小化问题,目标是学习最大化价值的策略,而不是不确定性集合中最差的可能模型。本文提出一个Robust Fitted Q-Iteration (RFQI)算法来应对离线数据收集、模型优化、无偏估计问题。
Reinforcement Driving | Mastering Atari, Go, chess and shogi by planning with a learned model
MuZero是AlphaGo Zero之上的第二次改进。第一次改进为AlphaZero,一个模型实现围棋、国际象棋、将棋的超人水平。此次在AlphaZero基础上,更是从棋类拓展到了更具有普遍意义的Atari游戏。
Reinforcement Driving | Mastering the game of Go without human knowledge
AlphaGo和AlphaGo Master之后的又一力作,不同于AlphaGo学习人类棋谱,利用人类先验知识,AlphaGo Zero完全自学,并在学习三天后超越了AlphaGo,40天超越了AlphaGo Master。
Autonomous Driving | Path Planning for Autonomous Vehicles in Unknown Semi-structured Environments
本文为其姊妹篇会议论文(Practical Search Techniques in Path Planning for Autonomous Driving)的扩展,时隔一年发表在机器人顶刊 IJRR 上,内容无太大变化。