Sources

人家养殖业,也需要深度学习 你们不了解而已 @辽宁-冰淇淋-暂无思路 老哥,你还是要多看论文,先弄懂强化学习是在干嘛,再去想创新点 我不知道找啥方向的看呀。。你现在提的东西都是没头没尾,大家都不知道你在说啥 那你搁这儿空想 [表情]因为我不知道找什么方向的看。 更不可能啊 我不是我没有空想,我的意思是说大家有没有知道这是属于什么方向的,我沿着这个方向大致去看。 人家每天就做这种活 可开心了 30多万 年薪 你现在说的这些大家都不知所云啊 根本看不懂你的创新点是在干啥 不是先想自己要做啥,才去看论文,这是本末倒置 有codebase+有熟练的本科生才能做到 [表情]这样子可以吗?范围好大呀 我每天在群里看到那么多新的名词。看不完的吧,得先找一个大致的方向。。你得先搞清楚研究热点啊 ε=(´ο`*)))唉 一些基础的算法,我现在基本快学完了。你买个GPT,有啥不会问他不就好了 你这样空想,大家都不知道你所说的方向是什么 想清楚要做RL应用还是RL算法 RL应用这块搜啥关键字呢。你们组做啥的就搜啥呗 [表情]我们组做cv的 做汽车就搜强化学习 汽车 我属于是离经叛道,背叛师门的。我也是背叛师门 @辽宁-冰淇淋-暂无思路 修改成组合优化问题就行了 遇事不决ppo 其他的是真的一点思路都没有,不知道咋办。只能想到一个,然后去看看能不能找到相关的方向。。 ppo加你的应用搞起来 谁给你安排去做强化学习的 你要是想找工作,就先看看哪些地方在用,能实习就先去实习 RL应用你应该把RL当成工具,找好应用场景,实在不行把工具换了 感觉你还是跟上课题组大部队好一点吧 CV找工作比强化学习好多了吧 吟唱:diffusion+robot投ICRA,CCFB [表情]好 你这句话玩刻在脑子里了 @北京-南瓜-rl 必要时可以考虑 @SWJTU—zx—汽车底盘控制 自己啊[表情]反正老师放养 你这…… 智能体训练不出来就老实了 @北京-南瓜-rl 你这倒提醒我了。或许我该去搜索一下游戏加rl有什么大致的方向? 强化学习落地太难了 @SWJTU—zx—汽车底盘控制 非常老实 这一块方向怎么样,我总感觉这种老牌方向是不是卷烂了? 谁说我们一定只会强化学习,我连cv都会 趁早转cv吧 学着学着,你发现,都会 这个倒没啥。。 推荐算法照样看完拿来借鉴 能不能一直待在自己的舒适区里面,总得多学点东西。 你就是干的少 多干点体力活 什么都会 大同小异,万变不离其宗 @辽宁-冰淇淋-暂无思路 智能体训练不出来就老实了 RL太难训了 我至今没训成功过 哎呀,训练不出来就换一个嘛 老哥什么方向 env FPS上不去,样本量不够 我td3可以训练出来,后面sac也训练出来了 或者你只是套路 没有深刻理解问题 后来sac更好用 RL对我来说是一个工具 不好用我就换imitation learning,diffusion policy [表情] 我也是工具 老哥干啥领域的? 具身 算法对比曲线,怎么弄出来的 gail我都已经复现好了,准备加进去 牛逼 算法对比曲线,都是怎么弄出来的 具身雀食是热门啊 几种强化学习算法对比曲线,都是怎么弄出来的 gail在我这个领域也是个大坑,github里面复现没几个能用的,还要自己捣鼓gan才复现出来 @浙江工业 图像 大佬搞了么 具身是什么方向 具身主要还是在做物体分拣抓取吗? 我就不是对比几种强化学习算法 我是应用 我从具身导航转到全身控制 rl落地派 抓取难做啊 主打一个毕业难 等于说你现在其实偏机器人运动学? @辽宁-冰淇淋-暂无思路 关注lifeifei songshuran Levine他们 @SWJTU—zx—汽车底盘控制 炼丹学 就是控制关节处的电机呗? 大概只做决策,不做控制 rl做精细控制不好做把 要用离散动作把 我看连续动作做不好控制电机 决策规划,手部路径吗? 差不多 几种强化学习算法对比曲线,都是怎么弄出来的 有没有大佬讲讲 你们课题组资金足啊 做具身的机器人平台不便宜吧? 我不到啊,我现在发的论文全是在simulator里 @湖南-强化学习控制 你的意思是用什么软件绘制的? [表情]之后要上真机,有点麻瓜 @北京-南瓜-rl 几种强化学习算法对比曲线,都是怎么弄出来的 真机和仿真之间是天堑啊 @北京-南瓜-rl 真机估计难 多聊点。我好观察一下 那要是训练过程的摇臂轨迹呢 一样的啊 你想要画什么信号,提取出来呀 每一集训练的操控对象过程数据 每一集,你确定吗? 一般训练一次至少几千集 就存最好的那一集 [表情] 那你就训练完单独跑一次就行了呗 @SWJTU—zx—汽车底盘控制 我也是这样想的 但是想问问大家伙有没有更好的 好麻烦啊 没有 四种算法 都是这么做的 这有啥麻烦的 [表情][表情][表情] 你之前没保存最优的 pokicy 的权重 一想起来就懒咋办 就四次而已 所以你就必须自己跑 4 次 然后绘制在同一张图上就好了 行吧,我不懒了 那这时候就要发挥一些软件工程设计的能力了 下午就搞 [表情][表情][表情] 你可以把这个单独设计为一个模块 讲道理,不难,甚至跑 4 次,途中可以摸鱼 有没有同款懒人,懒得跑来跑去的[表情] 然后你在相应代码直接把模块插进去,让他储存。

Podcast Editor
Podcast.json
Preview
Audio