频道

AI 投研

AI 赛道深度、公司拆解、概念解读和周报月报。

8.0 AI 投研 Tech Xplore AI
AI 投研

MIT researchers channel AI to turn hand gestures into robot training data

MIT研究团队开发了一套结合AI与超声波腕带的机器人训练新方案,通过佩戴腕带捕捉人体皮下肌肉、肌腱与韧带的运动,将手部手势转化为机器人训练数据,可帮助类人机器人解决抓取杯子等复杂操作任务,有望降低训练门槛与成本,相关信息

MIT researchers channel AI to turn hand gestures into robot training data
来源: Tech Xplore AI 8.0
AI Radar Summary

MIT研究团队开发了一套结合AI与超声波腕带的机器人训练新方案,通过佩戴腕带捕捉人体皮下肌肉、肌腱与韧带的运动,将手部手势转化为机器人训练数据,可帮助类人机器人解决抓取杯子等复杂操作任务,有望降低训练门槛与成本,相关信息来自Tech Xplore AI的报道。

8.0 AI 投研 EleutherAI Blog
AI 投研

RLHF and RLAIF in GPT-NeoX

本文来自EleutherAI官方博客,介绍该机构与SynthLabs合作后,开源大模型GPT-NeoX现已支持基于人类反馈强化学习(RLHF)与人工智能反馈强化学习(RLAIF)的训练后对齐微调。该更新可帮助开发者便捷地

RLHF and RLAIF in GPT-NeoX
来源: EleutherAI Blog 8.0
AI Radar Summary

本文来自EleutherAI官方博客,介绍该机构与SynthLabs合作后,开源大模型GPT-NeoX现已支持基于人类反馈强化学习(RLHF)与人工智能反馈强化学习(RLAIF)的训练后对齐微调。该更新可帮助开发者便捷地对GPT-NeoX进行针对性优化,提升模型输出与人类偏好、AI反馈标准的匹配度,属于AI大模型训练与对齐方向的研究进展。