
为完整记录神山风貌与相关文化活动,团队多次在冬季进驻拍摄。极端低温环境下,队员需携带氧气瓶开展拍摄工作,设备因低温失灵时需反复调试,车辆发生故障后则合力救援。著名演员、导演范雨林受邀参与项目,他克服高原反应,跟随当地老人学习纺线、诵经,并完成转山相关拍摄,同时担任该片导演。范雨林介绍,选择冬季拍摄是为捕捉神山最本真的冬日景象,独特的过年气氛,团队希望通过实际行动推动文化传承,目前其参与已为纪录片带来更多关注。
记者本日(26日)获悉,上海交通大学结伴业界研发的具身智能测评集GM-100告示开源,旨在为推测机器东谈主“大脑”(智能模子)与“躯壳”(物理奉行)的协同能力,提供一个更系统、怒放且可复现的评估基准。后续,国内多个具身智能大模子将引入该测评集进行“跑分”测试。
刻下,具身智能本融会线尚处各抒己见期,数据集开辟穷乏和洽尺度。GM-100测评集超过于给具身智能出了一套上海版“统考卷”,为国内具身智能评价体系补皆短板。
不盲目追求任务量
据悉,GM-100测评集包含了100个具体任务,共计1.3万条操作轨迹数据,界限可不雅。名堂牵头东谈主、上海交通大学副西宾李永露合计,在刻下探讨阶段,高质料的数据集和评测体系对科研的孝顺至关进犯,优化数据散布能灵验股东模子能力越过。因此,与其单纯追求任务的数据量,该测评集更强调任务联想的广度与评估体系的深度。
记者从探讨团队了解到,GM-100测评集在联想任务时,当先分析东谈主类与物体交互的基本原语(不能分割的请示),再行使大说话模子生成多数候选任务,再经民众筛选优化,最终变成涵盖从浅薄浅薄操作到萧疏复杂场景的100项任务。
此外,该测评集在传统的任务得胜率除外,引入了两项关节缱绻。一是部分得胜率,用于量化多步伐任务中,子步伐的完成情况,幸免“非全即无”的刻薄判断;二是算作预计误差,即推测模子在濒临新情况时算作师法的精度。
研发团队对人人主流模子测试遵守走漏,GM-100测评集的任务联想难度合理,在不同机器东谈主平台上均可奉行且具备分歧度,免息炒股配资评估遵守在不同硬件间也阐扬出知道的泛化性,为跨平台模子能力比拟提供了可靠参考。
现在,测评集所有100个任务的详备诠释、所需物料清单均已开源,还为每个任务上传了约130条真确机器东谈主操作轨迹数据。“咱们以致公布了具体物料的购买聚首,尽可能裁汰开辟者的复现与参与门槛,让更多东谈主能在团结基准上开展测试。”探讨团队阐扬东谈主告诉记者。
补皆评价体系短板
刻下,具身智能领域评测尺度分散且不和洽,各团队自建尺度,持取、旅途经营等侧要点也各不疏导,且多局限于高频浅薄场景。跟着本领越过,旧有基准的分歧度着落,难以反馈复杂环境下的中枢挑战,行业穷乏公认的客不雅参照。
智元机器东谈主正在展示。
“现存具身智能模子结构的泛化能力已显不及,需进行结构性改进,在数据层面,大界限、高质料数据的汇聚与评估也曾行业瓶颈。”宇树董事长王兴兴在外滩大会、进博会等多个形式公开示意,刻下具身智能的制约身分主淌若模子架构和数据质料。
为此,上海正勤勉通过具身数据和模子能力双维度,找到具身智能行业的破局之谈。
在数据方面,智元机器东谈主率先建成人人首个数采超等工场,还开源了包含百万条真机数据的AgiBot World数据集。智元具身业务部总裁姚卯青示意,该数据集提供了工业级高质料数据撑持,包含百万条机器东谈主数据轨迹,每条数据都经由多轮审核,确保场景迫临施行、任务复杂种种。
此外,国地中心和浦江实验室结伴团队经营完成2500万组整机数据累积,数据界限达到谷歌同类数据集的10倍。1月22日,上海库帕念念科技与它石智航告示共建“具身数据星火经营”,股东罢了亿小时级别的数据通顺界限。
在模子方面,2025年3月,智元发布人人首个通器具身基座大模子智元GO-1,会通多模态大模子(VLM)与搀和民众系统(MoE),支柱不同实质平台数据汇聚和部署。上海具识智能还自主研发了天下首个具身智能操作系统InsightOS,在智能制造产线部署、忠良农业功课等产业场景得回应用。
优配网官网在此基础上,GM-100测评集的出现,则为上海乃至国内的具身智能评价体系补皆了短板。
“咱们的标的并非树立一个统统公谈的物理测试环境,而是打造一个怒放、透明、可复现的评测平台。”该阐扬东谈主示意,通过提供尺度化的“考题”(任务)、详备的“熟练诠释”(开源贵府)和机动的“阅卷尺度”(多维缱绻),勤勉成为一张具身智能模子的“统考卷”配资宝,不仅有助于横向比拟模子性能,更通过题目竖立界说行业的中枢能力与前沿问题。
信钰配资优配官网联丰优配天元优配胜亿优配智慧优配提示:文章来自网络,不代表本站观点。