當前位置： OFweek 人工智能網 > 標簽 > ExGRPO

ExGRPO

最新資訊

ExGRPO 框架：經驗驅動學習，引領推理新范式

當人工智能模型仍以“刷題+打分”為主流訓練模式時，一支來自上海人工智能實驗室、澳門大學、南京大學與香港中文大學的研究團隊提出：訓練不僅是做題，更要復盤、溫習、內化。他們近期發(fā)布了題為《ExGRPO:

ExGRPO 2025-11-14

相關標簽換一批

最新活動更多 >

12月15日
立即申請試用>> 【免費試用】金升陽助力機器人行業(yè)電源國產化
深圳專場
立即報名 >> 12月16-17日 AMD 嵌入式峰會
12月19日
預約直播> OFweek 2025鋰電池“零缺陷”生產技術在線峰會
12月19日
立即報名>> 【線下會議】OFweek 2025（第十屆）物聯網產業(yè)大會
即日-12.25
點擊申報>> 維科杯·OFweek 2025（第四屆）儲能行業(yè)年度評選
即日-12.26
立即參評>> 2025維科杯第八屆鋰電行業(yè)年度評選

最新招聘更多

電氣工程師（PLC硬件設計及軟件調試方向）深圳裕同互感智能科技有限公司
機械工程師廣州黑格智造信息科技有限公司
研發(fā)工程類蘇州長光華芯光電技術股份有限公司
FPGA工程師易思維（杭州）科技股份有限公司
PSC總監(jiān) 濟南新天科技有限公司
嵌入式軟件工程師西安星源博銳新能源技術有限公司
硬件工程師（變頻）深圳市深藍電子股份有限公司
亞馬遜運營（多站點）深圳綠米聯創(chuàng)科技有限公司
軟件開發(fā)工程師艾德克斯電子（南京）有限公司
激光技術項目總監(jiān) 嘉興艾可鐳光電科技有限公司

維科號我要發(fā)文 >

光器件，誰是成長最快企業(yè)？

混戰(zhàn)之中的電商，急需回歸零售本質 | 巨潮

北京不造機器人，北京在造神

谷歌與XREAL聯合發(fā)布Project Aura，最強AI深度集成，明年上市

粵公網安備 44030502002758號