中国电信发布“复杂推理大模型”,数学基准评测超越GPT-4o
创始人
2026-03-18 16:10:45
1月25日消息,中国电信人工智能研究院(TeleAI)“复杂推理大模型”TeleAI-t1-preview近日正式发布。TeleAI-t1-preview使用了强化学习训练方法,通过引入探索、反思等思考范式,大幅提升模型在数学推导、逻辑推理等复杂问题的准确性。在美国数学竞赛AIME 2024、MATH500两项权威数学基准评测中,TeleAI-t1-preview分别以60和93.8分的成绩,大幅超越OpenAI o1-preview、GPT-4o等标杆模型。在研究生级别问答测试GPQA Diamond中,TeleAI-t1-preview得分超过 GPT-4o,并比肩Claude 3.5 Sonnet的性能水准。

相关内容

热门资讯

中央气象台1月25日18时继续... 1月25日消息,中央气象台1月25日18时继续发布寒潮黄色预警:受寒潮影响,1月25日夜间至27日,...
春运第12日,全社会跨区域人员... 1月25日消息,从2025年综合运输春运工作专班了解到,2025年1月25日(春运第12日,农历腊月...
中国电信发布“复杂推理大模型”... 1月25日消息,中国电信人工智能研究院(TeleAI)“复杂推理大模型”TeleAI-t1-prev...
刘庆峰:科大讯飞将做全栈自主可... 1月25日消息,科大讯飞董事长刘庆峰在公司年会上明确讯飞星火大模型的战略生态位:坚持自主可控、面向民...
中通客车换帅完成工商变更,王兴... 1月25日消息,1月24日,中通客车(000957)发生工商变更,胡海华卸任法定代表人、董事长,由王...