昨晚,国内大型模型平台DeepSeek正式推出了其全新的推理模型——DeepSeek-R1-Lite预览版。
这款模型的最大亮点在于其深度思维链推理能力,尤其擅长处理数学、代码以及各类复杂推理任务。它能够生成长达数万字的推理流程,让用户能够深入了解模型生成内容的每一步。
举个例子,就连GPT-4o等顶尖模型在“9.11和9.9哪个更大”这样的简单问题上也会出错,但R1却能通过其超长思维链推理轻松解决这一问题。
在性能表现上,R1在美国数学邀请赛AIME2024、MATH和Codeforces的测试数据中分别取得了52.5、91.6和1450的优异成绩,成功击败了OpenAI的o1预览版。此外,DeepSeek还计划很快发布R1的开源模型和API。
R1的发布在国际上引起了广泛关注,并获得了大量国外网友的赞誉。有网友表示,DeepSeek发布的R1将成为OpenAI的强大竞争对手,迫使OpenAI尽快发布o1的满血版。
许多网友对R1的推理能力表示震惊和敬佩。有人认为,R1在处理推理任务时的表现已经达到了高级博士水平,甚至在某些情况下超越了o1-preview。还有人表示,能够看到R1的思维推理过程真是太棒了,这对于开放式AI研究来说是一个重大突破。
值得一提的是,R1目前每天免费提供50次深度思维链推理服务,这对于普通用户来说已经足够满足日常需求。不少网友已经迫不及待想要尝试这款强大的推理模型,并期待DeepSeek能够尽快发布其API接口。
此外,还有网友分享了R1的测试视频,展示了R1在长达100多秒的“思考”过程中生成了超过7500个连贯的tokens。这一表现无疑进一步证明了R1在推理能力上的卓越表现。
虽然目前DeepSeek还没有公开R1的论文,但用户已经可以在线免费体验这款模型了。对于不是专门从事科研或编程开发的用户来说,每天50次的免费深度思维推理服务已经足够满足他们的需求。
「AIGC开放社区」也体验了R1的推理流程,并对其强大的推理能力和透明化表示赞赏。他们通过对比测试发现,R1在回答“9.11和9.9哪个更大”的问题时表现优于GPT-4o mini等模型。
总的来说,DeepSeek-R1-Lite预览版的发布标志着国内AI模型在推理能力上取得了重要突破。随着开源模型和API的发布以及更多用户的尝试和使用,我们有理由相信R1将在未来为AI行业带来更多的惊喜和变革。