Devin的厉害之处,还在于可以规划和执行异常复杂的工程任务,这类任务通常需要数千个决策才能完成。在这之中,无论进行到任何一步,它都可以回调所有相关的上下文信息,保证任务的逻辑性,也便于随时校正。
譬如,当工程师需要设计一个网页游戏时,Devin首先能生成网页,接着还能完成服务端的部署,最后直接发布上线,省去了中间大量人工操作。甚至在发现漏洞之后,Devin还会回溯报错出现的位置及对应的数据,然后分析原因并给出解决方案。
在SWE-bench基准测试中,Devin的表现远超Claude 2、Llama、GPT-4等选手,能够完整正确地处理13.86%的问题。相较之下,GPT-4只能处理1.74%的问题。更重要的是,Devin在测试中没有得到任何帮助,而其他所有模型都需要帮助,即人们要准确告知模型需要编辑哪些文件。
海角社区吃瓜在线新京报讯(记者 张静姝)3月14日,新京报记者从北京市公安局房山分局获悉一起非法出售发票案件。2019年至2023年间,房山某餐厅工作人员李某、董某、丁某、徐某4人在樊某没有实际消费的情况下,以从中获得7%-10%的好处费为前提,向樊某出售餐厅发票,4人分别获利5万余元、16万余元、7万余元、11万余元。 2023年11月,李某、董某、丁某、徐某因非法出售发票罪被房山公安分局刑事拘留。近日,根据法院判决,涉案4人被判处有期徒刑八个月、缓刑一年至拘役六个月、缓刑六个月不等的刑罚。 警方表示,日常生活中,大家都知道买卖假发票犯法,但非法出售真实普通发票的行为,同样是公安机关依法打击的犯罪行为。 警方提示,涉税犯罪是民营企业经营过程中的常见高发犯罪,企业经营者要不断加强对员工的法治教育,规范发票的开具流程,依法依规为消费者开具发票。企业工作人员要学法懂法、爱岗敬业,自觉遵守企业规章制度,避免为了蝇头小利而误入歧途。消费者到商户消费后应主动要求商家开具发票或收据,商家拒不开票的,消费者可以向税务机关举报。编辑 彭冲 校对 杨许丽按照用户需求,Devin可以同时执行多步骤工作流程,人类工程师则可以实时观察其进度,发现错误时,跳出指令进行修正。这便于工程师们将大部分工作“外包”给AI,自己则可以潜心于创意性工作。
此外,作为一个AI全能助手,Devin还可以帮助人类训练和微调其他AI。对于一些常见的模型,你只需要提及模型的名称,Devin自己就知道要怎样去训练。
这一进展,标志着AI在自主理解和解决软件开发问题方面取得了显著进步。目前,Devin已经成功通过一家AI公司面试,并且在Upwork上完成了实际工作。
Devin的出现,可能对软件开发行业产生深远影响,甚至可能减少对人类开发者的需求。但须注意到,该技术仍处于早期阶段,其成熟度和效果需要业界作进一步评估。
Devin现处于内测阶段,有意用户可申请提前试用。目前,团队尚未透露更多核心技术细节,但他们表示,Devin源于其长期推理及规划研究的进展。编码只是第一步,这一AI助手其实可推广到更宽领域。
初创公司Cognition虽然只有十名员工,但他们手中却握着十块IOI(国际信息学奥林匹克竞赛)金牌,核心创始团队为3名华人。
网友评论更多
80 德令哈m
让高能耗建筑变“绿”!海尔智慧楼宇在华南掀起节能风暴🎚🎛
2025-06-17 02:37:43 推荐
187****6927 回复 184****7334 :618洗烘升级如何选?认准海尔云溪洗烘套装🎞 来自玉树
187****1916 回复 184****5309 :“AI大神”戴文渊谈AI进化隐忧:利用技术搞破坏,是眼前最大的风险🎟 来自茫崖
157****2936 :按最下面的历史版本🎠🎡 来自拉萨
46 日喀则821
6月,催化很足的一条主线🎢🎣
2025-06-15 13:58:07 推荐
永久VIP :造成医保基金损失!百亿连锁药店一心堂遭约谈,公司紧急回应🎤 来自昌都
158****1773 :第四范式戴文渊:人类理性边界没有突破前,AI没有自主意识🎥 来自林芝
158****2170 回复 666🎦 :“AI大神”戴文渊寄语00后:别走寻常路,要自我不要媚俗!🎧 来自山南
27 那曲sm
与时代共舞,周黑鸭(1458.HK)的"变"与"不变"🎨🎩
2025-06-17 17:09:35 不推荐
银川zj :外资重仓的出海大牛股🎪
186****7668 回复 159****3610 :FDIC报告:美国银行业一季度利润激增,但仍面临重大下行风险🎫