来认识一下Devin,他是人工智能领域的突破性发展,被誉为世界上第一位完全自主的人工智能软件工程师。这不仅仅是任何人工智能;Devin被设计为一个高效、不知疲倦的队友,能够与人类工程师合作或独立处理审查任务。是什么让德文与众不同?它具有专注于复杂工程问题的卓越能力,使人类工程师能够将时间分配给更有趣的挑战和雄心勃勃的项目。

CognitionLabsDevinAI软件工程师详细介绍

“凭借我们在长期推理和规划方面的进步,Devin可以规划和执行需要数千个决策的复杂工程任务。Devin可以回忆起每一步的相关背景,随着时间的推移学习并纠正错误。”–认知实验室。

德文人工智能能力

德文可以学习如何使用不熟悉的技术。

阅读博客文章后,Devin在Modal上运行ControlNet,为Sara生成带有隐藏消息的图像。

Devin可以端到端地构建和部署应用程序。

Devin制作了一个模拟生命游戏的互动网站!它逐步添加用户请求的功能,然后将应用程序部署到Netlify。

Devin可以自主查找并修复代码库中的错误。

Devin帮助开发人员维护和调试他的开源竞争性编程书籍。

Devin可以训练和微调自己的。

‍Devin仅给出GitHub上研究存储库的链接,即可对大型语言模型进行微调。

Devin可以解决开源存储库中的错误和功能请求。只需提供GitHub问题的链接,Devin即可完成所需的所有设置和上下文收集。

Devin可以为成熟的生产存储库做出贡献。Devin

解决了sympyPython代数系统中对数计算的错误。Devin设置代码环境,重现错误,并自行编码和测试修复。

认知实验室还在Upwork上为Devin提供了真正的工作,它也可以做到这些!

在下面的演示中,Devin编写并调试代码来运行计算机视觉模型。Devin对结果数据进行采样并最后编写报告。

Devin的熟练程度源于人工智能领域的重大进步,特别是在长期推理和规划领域。这使得Devin能够承担和执行复杂的工程任务,这些任务需要数千个决策,在每个时刻回忆相关上下文,逐步学习并自主纠正错误。此外,Devin还配备了一套开发人员工具(例如shell、代码编辑器和浏览器),所有这些都位于安全的计算环境中-镜像了人类同行的工具包。

此外,Devin的亮点还在于其与用户积极协作的能力。它让您实时了解其进展情况,纳入反馈,并在必要时参与设计决策。这种交互和协作水平在人工智能工具中是前所未有的,标志着向真正的交互式人工智能迈出了一大步。

此外,德文的能力超出了理论应用范围。它已成功应用于Upwork等平台上的实际工作,展示了其在劳动力中的实际效用。

Devin的性能突破

Devin的有效性在SWE-bench上进行了测试,这是一个要求严格的基准,涉及解决Django和scikit-learn等项目中的实际GitHub问题。令人印象深刻的是,Devin端到端解决了其中13.86%的问题,与之前1.96%的最佳水平相比有了显着飞跃。这种在没有帮助的情况下实现的性能与其他模型的结果形成鲜明对比,即使它们提供了特定的文件进行编辑。

认知:德文背后的力量

Cognition是一家专注于推理的应用人工智能实验室,是Devin背后的创新力量。该公司的目标是通过解决复杂的推理挑战,创造出远远超越现有人工智能工具能力的人工智能队友。Cognition的愿景超越了编码,旨在释放不同学科的新可能性,帮助世界各地的人们将他们的想法变成现实。凭借坚实的后盾,包括由FoundersFund牵头的2100万美元A轮融资以及行业领导者的支持,Cognition处于人工智能研究和开发的前沿。

如果您对Devin为软件工程的未来所带来的可能性感兴趣,请继续关注Cognition的更详细的技术报告。当我们进入一个人工智能以更加实质性和协作的方式与人类合作的时代时,德文成为人工智能为我们的世界带来变革潜力的灯塔。要了解有关令人惊叹的DevinAI软件工程师的更多信息,请访问认知实验室官方网站。