公司动态

天堂的手工艺品不仅可以做事,还可以解决错误

400多年前,歌曲Yingxing写了“天堂的东西”。这是为工匠和未来写的书。它使人们相信技术并没有死,而是人们继续与世界互动的一种方式。如果“天气”代表了古代中国对“工程”和“制造”的最终理解,那么今天,一个名为“天冈”的经纪人(即Skywork)试图将这种精神继承在另一个王国(CodeWorld)(CodeWorld)。这个Skywork是独立的代码代理模型,而不是铁铸铁工具。您需要修复的是最新且复杂的人工系统。 (开源)软件工程。它没有维护锤子,而是基于多个交互,对长上下文的理解和逻辑推理,以识别问题/错误,找到原因,修补并查看它们是否确实在数千个GitHub项目中解决了。您可以用那个名字来获得Skywork-Swe。 (注意:SWE是指软件工程/软件工程g)。 Skywork-Swe为什么出生?在古代世界中发现了软件智能面临的困难。培养破裂的三脚架并修复织物,反映了“工匠的精神”。如今,最常见的“破坏”是代码。如今,代码系统长期以来一直是现代文明的骨骼。他们还支持执行并取决于各种系统的AI算法,例如每日软件,银行服务和流量编程。但是,即使是最精致的程序,例如古代文物,也不可避免地会导致错误:有些是逻辑错误,有些是环境变化,有些是由于无法控制的。例如,就在几天前,AWS,Google Cloud,Azure,Cloudflare被中断,诸如Chatgpt和Cursor之类的流行应用程序暂时丢失了。这次事故的原因是Google的API管理系统由于自动配额的不正确更新而失败。同时,错误修改也是最基本的之一,但它们也是最复杂的任务之一,并且需要软件工程中的劳动力。错误更正并不像找到一条印刷错误的线那样容易,尤其是在实际的GitHub项目中。在许多情况下,您必须:阅读和理解数百个文件。估计不同模块中变量的流途径。阅读我们的前辈留下的维修记录和讨论。了解上下文,猜测意图并创建代码补丁。最后,您将不得不运行几次,看看它是否真的“解决”。那么我可以使用AI代理执行这些任务吗?当然!但是,我们需要的不是传统的AI编程模型来解决单个编程任务,而是具有了解历史环境,实施多个推理的能力,做出混乱的决策和不确定性的能力的软件工程代理商,并实施并在该领域中以人类开发人员的身份执行它们。出现问题。这类任务缺乏高质量的培训数据。根据当前的市场数字集,验证机制不足或训练样本是无序的,这使得很难支持真正的工程模型的演变。此外,这些数据集通常很小,这使得数据量表方法的适用性尚不清楚。正是关于应对这一挑战的正是Kunlun Wanwei推出了自主代码代理模型SkyWork-SWE。它不仅代表了具有出色性能的模型,而且是一个完整的系统,该模型整合了数据,验证,推理和维修,以及最强大的开源软件工程代理在32B参数级别。不仅如此,他们成功地基于此发现了LLM软件工程功能的规模方法。目前,该模型的技术报告和模型的重量都已发布。