分享到: | 更多 |
美国国防高级研究计划局正试图通过“大码”(big code)项目建设,让大数据分析迈上一个新台阶。“大码”项目旨在通过驱动大数据软件的大规模数据贮存器,从而提高整个软件的可靠性。
目前,国家关键基础设施大部分操作已经实现了自动化,提高软件可靠性的需求日益增长。随着网络规模不断扩大,在程序执行过程中,时不时会引发软件错误,造成网络故障和安全漏洞。
“大码”项目的正式名称为“挖掘与理解软件包”(MUSE),利用软件分析和大数据分析,以提高软件构建、调试和验证方式。
项目经理苏雷什·贾甘纳坦在一份声明中表示,“‘大码’项目的目标是运用大数据分析的方法,对数千亿开源代码行进行识别和解释,从而得出不同软件在发展中常见的深度共性。”
贾甘纳坦表示,“‘挖掘与理解软件包’项目将软件程序的细节作为一个数据集,其目标是探索新的软件包关系,以利用‘大码’建立更好更强大的软件。”
该研究机构的信息技术创新办公室补充,他们正在寻求改变软件编写和维护的方式。“挖掘与理解软件包”将取代传统的“测试—调试—验证”周期,采取实时模式进行程序分析、挖掘、检查和探索。
“挖掘与理解软件包”方法也将创造一个社区基础设施,围绕国防高级研究计划局已有的“规范挖掘引擎”来打造。该引擎将试图以“深度程序分析”方法和大数据分析理念为关键支撑,构建一个包含推理软件程序特性、行为和漏洞的数据库。
“大码”项目将有可能在军事和商业中广泛应用。国防高级研究计划局创建的ARPA网,就是互联网的先驱广域网。
项目官员表示,他们希望“通过这个项目所积累的集体知识,将有助于促进软件可靠性的新机制形成,并有助于开发自动构建和修复复杂软件的新方法”。
美国国防高级研究计划局的邀约专家表示,预计将把5个不同的“大码”研究领域写进合同:软件的完整性评估、人工制品发动机、挖掘引擎、分析和基础设施。这个项目将分为3个阶段,并将在每个阶段结束时举办一系列的示范专题研讨会,旨在反映出“大码”总量在数量级上的增长,同时通过数据分析和分析可扩展性显示研究进度。
(作者单位:南京政治学院)